Chapter 3 相關與變異數分析
變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數 多變量分析—管理上的應用
相關分析 應用時機 統計模型 相關分析主要是用於判定多個變數之間是否有線性關係,以及這種關係的方向和程度,特別適用於變數皆為屬量變數的情況 多變量分析—管理上的應用
相關分析 結果解讀 相關係數可以告訴我們兩件事:(1)相關的方向;(2)相關的程度 相關分析只能判定兩變數間是否有「線性相關性」、「相關的程度和方向」,但不能判定變數之間是否有「因果關係」和「非線性關係」 相關係數的數值 若r=1,則x,y變數為完全符合正比的直線相關 若r=0,則x,y變數完全無線性關係 若r=-1,則x,y變數為完全符合反比的直線相關 多變量分析—管理上的應用
實例與應用3-1 相關係數矩陣(correlation matrix) 經濟、統計和會計成績之間都是正相關,表示以整體而言,成績好的學生在各科表現不會有太大的落差 經濟和統計相關的程度略高於經濟和會計相關的程度,表示經濟、統計所需具備的能力是比較相近的(可能是理解能力或計算能力) 統計和會計的相關性最低,顯然這兩科所要求的能力有很大的差異 多變量分析—管理上的應用
變異數分析原理 變異數分析的定義 變異數分析(Analysis of Variance,簡稱ANOVA)是將屬量樣本資料的變異,依其可能來源拆解(例如,組內變異和組間變異),並檢定因子中各類或群(通常稱為「處理」)的平均數是否相等,以判斷因子和母體屬量變數之間的關係 應用時機 探討用來分類或分群的屬質變數(在變異數分析中稱為「因子」)和一個屬量變數之間的關係時,常常會運用變異數分析方法 多變量分析—管理上的應用
變異數分析原理 因子-集區和處理 變異數分析的數學模式 固定效果與隨機效果 觀察因子相當於「集區」,是不能加以控制或隨意給定的 實驗因子相當於「處理」,是我們能夠加以控制或指派的 變異數分析的數學模式 固定效果與隨機效果 固定效果模式:在上式中,若βj是未知常數,則此變異數分析模式為固定效果模式。固定效果模式是指在因子中的處理或集區,在重新進行實驗時,不會有所改變 隨機效果模式:如果βj是隨機變數,則此變異數分析模式為隨機效果模式;隨機效應模式,是指在重複實驗時,每一次處理的組合都可能不相同 多變量分析—管理上的應用
單因子變異數分析 應用時機 統計模型 固定效果、單因子變異數分析的假設前提 單因子變異數分析是要判定某一個應變數是否和另一個含有k種處理的自變數相關 適用於k組具有相同變異數的常態分配平均數的比較,或是經由完全隨機實驗設計(completely randomized design)試驗所得觀測值的分析 統計模型 固定效果、單因子變異數分析的假設前提 εij相互獨立、為常態分配、平均數為0、且有相同的變異數,εij ~N(0, σ2) Yij相互獨立、為常態分配、平均數為μi、且各分群之變異數相等,Yij ~N(μi, σ2) 檢定H0:μ1=μ2=…=μk=μ,或H0:α1=α2=…=αk=0 多變量分析—管理上的應用
單因子變異數分析 結果解讀 單因子變異數分析表 多變量分析—管理上的應用
單因子變異數分析 結果解讀 變異數是否相等之檢定 Bartlett test:由k組分群母體隨機抽取ni個樣本,總樣本數,計算各組樣本變異數及總樣本變異數 多變量分析—管理上的應用
二因子變異數分析 應用時機 統計模型 當我們想研究二個自變數和一個應變數的關係時,就必須要利用二因子變異數分析,才能得知其各別影響和交互作用 利用隨機集區設計(randomized block design)的方法,在每個集區中隨機抽取k個樣本,再將這些樣本隨機指定到k個處理中,再進行每組樣本數為1的二因子變異數分析,可大幅縮減樣本數。這樣的作法一般稱為一因子集區變異數分析,基本上也等同於二因子未重複試驗變異數分析 統計模型 上式中,假設在A因子中有a種處理,則i表示第i種處理;而在B因子中有b種處理,則j表示第j種處理 檢定假設: HA:α1=α2=…=αk=0以及HB:β1=β2=…=βk=0 多變量分析—管理上的應用
二因子變異數分析 結果解讀(1) 假設有A、B二個因子,其處理數分別為a、b,每一種處理只抽取1個樣本時(此即為二因子未重複試驗的情況),其資料結構如下: 多變量分析—管理上的應用
二因子變異數分析 結果解讀(2) ANOVA表 多變量分析—管理上的應用
實例與應用3-2 F test 檢定統計量F小於臨界值(α = 0.05)、p值大於0.05,在顯著水準0.05之下,二母體變異數相等,符合變異數分析的基本假設 多變量分析—管理上的應用
實例與應用3-2 ANOVA F 值大於臨界值( = 0.05),p 值小於0.05,因此拒絕二母體平均數相等的假設,即認定ROE和產業是有關的,而在此例中,電子業的股東權益報酬率高於石化業,因此,根據此結果,我們在投資時以選擇電子業較佳 多變量分析—管理上的應用