統計學: 應用與進階 第14 章: 變異數分析
變異數分析的基本觀念 單因子變異數分析 平方和 均方 檢定虛無假設 變異數分析表
基本觀念 變異數分析簡稱ANOVA, 其名稱為來自ANalysis Of VAriance 由著名的統計學家Sir Ronald A. Fisher(1890-1962) 所發展出來 在其著作中, 以變異數分析研究不同的肥料對於作物收成的影響 參閱David Salsburg 所著“The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century.” 中譯本為“統計, 改變了世界,” 天下文化出版
基本觀念 變異數分析的研究目的在於檢定母體均數是否顯著不同 如果只比較兩組均數, 則變異數分析所得到的結果與假設檢定中, 檢定μ1 = μ2 時的t 檢定所得到的結果相同。 一般來說, 變異數分析所欲檢定的是, 多組(兩組以上) 母體均數是否顯著不同
基本觀念 舉例來說, 假設有m 種不同教學方式可以使用。令Xi 代表使用第i 教學方式後, 學生的統計學成績。假設: 檢定不同教學方式是否會造成不同的平均成績: H0 : μ1 = μ2 = · · · = μm H1 : H0 不為真
基本觀念 何不兩兩進行t 檢定, 看看是否μ1 = μ2, μ1 = μ3 . . .? 這樣的作法有兩大問題 分析的原因
基本觀念 既然檢定的是「均數」, 為什麼不叫「均數分析」,而是叫做「變異數分析」? 所謂的變異數分析, 就是將一組資料的總變動量(total variation), 依可能造成變動的因素(factor) 分解成不同的部分, 並據以檢定特定因素是否能解釋資料的變動。例如, 不同的肥料(因素) 對於作物收成變動的影響。 而在分解不同變動量的過程中, 剛好提供我們檢定一群μ 是否相等的機會
單因子變異數分析(one-factor ANOVA) 如果我們只考慮一種因素對於資料變動的影響,就稱為單因子變異數分析
完全隨機設計(completely randomized design) 探討不同因素對於資料變動的影響時, 是以完全隨機的方式給與不同的處方(treatment) 舉例來說, 如果我想了解兩種不同的教學方式對於學生成績之影響, 在試驗中, 我們必須對於任一個學生, 隨機選取一種教學方式來施教
ANOVA 基本假設 假設有m 群母體, 由每一母體中抽出樣本數分別為 的獨立隨機樣本 令 為總樣本數 令 為總樣本數 設Yij 為第i 組中第j 個隨機樣本點, 如果以兩種不同的教學方式對於學生成績之影響為例, 則m = 2, 且Y15 代表了採用第1 種方法的第5個學生 假設各母體分配為常態分配, 具有不同的均數μi 與相同的變異σ²
ANOVA 假設 隨機抽樣且獨立 各母體分配為常態分配 相同的變異數 σ² Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 11-11
ANOVA 基本假設
單因子變異數分析 如果把母體1 到母體m 通通考慮進來, 形成一個大母體, 令μ代表該大母體的均數(grand mean), 我們可以將總變動量Yij − μ 分解成 總變動量 未解釋變動量 已解釋變動量
班上同學隨機分成兩群, 一群以填鴨背公式的方法學習統計, 另一群以直觀靈活的方法學習統計 你是第i 群中的第j 名學生, Yij =你的統計成績, μ =全班平均成績, μi = 第i 群的平均成績 你個人的成績與全班平均成績的差異(Yij − μ)可以分解成(1) 你個人的成績與你所屬群組平均成績的差異(Yij − μi ) 加上(2) 所屬群組平均成績與全班平均成績的差異(μi − μ)
μi − μ 代表了不同教學方式所造成的成績差異,乃是教學方式這個因子所能解釋的部份, 跟你同一群組的同學都得到一樣的教學方式, 因此, 你個人的成績與你所屬群組平均成績的差異(Yij − μi ) 就不是教學方式這個因子所能解釋,而是與你個人的用功程度, 運氣好壞等其他因素所影響, 因而稱之為未解釋變動量, 或是稱為因誤差(error) 所造成的變動
由於μi − μ 以及= Yij − μi 未知, 根據類比原則, 我們就以其樣本對應予以估計: 亦即, 其中, 稱之為組平均, 稱作總平均, 為總差異, 為組內差異, 而 為組間差異
平方和(sum of squares) 如果我們直接以組間差異 來分析因子的影響, 由於 的值或正或負, 加總後正負將會互抵。為了避免這種情況發生, 我們將各個差異平方後再加總, 得到其平方和 總平方和(total sum of squares, SST): 誤差平方和(sum of squares due to error, SSE): 因子平方和(sum of squares due to factor, SSF):
notations Response, Y Y Group 1 Group 2 Group 3
Among Group Variation Response, Y Y3 Y Y2 Y1 Group 1 Group 2 Group 3
With Group (Random) Variation Response, Y Y3 Y2 Y1 Group 1 Group 2 Group 3
重要性質 總平方和= 誤差平方和+ 因子平方和
ANOVA 實例
均方(mean squares) 為了檢定因子對於資料變動(總平方和) 的影響,一個可能的衡量準則為求出SSF/SST, 若因子平方和佔總平方和的比例高, 代表了因子對於資料變動具有顯著影響, 則我們可以拒絕因子對於資料變動無顯著影響(μ1 = μ2 = . . . = μm) 的虛無假設 然而, 使用SSF/SST 作為檢定的準則有個問題,那就是變動總和會隨樣本數增加而增加, 為了更精確地衡量因子變動和佔總變動的比例, 我們將進一步求算平方和的均數: 均方
nT − 1, nT − m 與m − 1 分別稱為SST, SSE與SSF 的自由度(degree of freedom) 均方 定義均方如下 總均方(total mean square, MST): MST = SST/(nT − 1) 誤差均方(mean square due to error, MSE) MSE = SSE/(nT − m) 因子均方(mean square due to factor, MSF) MSF = SSF/(m − 1) MST ≠ MSE + MSF nT − 1, nT − m 與m − 1 分別稱為SST, SSE與SSF 的自由度(degree of freedom)
均方的重要性質 當 為真時 若 不成立, 則 我們可以用 來檢定虛無假設是否成立
均方的重要性質 當虛無假設成立時, 當虛無假設不成立時, 亦即, 當至少有兩個μi 不等時, MSE 會高估 (overestimate) σ² 因此, 如果 的值太大時, 我們就拒絕虛無假設 這是一個右尾檢定(RTT)
檢定虛無假設 至於多大的 值叫做「太大」? 欲回答此問題, 我們必須知道, 的分配為何 在虛無假設 為真時
檢定虛無假設 因此, 虛無假設成立時, 檢定的統計量為 在顯著水準 α 下, 右尾檢定的臨界值為 拒絕虛無假設的拒絕域為: RR = {拒絕H0 當 }
變異數分析表(ANOVA Table)
ANOVA 實例
變異數分析表: 例子 若顯著水準為0.05, 則查F 分配表得知臨界值 F0.05(2, 7) = 19.353, 而F0 = 0.911 < 19.353, 因此,我 們無法拒絕μ1 = μ2 = μ3 的虛無假設
One-Way ANOVA F-Test Example As production manager, you want to see if three filling machines have different mean filling times. You assign 15 similarly trained and experienced workers, 5 per machine, to the machines. At the .05 level of significance, is there a difference in mean filling times? Mach1 Mach2 Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40
One-Way ANOVA F-Test Solution H0: Ha: = 1 = 2 = Critical Value(s): 1 = 2 = 3 Not All Equal .05 2 12 F 3.89 = .05
Summary Table Solution From Computer Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Machines) 3 - 1 = 2 47.1640 23.5820 25.60 Error 15 - 3 = 12 11.0532 .9211 Total 15 - 1 = 14 58.2172
One-Way ANOVA F-Test Solution Test Statistic: Decision: Conclusion: F MSF MSE 23 5820 9211 25.6 . Reject at = .05 There is evidence population means are different
One-Way ANOVA F-Test Thinking Challenge You’re a trainer for Microsoft Corp. Is there a difference in mean learning times of 12 people using 4 different training methods ( =.05)? M1 M2 M3 M4 10 11 13 18 9 16 8 23 5 9 9 25 Use the following table. © 1984-1994 T/Maker Co. You assign randomly 3 people to each method, making sure that they are similar in intelligence etc.
Summary Table Solution* Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Methods) 4 - 1 = 3 348 116 11.6 Error 12 - 4 = 8 80 10 Total 12 - 1 = 11 428
One-Way ANOVA F-Test Solution* 1 = 2 = 3 = 4 Not All Equal H0: Ha: = 1 = 2 = Critical Value(s): .05 3 8 4.07 = .05
One-Way ANOVA F-Test Solution* Test Statistic: Decision: Conclusion: F MSF MSE 116 10 11 6 . Reject at = .05 There is evidence population means are different
一因子隨機集區實驗設計
一因子變異數分析─隨機集區設計
一因子變異數分析─隨機集區設計
一因子變異數分析─隨機集區設計
一因子變異數分析─隨機集區設計
隨機集區實驗的ANOVA表
Randomized Block Design Example A production manager wants to see if three assembly methods have different mean assembly times (in minutes). Five employees were selected at random and assigned to use each assembly method. At the .05 level of significance, is there a difference in mean assembly times? Employee Method 1 Method 2 Method 3 1 5.4 3.6 4.0 2 4.1 3.8 2.9 3 6.1 5.6 4.3 4 3.6 2.3 2.6 5 5.3 4.7 3.4
Random Block Design F-Test Solution* 1,. = 2 ,. = 3 ,. Not all equal H0: Ha: = 1 = 2 = Critical Value(s): .05 2 8 F 4.46 = .05
Summary Table Solution* Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Methods) 3 - 1 = 2 5.43 2.71 12.9 Block (Employee) 5 - 1 = 4 10.69 2.67 12.7 Error 15 - 3 - 5 + 1 = 8 = 2*4 1.68 .21 Total 15 - 1 = 14 17.8
Random Block Design F-Test Solution* Test Statistic: Decision: Conclusion: F MSF MSE 2.71 .21 12.9 Reject at = .05 There is evidence population means are different
Random Block Design F-Test Solution* .,1 = ., 2 = ., 3 Not all equal H0: Ha: = 1 = 2 = Critical Value(s): .05 4 8 F 4.46 = .05
Random Block Design F-Test Solution* Test Statistic: Decision: Conclusion: F MSBK MSE 2.67 .21 12.7 Reject at = .05 There is evidence block means are different
四種教學法的學習效果
隨機集區實驗的ANOVA表