第五章 平均數檢定:多組樣本
Key words 變異數分析 整體型一錯誤機率 變異數分析表 組內變異、組間變異、組間離均差平方和、組內離 均差平方和、組間均方、組內均方 多重比較、事後檢定 Bonferroni 多重比較檢定 Kruskal-Wallis 檢定
在前章中我們已經討論如何檢定兩個母體平均數或 中位數是否有差異的問題,資料有二組樣本 (例如 死亡組、存活組)。然而,很多研究會進行三個以 上母體平均數差異的比較(例如 死亡組、嚴重組、 正常組) ,本章將介紹三組以上母體平均數(或母 體分佈)比較之統計檢定。
以下案例是關於配方奶添加 DHA 是否可以提升嬰兒視力敏 銳度和認知能力的研究:研究者招募了超過100位剛出生的 嬰兒,將他們分成四組,每一組在配方奶裡添加不同濃度的 DHA脂肪酸,各為 0%(對照組)0.32%、0.64%、或0.96% 的DHA。服用配方奶的時間為12個月,然後在出生滿18個月 的時候,嬰兒接受眼力和智力的測驗。 問題: 1. 在配方奶裡添加不同濃度的DHA脂肪酸的四組嬰兒,其視力與認知 能力是否有差異。 2. 如果有差異,究竟要添加多少濃度的DHA脂肪酸才能提昇幼兒的眼 力和認知能力。
雖然我們也可以用前章所介紹的兩個母體平均數(中位 數)差異檢定方法來進行分析,然而這種倆倆互相比較 的檢定方式共有6種比較,會導致整體型一錯誤機率 (family-wise type I error rate)比我們設定的顯著水準 膨脹很多,我們結論的可靠性便會大打折扣。 以本例來說我們有四組需要互相比較其平均差異,共要 進行六次檢定,假設檢定統計均獨立且每次檢定的顯著 水準皆為α=0.05,則虛無假設成立時,六次檢定皆正確 不犯型一錯誤的機率為(0.95)6=0.735,而至少犯一次型 一錯誤的機率高達1-0.735=0.265之多。
對於檢測三組或三組以上獨立之母群體平均數差異, 且要控制整體型一錯誤機率在顯著水準α 以內,最 恰當的檢定方式為變異數分析(Analysis of Variance, ANOVA)方法。 假設有一研究欲驗證 k 組的母群體平均數是否有差 異,所以虛無假設為「各組母群體平均數完全相 同」,即 其對立假設為 k 組間的母群體平均數不完全相同。
假如無法拒絕虛無假設,則”沒證據”證實 k 組的母 群體平均數是有差異;若拒絕虛無假設,則須再進 一步探究這 k 組的母群體平均數差異的情形,我們 稱為事後檢定(post-hoc test)。 變異數分析主要的概念是將資料的總變異(total variation)分離成兩個部分: 組內變異(within - group variation)及組間變異(between-group variation)。
變異數分析之前提假設: k 組母群體均為常態分佈,且各組變異數相同。 k 組中的觀察值為彼此獨立,不相互影響。 其檢定統計量為: 總樣本數為 n=n1+…+nk; 為總平均數,組間變異 SSB為組間離均差平方和(between group sum of squares):
組內變異SSW為組內離均差平方和(within group sum of squares); 即各組樣本變異數 的加權(總和, 組間變異及組內變異,兩者合為總變異量(total sum of squares,SST),SST = SSB + SSW。 SSB 與 SSW各自除以自由度(組間自由度為組數k - 1; 組內自由度為n - k),所得MSB為組間均方(between group mean square)與MSW為組內均方(within group mean square)。
在前提假設成立下及虛無假設H0成立下, p值= 愈小,表示平均數不相等的機會愈 高,我們說 “資料顯示各組之平均數在統計上有顯著 的差異”。
變異數分析表的建立 變異來源 平方和 自由度 均方 F統計量 p值 組間變異 SSB k-1 MSB=SSB/(k-1) F=MSB/MSW 計算右尾機率 組內變異 SSW n-k MSW=SSW/(n-k) 總變異 SST n-1 以下使用範例是有關於補充抗壞血酸的癌症治療研究,樣本為患有胃、支氣管、結腸、卵巢及乳房的晚期癌症患者採用抗壞血酸療法,該研究的目的是想了解是否感染癌症的器官不同會影響其存活時間?存活時間資料之描述性統計如下:
表5-1. 樣本敘述統計量 變數名稱 Variable 分組變數 Organ 樣本數 Count 平均數 Mean 中位數 Median 最小值 Minimum 最大值 Maximum 標準差 Std. dev. Survival Breast 11 1395.9091 1166 24 3808 1238.9667 Bronchus 17 211.5882 155 20 859 209.8586 Colon 457.4118 372 1843 427.1686 Ovary 6 884.3333 406 89 2970 1098.5788 Stomach 13 286 124 25 1112 346.3096 不分組(Total) 64 558.625 265.5 776.4787
表5-2. 變異數分析表 表5-2.為變異數分析檢定結果,顯著水準為0.05時,我們有充份證據顯示五組之平均存活天數有顯著差異。 來源 source 平方和 sum of squares 自由度 d.f. 均方 mean square F檢定統計量 F-statistics p-值 p-value 處理 treatment 11535761 4 2883940 6.4334 0.00022945 *** 誤差 error 26448144 59 448273.6 總和 total 37983905 63 表5-2.為變異數分析檢定結果,顯著水準為0.05時,我們有充份證據顯示五組之平均存活天數有顯著差異。
從圖5-1.的盒鬚圖中可明顯發現並非所有組別之平均 存活時間皆有差異,因此,接下來我們可以利用事後 多重比較的方法(Post-hoc test)再進一步檢定到底是 哪幾組的平均值有差異?
R-web: 分析方法平均數檢定(獨立)多樣本(或稱變異 數分析)資料匯入資料型態設定:一檢定變數一 分組變數參數設定:選擇要進行分析的變數(檢定 變數:Survival,分組變數:Organ)進階選項(1. 設定顯著水準 α:2. 顯示樣本敘述統計量)開始分 析分析結果
事後檢定(post-hoc test)或多重比較(multiple tests) 當變異數分析的F檢定值達顯著水準時,即拒絕各 組平均數相等的虛無假設,亦表示至少有兩組平均 數之間有顯著差異存在,因此需檢驗兩兩個別平均 數間是否 存在顯著差異,此時我們即進行了多重比 較(multiple comparisons)之檢定。 在此我們介紹常用的事後檢定方式, 這些方法都確 定整體多重檢定之型一誤差機率不大於α。
Bonferroni 法 此法為多重比較中常見的方法,所用的方法類似前 章所述之獨立樣本 t 檢定,每兩組進行平均數是否 相等的檢定。 假若有 k 組資料,則需進行共 次的假設檢 定,為使整體犯型一錯誤機率能維持在設定的顯著 水準 α 以內,則必須調整每個個別檢定的顯著水準 為
虛無假設:第 i 組與第 j 組平均存活天數無差異 (H0: ) 對立假設:第 i 組與第 j 組平均存活天數有差異 (Ha: ) 則多重檢定統計量 t 與雙樣本平均數檢定相似,僅 差異在母體變異數的估計是以全部 k 組資料為基礎 的變異數估計量 MSW:
表5-3. Bonferroni 多重比較檢定結果 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper Breast - Bronchus 1184.3209 428.7367 1939.905 0.0003 Breast - Colon 938.4973 182.9132 1694.0815 0.0061 Bronchus - Colon -245.8235 -915.5773 423.9302 1 Breast - Ovary 511.5758 -479.4321 1502.5836 Bronchus - Ovary -672.7451 -1599.9772 254.487 0.3857 Colon - Ovary -426.9216 -1354.1537 500.3105 Breast - Stomach 1109.9091 309.9602 1909.8579 0.0015 Bronchus - Stomach -74.4118 -793.8427 645.0192 Colon - Stomach 171.4118 -548.0192 890.8427 Ovary - Stomach 598.3333 -365.3939 1562.0605 0.7528 顯著水準為0.05時,我們有充份證據顯示乳癌與胃癌、支氣管癌及結腸癌三組間之平均存活天數有顯著差異,而且乳癌患者平均存活天數顯著高於胃癌、支氣管癌及結腸癌患者。
無母數方法 Kruskal-Wallis test(K-W test) 假如資料分布不為常態或各組變異數不全相同時,則會 考慮以無母數檢定方式來分析,無母數檢定方式不需要 對資料的分佈做任何假設,如同在獨立雙樣本之中位數 檢定中使用威爾考森等級和檢定(Wilcoxon rank-sum test),在多組樣本變異數分析對應的無母數分析為 Kruskal-Wallis 檢定,可檢定多組母群體中位數是否完 全相等的假設。 虛無假設(H0):各組母群體中位數完全相同 對立假設(Ha):k 組間的母群體中位數不完全相同
先將各組樣本混合並作排序後,依數值由小排到大 並標記序位(rank),再將序位分數放回原各組內, 計算各組序位總和及序位平均,再藉由各組樣本數 換算成檢定統計量 H: 使用K-W 檢定唯一的限制是各組樣本數至少要 5 以 上。
虛無假設:各母體的中位數相同 H0:m1 = ... = m5 表5-4. 多樣本中位數差異檢定 虛無假設:各母體的中位數相同 H0:m1 = ... = m5 變數名稱 variable K-W卡方檢定統計量 Kruskal-Wallis chi-square statistics 自由度 d.f. 臨界值 Χ2(d.f.,1-α) p-值II p-value Survival 14.9539 4 9.4877 0.0047979 ** 顯著水準為0.05時,我們有充份證據顯示五組之平 均存活天數有顯著差異。
R-web: 分析方法無母數方法中位數檢定 (獨立)多樣 本(Kruskal-Wallis檢定)資料匯入資料型態設定: 一檢定變數一分組變數或兩獨立樣本參數設定:選 擇要進行分析的變數(檢定變數:Survival, 分組變 數:Organ) 開始分析分析結果。
作業 衛生福利部食品藥物管理署欲瞭解A、B、C三種品 牌嬰兒配方奶及親授母乳,在餵食初生嬰兒一周後 體重增加的情形是否有差異,故以完全隨機方式抽 出26位新生兒分別試用三種配方奶及親授母乳,並 記錄其一周後體重增加(單位:公斤,kg)的情形, 資料如下表所示: 母乳 1.21 1.19 1.17 1.23 1.29 1.14 配方奶-A 1.34 1.41 1.38 1.36 1.42 1.37 1.32 配方奶-B 1.45 1.51 1.39 1.44 配方奶-C 1.31 1.28 1.35 1.27
欲比較A、B、C三種品牌配方奶及親授母乳對新生嬰 兒增重的影響是否有差異,請列出虛無假設及對立假 設。 請製作變異數分析表(ANOVA table),並以顯著水 準α = 0.05檢定三種配方奶及親授母乳是否影響新生 嬰兒體重增加情形? 請以無母數方法(Kruskal-Wallis test)及顯著水準 α = 0.05檢定三種配方奶及親授母乳是否影響新生嬰 兒體重增加情形? 如果2.或3.結論是有顯著差異,試在顯著水準α = 0.05下,利用Bonferroni多重比較方法來分別一對一 檢定三種品牌配方奶及親授母乳對新生嬰兒增重的影 響是否相同?
The End