第五章 平均數檢定:多組樣本.

Slides:



Advertisements
Similar presentations
變異數分析 ANOVA Analysis of Variance. 變異數分析 ANOVA –Analysis of variance. – 一組資料發生總變異,依可能發生變異的來源 分割成幾個部份,測量這些變異來源,可了解 各變異間是否有差異。
Advertisements

第二週課程介紹 第三週 單因子實驗統計原理 與實務案例 第四週 單因子實驗人工統計實作 與 SPSS 操作 第五週 學習成效及時檢測 ( 紙筆測驗與上機測驗 ) 第六週 雙因子實驗統計原理 與實務案例 第七週 雙因子實驗人工統計實作 與 SPSS 操作 第八週 學習成效及時檢測 ( 紙筆測驗與上機測驗.
單元九:單因子變異數分析.
變異數分析 Analysis of Variance
實驗規劃--實驗因子設定, 效標選定與受測者選定
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
張偉豪 三星統計服務有限公司 執行長 Amos 亞洲一哥
第9章 假設檢定.
變異數分析 ANalysis Of VAriance ANOVA
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
第七章 平均數比較分析 第一節 平均數比較檢定原理 第二節 One-Way ANOVA檢定原理 第三節 SPSS的Means分析
變異數分析 (Analysis-of-Variance簡稱ANOVA)
第 8 章 一組樣本 單變項推論方法.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
17 類別資料的分析  學習目的.
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析
無母數統計方法 符號檢定法 W-符號等級檢定法 W-等級和檢定法 K-W檢定法 連檢定 結論
Analysis of Variance 變異數分析
兩獨立母體成功比例差- Z檢定(大樣本):說明
統計軟體工作坊 輕鬆學會統計軟體R 2013/05/23.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
統計期末報告 指導老師:蘇明俊 組員:休二甲 蔡曉萱 張銘芳 林佳芳
第13章變異數分析與多變數分析  本章的學習主題 
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
第十六章 無母數統計.
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
Analysis of Variance (一)
課程九 迴歸與相關2.
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
第 13 章 實驗設計與變異數分析.
統計學: 應用與進階 第14 章: 變異數分析.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計
第13章變異數分析與多變數分析  本章的學習主題  1. 變異數分析的應用時機 2. 變異數分析的假設前提
Test for difference among the means: t Test
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
統計學期末報告 洗髮精-沙宣vs 組員; 蘇筱芳、 沈宜玫、 徐茂家
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
十、變方分析 (Analysis of Variance) (Chapter 10)
第十二章 單因子變異數分析.
MyLibrary ——数字图书馆的个性化服务
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第 13 章 實驗設計與變異數分析 Part A ( ).
系 別:國企四乙 指導老師:蘇明俊 教授 學生姓名: 陳映雯
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Review of Statistics.
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
Introduction to Basic Statistics
假 設 檢 定.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
R教學 t檢定R指令與範例 羅琪老師.
第 12 章  變異數分析.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
Part 3 初等統計與理論.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

第五章 平均數檢定:多組樣本

Key words 變異數分析 整體型一錯誤機率 變異數分析表 組內變異、組間變異、組間離均差平方和、組內離 均差平方和、組間均方、組內均方 多重比較、事後檢定 Bonferroni 多重比較檢定 Kruskal-Wallis 檢定

在前章中我們已經討論如何檢定兩個母體平均數或 中位數是否有差異的問題,資料有二組樣本 (例如 死亡組、存活組)。然而,很多研究會進行三個以 上母體平均數差異的比較(例如 死亡組、嚴重組、 正常組) ,本章將介紹三組以上母體平均數(或母 體分佈)比較之統計檢定。

以下案例是關於配方奶添加 DHA 是否可以提升嬰兒視力敏 銳度和認知能力的研究:研究者招募了超過100位剛出生的 嬰兒,將他們分成四組,每一組在配方奶裡添加不同濃度的 DHA脂肪酸,各為 0%(對照組)0.32%、0.64%、或0.96% 的DHA。服用配方奶的時間為12個月,然後在出生滿18個月 的時候,嬰兒接受眼力和智力的測驗。 問題: 1. 在配方奶裡添加不同濃度的DHA脂肪酸的四組嬰兒,其視力與認知 能力是否有差異。 2. 如果有差異,究竟要添加多少濃度的DHA脂肪酸才能提昇幼兒的眼 力和認知能力。

雖然我們也可以用前章所介紹的兩個母體平均數(中位 數)差異檢定方法來進行分析,然而這種倆倆互相比較 的檢定方式共有6種比較,會導致整體型一錯誤機率 (family-wise type I error rate)比我們設定的顯著水準 膨脹很多,我們結論的可靠性便會大打折扣。 以本例來說我們有四組需要互相比較其平均差異,共要 進行六次檢定,假設檢定統計均獨立且每次檢定的顯著 水準皆為α=0.05,則虛無假設成立時,六次檢定皆正確 不犯型一錯誤的機率為(0.95)6=0.735,而至少犯一次型 一錯誤的機率高達1-0.735=0.265之多。

對於檢測三組或三組以上獨立之母群體平均數差異, 且要控制整體型一錯誤機率在顯著水準α 以內,最 恰當的檢定方式為變異數分析(Analysis of Variance, ANOVA)方法。 假設有一研究欲驗證 k 組的母群體平均數是否有差 異,所以虛無假設為「各組母群體平均數完全相 同」,即 其對立假設為 k 組間的母群體平均數不完全相同。

假如無法拒絕虛無假設,則”沒證據”證實 k 組的母 群體平均數是有差異;若拒絕虛無假設,則須再進 一步探究這 k 組的母群體平均數差異的情形,我們 稱為事後檢定(post-hoc test)。 變異數分析主要的概念是將資料的總變異(total variation)分離成兩個部分: 組內變異(within - group variation)及組間變異(between-group variation)。

變異數分析之前提假設: k 組母群體均為常態分佈,且各組變異數相同。 k 組中的觀察值為彼此獨立,不相互影響。 其檢定統計量為: 總樣本數為 n=n1+…+nk; 為總平均數,組間變異 SSB為組間離均差平方和(between group sum of squares):

組內變異SSW為組內離均差平方和(within group sum of squares); 即各組樣本變異數  的加權(總和, 組間變異及組內變異,兩者合為總變異量(total sum of squares,SST),SST = SSB + SSW。 SSB 與 SSW各自除以自由度(組間自由度為組數k - 1; 組內自由度為n - k),所得MSB為組間均方(between group mean square)與MSW為組內均方(within group mean square)。

在前提假設成立下及虛無假設H0成立下, p值= 愈小,表示平均數不相等的機會愈 高,我們說 “資料顯示各組之平均數在統計上有顯著 的差異”。

變異數分析表的建立 變異來源 平方和 自由度 均方 F統計量 p值 組間變異 SSB k-1 MSB=SSB/(k-1) F=MSB/MSW 計算右尾機率 組內變異 SSW n-k MSW=SSW/(n-k) 總變異 SST n-1 以下使用範例是有關於補充抗壞血酸的癌症治療研究,樣本為患有胃、支氣管、結腸、卵巢及乳房的晚期癌症患者採用抗壞血酸療法,該研究的目的是想了解是否感染癌症的器官不同會影響其存活時間?存活時間資料之描述性統計如下:

表5-1. 樣本敘述統計量 變數名稱 Variable 分組變數 Organ 樣本數 Count 平均數 Mean 中位數 Median 最小值 Minimum 最大值 Maximum 標準差 Std. dev. Survival Breast 11 1395.9091 1166 24 3808 1238.9667 Bronchus 17 211.5882 155 20 859 209.8586 Colon 457.4118 372 1843 427.1686 Ovary 6 884.3333 406 89 2970 1098.5788 Stomach 13 286 124 25 1112 346.3096 不分組(Total) 64 558.625 265.5 776.4787

表5-2. 變異數分析表 表5-2.為變異數分析檢定結果,顯著水準為0.05時,我們有充份證據顯示五組之平均存活天數有顯著差異。 來源 source 平方和 sum of squares 自由度 d.f. 均方 mean square F檢定統計量 F-statistics p-值 p-value 處理 treatment 11535761 4 2883940 6.4334 0.00022945 *** 誤差 error 26448144 59 448273.6 總和 total 37983905 63 表5-2.為變異數分析檢定結果,顯著水準為0.05時,我們有充份證據顯示五組之平均存活天數有顯著差異。

從圖5-1.的盒鬚圖中可明顯發現並非所有組別之平均 存活時間皆有差異,因此,接下來我們可以利用事後 多重比較的方法(Post-hoc test)再進一步檢定到底是 哪幾組的平均值有差異?

R-web: 分析方法平均數檢定(獨立)多樣本(或稱變異 數分析)資料匯入資料型態設定:一檢定變數一 分組變數參數設定:選擇要進行分析的變數(檢定 變數:Survival,分組變數:Organ)進階選項(1. 設定顯著水準 α:2. 顯示樣本敘述統計量)開始分 析分析結果

事後檢定(post-hoc test)或多重比較(multiple tests) 當變異數分析的F檢定值達顯著水準時,即拒絕各 組平均數相等的虛無假設,亦表示至少有兩組平均 數之間有顯著差異存在,因此需檢驗兩兩個別平均 數間是否 存在顯著差異,此時我們即進行了多重比 較(multiple comparisons)之檢定。 在此我們介紹常用的事後檢定方式, 這些方法都確 定整體多重檢定之型一誤差機率不大於α。

Bonferroni 法 此法為多重比較中常見的方法,所用的方法類似前 章所述之獨立樣本 t 檢定,每兩組進行平均數是否 相等的檢定。 假若有 k 組資料,則需進行共    次的假設檢 定,為使整體犯型一錯誤機率能維持在設定的顯著 水準 α 以內,則必須調整每個個別檢定的顯著水準 為

虛無假設:第 i 組與第 j 組平均存活天數無差異 (H0:   ) 對立假設:第 i 組與第 j 組平均存活天數有差異 (Ha:   ) 則多重檢定統計量 t 與雙樣本平均數檢定相似,僅 差異在母體變異數的估計是以全部 k 組資料為基礎 的變異數估計量 MSW:

表5-3. Bonferroni 多重比較檢定結果 差異 Difference 95% 信賴區間 修正P-值 Adj. p-value 下界 Lower 上界 Upper Breast - Bronchus 1184.3209 428.7367 1939.905 0.0003 Breast - Colon 938.4973 182.9132 1694.0815 0.0061 Bronchus - Colon -245.8235 -915.5773 423.9302 1 Breast - Ovary 511.5758 -479.4321 1502.5836 Bronchus - Ovary -672.7451 -1599.9772 254.487 0.3857 Colon - Ovary -426.9216 -1354.1537 500.3105 Breast - Stomach 1109.9091 309.9602 1909.8579 0.0015 Bronchus - Stomach -74.4118 -793.8427 645.0192 Colon - Stomach 171.4118 -548.0192 890.8427 Ovary - Stomach 598.3333 -365.3939 1562.0605 0.7528 顯著水準為0.05時,我們有充份證據顯示乳癌與胃癌、支氣管癌及結腸癌三組間之平均存活天數有顯著差異,而且乳癌患者平均存活天數顯著高於胃癌、支氣管癌及結腸癌患者。

無母數方法 Kruskal-Wallis test(K-W test) 假如資料分布不為常態或各組變異數不全相同時,則會 考慮以無母數檢定方式來分析,無母數檢定方式不需要 對資料的分佈做任何假設,如同在獨立雙樣本之中位數 檢定中使用威爾考森等級和檢定(Wilcoxon rank-sum test),在多組樣本變異數分析對應的無母數分析為 Kruskal-Wallis 檢定,可檢定多組母群體中位數是否完 全相等的假設。 虛無假設(H0):各組母群體中位數完全相同 對立假設(Ha):k 組間的母群體中位數不完全相同

先將各組樣本混合並作排序後,依數值由小排到大 並標記序位(rank),再將序位分數放回原各組內, 計算各組序位總和及序位平均,再藉由各組樣本數 換算成檢定統計量 H: 使用K-W 檢定唯一的限制是各組樣本數至少要 5 以 上。

虛無假設:各母體的中位數相同 H0:m1 = ... = m5 表5-4. 多樣本中位數差異檢定 虛無假設:各母體的中位數相同 H0:m1 = ... = m5 變數名稱 variable K-W卡方檢定統計量 Kruskal-Wallis chi-square statistics 自由度 d.f. 臨界值 Χ2(d.f.,1-α) p-值II p-value Survival 14.9539 4 9.4877 0.0047979 ** 顯著水準為0.05時,我們有充份證據顯示五組之平 均存活天數有顯著差異。

R-web: 分析方法無母數方法中位數檢定 (獨立)多樣 本(Kruskal-Wallis檢定)資料匯入資料型態設定: 一檢定變數一分組變數或兩獨立樣本參數設定:選 擇要進行分析的變數(檢定變數:Survival, 分組變 數:Organ) 開始分析分析結果。

作業 衛生福利部食品藥物管理署欲瞭解A、B、C三種品 牌嬰兒配方奶及親授母乳,在餵食初生嬰兒一周後 體重增加的情形是否有差異,故以完全隨機方式抽 出26位新生兒分別試用三種配方奶及親授母乳,並 記錄其一周後體重增加(單位:公斤,kg)的情形, 資料如下表所示: 母乳 1.21 1.19 1.17 1.23 1.29 1.14 配方奶-A 1.34 1.41 1.38 1.36 1.42 1.37 1.32 配方奶-B 1.45 1.51 1.39 1.44 配方奶-C 1.31 1.28 1.35 1.27

欲比較A、B、C三種品牌配方奶及親授母乳對新生嬰 兒增重的影響是否有差異,請列出虛無假設及對立假 設。 請製作變異數分析表(ANOVA table),並以顯著水 準α = 0.05檢定三種配方奶及親授母乳是否影響新生 嬰兒體重增加情形? 請以無母數方法(Kruskal-Wallis test)及顯著水準 α = 0.05檢定三種配方奶及親授母乳是否影響新生嬰 兒體重增加情形? 如果2.或3.結論是有顯著差異,試在顯著水準α = 0.05下,利用Bonferroni多重比較方法來分別一對一 檢定三種品牌配方奶及親授母乳對新生嬰兒增重的影 響是否相同?

The End