統計學: 應用與進階 第14 章: 變異數分析.

Slides:



Advertisements
Similar presentations
單元九:單因子變異數分析.
Advertisements

實驗規劃--實驗因子設定, 效標選定與受測者選定
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
第十五單元:交叉列表和卡方檢定 授課老師:國立臺灣大學農藝學系 劉仁沛 教授
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
變異數分析 (Analysis-of-Variance簡稱ANOVA)
17 類別資料的分析  學習目的.
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析
單因子實驗 設計 (Single­factor experiments)
假設檢定.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
Analysis of Variance 變異數分析
型II誤差機率的計算 Calculating Type II Error Probabilities
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
Using EXCEL for ANOVA.
Analysis of Variance (一)
Analysis of Variance (二)
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
第 13 章 實驗設計與變異數分析.
Chapter 14 Simple Linear Regression
ANOVA簡介 許晉誠
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計
第13章變異數分析與多變數分析  本章的學習主題  1. 變異數分析的應用時機 2. 變異數分析的假設前提
Test for difference among the means: t Test
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
Inferences Based on a Single Sample: Tests of Hypothesis Chapter 9
Interval Estimation區間估計
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
十、變方分析 (Analysis of Variance) (Chapter 10)
論文計畫書 國軍人員對廢軍品管理現況之研究─以空軍 後勤單位為例 指導教授:胡子陵博士 研究生:劉俊德.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第 13 章 實驗設計與變異數分析 Part A ( ).
Liner regression analysis
相關統計觀念復習 Review II.
第 7 章 推論方法.
估計與假設檢定.
日光燈製造業 勞工汞蒸氣暴露評估技術探討 勞工安全衛生研究所 謝俊明 林雲卿 4/18/2019.
國立台灣體育學院 體育學系暨體育研究所 高明峰
第一章.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
上課大綱 迴歸係數的區間估計與假設檢定 統計顯著性與經濟顯著性 迴歸模型中的點預測與區間預測 配適度分析(變異數分析)
Introduction to Basic Statistics
假 設 檢 定.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
R教學 t檢定R指令與範例 羅琪老師.
第 12 章  變異數分析.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
第八章 方差分析(analysis of variance)
Chapter 3 相關與變異數分析. Chapter 3 相關與變異數分析 變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數.
1-4 和角公式與差角公式 差角公式與和角公式 1 倍角公式 2 半角公式 和角公式與差角公式 page.1/23.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
4.理財規劃者適格性分析與實作 理財規劃重點 生涯階段 「就業前準備階段」(學習階段) 「初入社會階段」 「確定職涯階段」 「維持職涯階段」
Presentation transcript:

統計學: 應用與進階 第14 章: 變異數分析

變異數分析的基本觀念 單因子變異數分析 平方和 均方 檢定虛無假設 變異數分析表

基本觀念 變異數分析簡稱ANOVA, 其名稱為來自ANalysis Of VAriance 由著名的統計學家Sir Ronald A. Fisher(1890-1962) 所發展出來 在其著作中, 以變異數分析研究不同的肥料對於作物收成的影響 參閱David Salsburg 所著“The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century.” 中譯本為“統計, 改變了世界,” 天下文化出版

基本觀念 變異數分析的研究目的在於檢定母體均數是否顯著不同 如果只比較兩組均數, 則變異數分析所得到的結果與假設檢定中, 檢定μ1 = μ2 時的t 檢定所得到的結果相同。 一般來說, 變異數分析所欲檢定的是, 多組(兩組以上) 母體均數是否顯著不同

基本觀念 舉例來說, 假設有m 種不同教學方式可以使用。令Xi 代表使用第i 教學方式後, 學生的統計學成績。假設: 檢定不同教學方式是否會造成不同的平均成績: H0 : μ1 = μ2 = · · · = μm H1 : H0 不為真

基本觀念 何不兩兩進行t 檢定, 看看是否μ1 = μ2, μ1 = μ3 . . .? 這樣的作法有兩大問題 分析的原因

基本觀念 既然檢定的是「均數」, 為什麼不叫「均數分析」,而是叫做「變異數分析」? 所謂的變異數分析, 就是將一組資料的總變動量(total variation), 依可能造成變動的因素(factor) 分解成不同的部分, 並據以檢定特定因素是否能解釋資料的變動。例如, 不同的肥料(因素) 對於作物收成變動的影響。 而在分解不同變動量的過程中, 剛好提供我們檢定一群μ 是否相等的機會

單因子變異數分析(one-factor ANOVA) 如果我們只考慮一種因素對於資料變動的影響,就稱為單因子變異數分析

完全隨機設計(completely randomized design) 探討不同因素對於資料變動的影響時, 是以完全隨機的方式給與不同的處方(treatment) 舉例來說, 如果我想了解兩種不同的教學方式對於學生成績之影響, 在試驗中, 我們必須對於任一個學生, 隨機選取一種教學方式來施教

ANOVA 基本假設 假設有m 群母體, 由每一母體中抽出樣本數分別為 的獨立隨機樣本 令 為總樣本數 令 為總樣本數 設Yij 為第i 組中第j 個隨機樣本點, 如果以兩種不同的教學方式對於學生成績之影響為例, 則m = 2, 且Y15 代表了採用第1 種方法的第5個學生 假設各母體分配為常態分配, 具有不同的均數μi 與相同的變異σ²

ANOVA 假設 隨機抽樣且獨立 各母體分配為常態分配 相同的變異數 σ² Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 11-11

ANOVA 基本假設

單因子變異數分析 如果把母體1 到母體m 通通考慮進來, 形成一個大母體, 令μ代表該大母體的均數(grand mean), 我們可以將總變動量Yij − μ 分解成 總變動量 未解釋變動量 已解釋變動量

班上同學隨機分成兩群, 一群以填鴨背公式的方法學習統計, 另一群以直觀靈活的方法學習統計 你是第i 群中的第j 名學生, Yij =你的統計成績, μ =全班平均成績, μi = 第i 群的平均成績 你個人的成績與全班平均成績的差異(Yij − μ)可以分解成(1) 你個人的成績與你所屬群組平均成績的差異(Yij − μi ) 加上(2) 所屬群組平均成績與全班平均成績的差異(μi − μ)

μi − μ 代表了不同教學方式所造成的成績差異,乃是教學方式這個因子所能解釋的部份, 跟你同一群組的同學都得到一樣的教學方式, 因此, 你個人的成績與你所屬群組平均成績的差異(Yij − μi ) 就不是教學方式這個因子所能解釋,而是與你個人的用功程度, 運氣好壞等其他因素所影響, 因而稱之為未解釋變動量, 或是稱為因誤差(error) 所造成的變動

由於μi − μ 以及= Yij − μi 未知, 根據類比原則, 我們就以其樣本對應予以估計: 亦即, 其中, 稱之為組平均, 稱作總平均, 為總差異, 為組內差異, 而 為組間差異

平方和(sum of squares) 如果我們直接以組間差異 來分析因子的影響, 由於 的值或正或負, 加總後正負將會互抵。為了避免這種情況發生, 我們將各個差異平方後再加總, 得到其平方和 總平方和(total sum of squares, SST): 誤差平方和(sum of squares due to error, SSE): 因子平方和(sum of squares due to factor, SSF):

notations Response, Y Y Group 1 Group 2 Group 3

Among Group Variation Response, Y Y3 Y Y2 Y1 Group 1 Group 2 Group 3

With Group (Random) Variation Response, Y Y3 Y2 Y1 Group 1 Group 2 Group 3

重要性質 總平方和= 誤差平方和+ 因子平方和

ANOVA 實例

均方(mean squares) 為了檢定因子對於資料變動(總平方和) 的影響,一個可能的衡量準則為求出SSF/SST, 若因子平方和佔總平方和的比例高, 代表了因子對於資料變動具有顯著影響, 則我們可以拒絕因子對於資料變動無顯著影響(μ1 = μ2 = . . . = μm) 的虛無假設 然而, 使用SSF/SST 作為檢定的準則有個問題,那就是變動總和會隨樣本數增加而增加, 為了更精確地衡量因子變動和佔總變動的比例, 我們將進一步求算平方和的均數: 均方

nT − 1, nT − m 與m − 1 分別稱為SST, SSE與SSF 的自由度(degree of freedom) 均方 定義均方如下 總均方(total mean square, MST): MST = SST/(nT − 1) 誤差均方(mean square due to error, MSE) MSE = SSE/(nT − m) 因子均方(mean square due to factor, MSF) MSF = SSF/(m − 1) MST ≠ MSE + MSF nT − 1, nT − m 與m − 1 分別稱為SST, SSE與SSF 的自由度(degree of freedom)

均方的重要性質 當 為真時 若 不成立, 則 我們可以用 來檢定虛無假設是否成立

均方的重要性質 當虛無假設成立時, 當虛無假設不成立時, 亦即, 當至少有兩個μi 不等時, MSE 會高估 (overestimate) σ² 因此, 如果 的值太大時, 我們就拒絕虛無假設 這是一個右尾檢定(RTT)

檢定虛無假設 至於多大的 值叫做「太大」? 欲回答此問題, 我們必須知道, 的分配為何 在虛無假設 為真時

檢定虛無假設 因此, 虛無假設成立時, 檢定的統計量為 在顯著水準 α 下, 右尾檢定的臨界值為 拒絕虛無假設的拒絕域為: RR = {拒絕H0 當 }

變異數分析表(ANOVA Table)

ANOVA 實例

變異數分析表: 例子 若顯著水準為0.05, 則查F 分配表得知臨界值 F0.05(2, 7) = 19.353, 而F0 = 0.911 < 19.353, 因此,我 們無法拒絕μ1 = μ2 = μ3 的虛無假設

One-Way ANOVA F-Test Example As production manager, you want to see if three filling machines have different mean filling times. You assign 15 similarly trained and experienced workers, 5 per machine, to the machines. At the .05 level of significance, is there a difference in mean filling times? Mach1 Mach2 Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40

One-Way ANOVA F-Test Solution H0: Ha:  = 1 = 2 = Critical Value(s): 1 = 2 = 3 Not All Equal .05 2 12 F 3.89  = .05

Summary Table Solution From Computer Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Machines) 3 - 1 = 2 47.1640 23.5820 25.60 Error 15 - 3 = 12 11.0532 .9211 Total 15 - 1 = 14 58.2172

One-Way ANOVA F-Test Solution Test Statistic: Decision: Conclusion: F MSF MSE  23 5820 9211 25.6 . Reject at  = .05 There is evidence population means are different

One-Way ANOVA F-Test Thinking Challenge You’re a trainer for Microsoft Corp. Is there a difference in mean learning times of 12 people using 4 different training methods ( =.05)? M1 M2 M3 M4 10 11 13 18 9 16 8 23 5 9 9 25 Use the following table. © 1984-1994 T/Maker Co. You assign randomly 3 people to each method, making sure that they are similar in intelligence etc.

Summary Table Solution* Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Methods) 4 - 1 = 3 348 116 11.6 Error 12 - 4 = 8 80 10 Total 12 - 1 = 11 428

One-Way ANOVA F-Test Solution* 1 = 2 = 3 = 4 Not All Equal H0: Ha:  = 1 = 2 = Critical Value(s): .05 3 8 4.07  = .05

One-Way ANOVA F-Test Solution* Test Statistic: Decision: Conclusion: F MSF MSE  116 10 11 6 . Reject at  = .05 There is evidence population means are different

一因子隨機集區實驗設計

一因子變異數分析─隨機集區設計

一因子變異數分析─隨機集區設計

一因子變異數分析─隨機集區設計

一因子變異數分析─隨機集區設計

隨機集區實驗的ANOVA表

Randomized Block Design Example A production manager wants to see if three assembly methods have different mean assembly times (in minutes). Five employees were selected at random and assigned to use each assembly method. At the .05 level of significance, is there a difference in mean assembly times? Employee Method 1 Method 2 Method 3 1 5.4 3.6 4.0 2 4.1 3.8 2.9 3 6.1 5.6 4.3 4 3.6 2.3 2.6 5 5.3 4.7 3.4

Random Block Design F-Test Solution* 1,. = 2 ,. = 3 ,. Not all equal H0: Ha:  = 1 = 2 = Critical Value(s): .05 2 8 F 4.46  = .05

Summary Table Solution* Degrees of Freedom Mean Square (Variance) Source of Variation Sum of Squares F Treatment (Methods) 3 - 1 = 2 5.43 2.71 12.9 Block (Employee) 5 - 1 = 4 10.69 2.67 12.7 Error 15 - 3 - 5 + 1 = 8 = 2*4 1.68 .21 Total 15 - 1 = 14 17.8

Random Block Design F-Test Solution* Test Statistic: Decision: Conclusion: F MSF MSE  2.71 .21 12.9 Reject at  = .05 There is evidence population means are different

Random Block Design F-Test Solution* .,1 =  ., 2 =  ., 3 Not all equal H0: Ha:  = 1 = 2 = Critical Value(s): .05 4 8 F 4.46  = .05

Random Block Design F-Test Solution* Test Statistic: Decision: Conclusion: F MSBK MSE  2.67 .21 12.7 Reject at  = .05 There is evidence block means are different

四種教學法的學習效果

隨機集區實驗的ANOVA表