變異數分析 ANOVA Analysis of Variance
變異數分析 ANOVA –Analysis of variance. – 一組資料發生總變異,依可能發生變異的來源 分割成幾個部份,測量這些變異來源,可了解 各變異間是否有差異。
ANOVA 平均數考驗方法 – 變異數分析 = 平均數差異的統計方法 – 探討類別變項對於連續變項的影響,平均數的差異成 為主要分析重點 – 超過兩個以上的平均數的考驗。 – 運用 F 考驗來檢驗平均數間的變異量是否顯著的高於隨 機變異量,又稱為變異數分析。 – 平均數間的變異數(組間變異)除以隨機變異得到的 比值( F 值),來取代平均數差異與隨機差異的比值( t 或 Z 值)
基本名詞 實驗單位 (experimental unit)= 實驗設計中所衡量 的基本對象。 因子 (factor)= 衡量實驗單位的不同條件。 水準 (level)= 各因子所表現出的不同程度。 處理 (treatment)= 各因子的水準之特定組合。
Example 假設將 12 塊田地予以隨機分成 A 、 B 、 C 三組,其中兩塊 施以甲肥料﹙ A ﹚與乙肥料﹙ B ﹚,第三塊田則不施肥﹙ C ﹚,其產 量結果如下,試求: – 請問本題之實驗單位﹙ experimental unit ﹚、因子﹙ factor ﹚、水準﹙ level ﹚ 為何? ABC
變異數分析的基本假設 1. 每個反應變數的母體均為常態分配。 2. 每個母體的變異數均相等。 3. 抽自各母體的各組隨機樣本互為獨立。
一因子變異數分析 (one factor ANOVA) : – 只關心一個因子。 二因子變異數分析 (two factor ANOVA) : – 同時探討兩個因子。
k 種處理方式完全隨機化設計的資料結構 總變異 = 組間變異 + 組內變異 ( 殘差 ) 總平方和 = 組間平方和 + 組內平方和 ( 殘差平方和 ) SST=SSB+SSW(SSE)
SST :依變項觀察值的變異。全體樣本在依變項得分的變 異情形,即總離均差平方和。。 SSB :導因於自變項影響的變異。組間離均差平方和。 SSW :導因於自變項以外的變異,(隨機變異)。組內 離均差平方和。 =SSE 各離均差平方和平均化後,得到均方和( MS ),即為變 異數的概念。 SStotal=SSb+SSw
一般情形之完全隨機化設計的 ANOVA 表 F F=MSB / MSE
完全隨機化設計的 F 檢定 reject H 0
ABC Example 假設將 12 塊田地予以隨機分成 A 、 B 、 C 三組,其中兩塊施以甲肥料 ﹙ A ﹚與乙肥料﹙ B ﹚,第三塊田則不施肥﹙ C ﹚,其產量結果如下,試求: 1. 請說明 ANOVA 的基本假設? 2. 建立 ANOVA 表? 3. 檢定施肥與否對產量是否有影響﹙ α=0.05 ﹚? 4. 本題為 one factor ANOVA , or two factor ANOVA ?
Example – 某工廠欲了解 4 部機器的性能觀察其每小時產量,得到以下資料: ﹙ a ﹚請問本題之因子﹙ factor ﹚、水準﹙ level ﹚為何? ﹙ b ﹚本題為 one factor ANOVA , or two factor ANOVA ? ﹙ c ﹚建立 ANOVA 表? ﹙ d ﹚檢定 4 部機器的產量是否有差異 α=0.05 ﹚ [F0.05(3,18)=3.16] ? 機器 ABCD 產量
Example – 我們想了解甘藷的品種之蛋白質含量,今找出常見的三種甘藷品 種,從每品種中任取四塊,並測定其蛋白質含量,得下表。請比 較三種甘藷的蛋白質含量有無差異。 ﹙ α=0.05 ﹚ 品種 A7854 B9865 C
事前比較( Priori comparison ) 基於理論或研究者的特定需求所進行的平均數考驗, 又稱計畫性比較。 事前比較有其特定目的,因此不針對多次比較所累積 的第一類型錯誤的膨脹機率進行校正。 事前比較運用 t-test 即可: t 分數的計算改用是對誤差 較佳的估計值。此時的自由度為 N-K ,查表 D 。
事後比較( Posteriori comparison ) 基於統計決策所所進行平均數考驗之後續考驗 ( follow-up test ) 在獲得顯著的 F 值之後所進行的多重比較,稱 為事後比較( posteriori comparisons )
實驗性錯誤( experiment-wise error ): – 使整個研究的第一類型錯誤維持衡定,此種第一類型 錯誤稱為實驗性錯誤。(如 HSD 法)。 – 多組比較,用同一個臨界值(基於同一個誤差源)。 比較性錯誤( comparison-wise error ): – 關心每一對配對比較的第一類型錯誤的一致性。(如 N-K 法)。 – 不同的組合,有不同的臨界值(基於不同的誤差)。
Scheff’s methed 事後比較,適用於 n 不相等的多重比較 此一方法對分配常態性與變異一致性兩項假定之 違反頗不敏感,且所犯第一類型錯誤( type I error )的機率較小。可以說是各種方法中最嚴格、 檢定力最低的一種多重比較。
Scheff’s methed Cohen ( 1996 )甚至認為 Scheffe 執行前不一定要 執行 F 整體考驗 因為如果 F 考驗不顯著, Scheffe 考驗亦不會顯著 但是如果 F 整體考驗顯著,那麼 Scheffe 檢定則可以 協助研究者尋找出整體考驗下的各種組合效果
隨機集區設計 (randomized block design) 將某影響因子分割成很多集區,成為實驗單位再 隨機分派到不同處置 (treatment) ,每個處置都有 相同集區,進而去除此影響因子對測量值之影響。 集區 (block) 是一些欲控制影響因子之分層,如年 齡,體重,社會經濟地位等。
不同抽菸狀態及孕婦體重與嬰兒之出生體重(克)的關係 處置 集區 (公斤) 不抽 1包/天1包/天 1+ 包 / 天總和平均 ,1752,7501,7307,6552, ,2322,8352,4668,5332, ,2403,0622,5098,8112, ,4203,0762,6089,1043, ,4593,3402,7789,5773, ,5153,4162,9209,8513,284 總和 20,04118,47915,01153,531 平均 3,3403,0802,502 2,974
將總平方和分割成三部份:來自集區,來自處置,來自殘餘未知部份 來源平方和自由度均方 F 檢定 處置 2,213,80421,106, 集區 1,037, ,408 殘餘 267, ,777 總和 3,518,62117 ANOVA 表
Example – 從 A 、 B 、 C 三種教學方式的學生中各抽取,之樣本共 20 位同學,對其實施測驗,得下表成績與等級,試檢 定三種教學方法是否有差異? ABC 成績等級成績等級成績等級