Download presentation
Presentation is loading. Please wait.
1
Keller: Stats for Mgmt & Econ, 7th Ed 變異數分析
2017年3月18日星期六 第 12 章 變異數分析 Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.
2
變異數分析 統計實作人員比較兩個或更多個區間資料的母體,這個方法稱為變異數分析(analysis of variance)。 變異數分析: 極為有用和普及的程序 決定母體平均數之間是否存在著差異 這個程序的運作是藉由分析樣本的變異數 第12章 變異數分析 第352頁 12.2
3
一因子變異數分析 下圖說明獨立樣本的抽樣設計: 第12章 變異數分析 第352頁 圖12.1
4
一因子變異數分析 變數X 稱為反應變數(response variable),其數值稱為反應值(responses)。 xij = 第 j 個樣本的第i 個觀測值 例如:x35 為第5個樣本的第3個觀測值。 = 所有觀測值的總平均數= ,其中n = n1 + n2 +…+ nk 且 k 為母體的個數。 第12章 變異數分析 第354頁
5
一因子變異數分析 我們要測量的單位稱為實驗單位(experiment unit)。 用來區分母體的標準稱為因子(factor)。 每一個母體皆稱為一個因子水準(level) 。 第12章 變異數分析 第354頁
6
範例12.1 股票投資佔總資產的比例 在過去10 年間,證券經紀商做生意的方法已經有了極大的改變。網路交易已經變得非常普遍,線上交易的花費最低只需要$7。現在投資於股票市場比從前更簡單且更便宜。 這些改變產生哪些影響? 為了協助回答此問題,一位財務分析師隨機抽樣366 個美國家庭,並且要求每一個家庭報告家中戶長的年齡以及他們的金融資產投資在股票市場的比例。 第12章 變異數分析 第353頁
7
範例12.1 股票投資佔總資產的比例 年齡的類別為 該分析師特別感興趣的是決定股票的擁有是否因年齡而異。Xm14-01
範例12.1 股票投資佔總資產的比例 年齡的類別為 年輕人(35 歲以下) 中年初期(35 到49 歲) 中年後期(50 到65 歲) 年長者(65 歲以上) 該分析師特別感興趣的是決定股票的擁有是否因年齡而異。Xm14-01 這些資料是否允許分析師決定股票的擁有比率在四個年齡群之間存有差異? 第12章 變異數分析 第353頁
8
範例12.1 股票投資佔總資產的比例 專有名詞 總資產投資於股市的百分比稱為反應變數;實際百分比稱為反應值。 用來區分母體的標準稱為因子(factor)。 年齡類別是我們感興趣的,這是需要考慮的唯一類別 (因此, 有「一因子」變異數分析的名稱)。 每一個母體皆稱為一個因子水準。 在本範例中有四個因子水準:年輕人、中年初期、中年後期與年長者。 第12章 變異數分析 第354頁
9
範例12.1 股票投資佔總資產的比例 辨識方法 虛無假設: H0: µ1 = µ2 = µ3 = µ4 這些母體平均數之間沒有差異。 對立假設: H1: 至少兩個平均數不等 下一個步驟是決定檢定統計量。 第12章 變異數分析 第353頁
10
檢定統計量 因為µ1 = µ2 = µ3 = µ4 是我們所感興趣的假設,因此各樣本平均數之間近似程度的測量我們也會感興趣。 測量樣本平均數之間彼此近似程度的統計量被稱為處理間變異(between-treatments variation) ,以SST表示,其代表處理平方和(sum of squares for treatments)。表示為: 所有觀測值的總平均數 母體的個數 假如樣本平均數之間存在著大的差異,至少有一些樣本平均數與總平均數非常的不同, 產生一個大的 SST 數值。則拒絕虛無假設,傾向對立假設是合理的。 第12章 變異數分析 第354頁
11
檢定統計量 我們利用在第11章討論過的方法,在母體變異數是相等的情況下,計算兩個母體共同變異數的混合估計量 其中 分子測量樣本平均數之間的差異,分母測量樣本之間的變異。 第12章 變異數分析
12
檢定統計量 處理內變異(within-treatments variation)記為SSE。誤差平方和(sum of squares for error): 其中sj2 是樣本j 的樣本變異數。因此,SSE是k個樣本的 合併或混合變異數。這是我們在11.1節中一個計算的推 廣,其中我們使用兩個母體共同變異數的混合估計量(表 示為sp 2) 以檢定和估計介於兩個平均數之間的差異。 第12章 變異數分析 第356頁
13
範例12.1 股票投資佔總資產的比例 計算 根據: 如果: 則 SST = 0 ,因此一個小的SST值支持虛無假設。 在這個檢定中(如同在其他所有統計檢定中)要回答的關鍵問題是,檢定統計量必須多大,我們才能判定拒絕虛無假設? 第12章 變異數分析 第 頁
14
範例12.1 股票投資佔總資產的比例 計算 我們計算樣本平均數與總平均數為: 第12章 變異數分析 第355頁
15
範例12.1 股票投資佔總資產的比例 計算 因此,代表處理平方和的處理間變異為: SST = 3,738.8。這個值是不是夠大去指出母體平均數不同? 第12章 變異數分析 第355頁
16
範例12.1 股票投資佔總資產的比例 計算 我們計算樣本變異數如下: 因此,誤差平方和為: 我們需要檢定統計量來證明 SST 和 SSE 的相關性。 第12章 變異數分析 第 頁
17
均方 處理的均方: 誤差的均方: 檢定統計量: 在反應變數是常態分配的條件下,檢定統計量服從自由度為 k –1 和 n – k 的F-分配。
第12章 變異數分析 第357頁
18
範例12.1 股票投資佔總資產的比例 在我們的範例中,可求出 F = 2.79 是否在拒絕域中? p-值是多少? 計算
範例12.1 股票投資佔總資產的比例 計算 在我們的範例中,可求出 F = 2.79 是否在拒絕域中? p-值是多少? 第12章 變異數分析 第358頁
19
範例12.1 股票投資佔總資產的比例 詮釋 計算 F-統計量(F-statistic)的目的是決定SST的值是否夠大去拒絕虛無假設。假如SST是大的,F 將會很大。 p-值 = P(F > Fstat) 在範例中,p-值 = P(F > 2.79) 使用Excel P(F > 2.79)=FDIST (2.79,3,362)=.0405。 圖12.2 說明範例12.1 的抽樣分配。 第12章 變異數分析 第358頁
20
範例12.1 股票投資佔總資產的比例 計算 第12章 變異數分析 第359頁 圖12.2
21
範例12.1 股票投資佔總資產的比例 計算 第12章 變異數分析 第360頁
22
範例12.1 股票投資佔總資產的比例 詮釋 p-值為.0405是夠小的,所以我們拒絕虛無假設(H0: µ1 = µ2 = µ3 = µ4) 偏好對立假設 (H1: 至少兩個母體平均數不同) 。 意即存在著證據可以推論總資產投資於股票的百分比至少在兩個年齡類別是不等的。 第12章 變異數分析 第360頁
23
變異數分析(ANOVA) 表 變異數分析(ANOVA) 表(analysis of variance) 。 F-統計量 = MST/MSE
第12章 變異數分析 第 頁 表12.2&表12.3
24
檢查必要的條件 變異數分析的F-檢定要求隨機變數是具有相等變異數的常態分配。只要對每一個樣本繪製直方圖,就可以容易地用圖形檢查常態性的條件。 變異數的同質性可由列印樣本標準差或變異數檢視之。樣本變異數的相似性讓我們能夠假設母體變異數是相等的。 第12章 變異數分析 第361頁
25
必要條件的違背 假如資料不是呈常態分配,我們能夠以等同於一因子變異數分析的無母數方法取代,它是Kruskal-Wallis 檢定。 假如母體變異數不相等,我們能夠使用幾種方法去校正這個問題。 但是,這些校正的測量方法超出本書的程度範圍。 第12章 變異數分析 第361頁
26
多重比較 當我們從一因子變異數分析得到結論:至少有兩個處理平均數不同,我們經常需要知道哪幾個處理平均數造成這些差異性。
我們將會提出三種方法來決定哪些母體平均數是不同的: Fisher的最小顯著差異法 Bonferroni校正 Tukey的多重比較方法 第12章 變異數分析 第366頁
27
多重比較 兩個平均數被認為是不同的,假設它們樣本平均數間的差異是大於一個臨界值。對此,一般的通式是 假設 然後我們推斷 和 不同。 我們相信較大的樣本平均數差異與一個較大的母體平均數差異是有關聯的。 第12章 變異數分析
28
Fisher 的最小顯著差異法 什麼是關鍵數字 NCritical ?在第11章,我們介紹信賴區間估計量是: 假設區間不包括 0 ,我們可以推斷母體平均數不同。所以另一個引導雙尾檢定的方式為測定是否 大於 第12章 變異數分析 第368頁
29
Fisher 的最小顯著差異法 因為MSE 將會是一個比sp2 更佳的估計量。因此,以 MSE 取代前述的檢定統計量和信賴區間估計量公式中的sp2。因此我們定義最小顯著差異(least significant difference, LSD) 為一個決定每一對母體平均數間是否存在著差異的簡單辦法,是將兩樣本平均數間差異的絕對值與LSD 做比較: 如果所有k 個樣本大小皆相等,則 LSD 對所有成對的平均數都是相同的。如果有一些樣本大小不同,對每一個組合都必須計算 LSD。 第12章 變異數分析 第 頁
30
範例12.2 比較修理汽車保險桿的成本 因為外國的競爭,北美汽車製造商已經變得更關心品質。 品質的一個面向是因意外所造成損毀的修復成本。一位製造商考慮數種新型的保險桿。 為了測試他們對低速撞擊的反應,四種不同類型、每種各10個保險桿分別被裝置在中型汽車上,然後以每小時5哩的速度撞擊牆壁。 第12章 變異數分析 第366頁
31
範例12.2 比較修理汽車保險桿的成本 每一個事件的修復成本被估價。Xm14-02 a. 在5%的顯著水準下,是否有足夠的證據推論這些保險桿對低速撞擊的反應是有差異的? b .如果存在差異,哪些保險桿是不同的? 第12章 變異數分析 第 頁
32
範例12.2 比較修理汽車保險桿的成本 問題的目的是比較四個母體,資料是區間的,並且樣本是獨立的。正確的統計方法是一因子變異數分析。 檢定統計量為F = 4.06 以及 p-值= .0139。有足夠的統計證據推論有些保險桿之間存在著差異。現在的問題是,哪些保險桿是不同的? 第12章 變異數分析 第367頁
33
範例12.2 比較修理汽車保險桿的成本 四個樣本平均數是 MSE = 12,399,因此 第12章 變異數分析 第370頁
34
範例12.2 比較修理汽車保險桿的成本 我們計算平均數之間的差異絕對值並且將計算結果與LSD = 相比較。 因此,µ1和 µ2、µ1和 µ3、µ2和 µ4、以及 µ3 和 µ4有差異。 其他兩對µ1和µ4以及µ2和 µ3 則沒有差異。 第12章 變異數分析 第370頁
35
LSD 方法的Bonferroni校正 LSD 程序的缺點是我們增大了至少犯一個型 I 錯誤的機率。 Bonferroni 校正(Bonferroni adjustment) 修正了這個問題。 其中我們先前使用alpha() ,譬如說.05,現在我們將使用調整後的alpha: 其中 是成對母體平均數的組合數。 第12章 變異數分析 第369頁
36
範例12.2 比較修理汽車保險桿的成本 假如我們執行LSD程序再加上Bonferroni 校正,成對比較的組數是6(以 C = k(k − 1)/2 = 4(3)/2 計算得到)。 我們設α = .05/6 = .0083。因此,tα/2,36 = t.0042,36 = 2.794(可由 Excel 得到,用手算近似則較困難)且 第12章 變異數分析 第370頁
37
該使用哪一個多重比較方法? 假如你在執行變異數分析之前已經辨識到你想要進行的兩或三個成對比較,使用Bonferroni 方法。 假如你計畫比較所有可能的組合,使用Tukey 方法。 第12章 變異數分析 第371頁
38
變異數分析的實驗設計 實驗設計已經成為我們決定使用哪一種方法的因素之一。 在範例12.1 描述的實驗是一個單因子設計,因為我們只有一個處理──家庭戶長的年齡。 一因子變異數分析僅僅是變異數分析許多不同實驗設計中的一種。 第12章 變異數分析 第372頁
39
變異數分析的實驗設計 一個多因子實驗(multifactor experiment) 是以兩個或多個因子定義處理(treatments)。 假如在另一個研究中,我們也能夠觀察家庭戶長的性別。我們將發展兩因子變異數分析。 其中第一個因子──年齡,有四個水準;而第二個因子──性別,有兩個水準。 第12章 變異數分析 第 頁
40
獨立樣本和區集 在11.3 節,我們介紹解決配對實驗資料的統計方法。這類的實驗設計降低樣本內的變異性,使得偵測兩母體間的差異更加地容易。當問題的目的是比較兩個以上的母體,與配對實驗等同的實驗設計被稱為隨機化區集設計(randomized block design)。 區集(block)這個名詞指的是一個來自每個母體觀測值的配對群組。 我們也能夠對每一個處理使用相同的物件( 人、工廠和商店) 來執行區集實驗。如此的實驗被稱為重複量測(repeated measures) 設計。 第12章 變異數分析 第373頁
41
獨立樣本和區集 隨機區集實驗也被稱為二因子變異數分析(two-way analysis of variance),不要與二因子變異數分析(two-factor analysis of varianc)混淆。我們以下列流程圖與標題來說明… 比較兩個或更多個母體 資料類型 區間 實驗設計? 獨立樣本 區集樣本 我們將會先說明這項 一因子變異數分析 隨機區集變異數分析 也可被視為 二因子變異數分析 二因子變異數分析 第12章 變異數分析 第373頁
42
隨機區集(二因子) 變異數分析 設計一個隨機區集實驗的目的是為了降低處理內變異,以便更容易地偵測出處理平均數之間的差異。 在變異數分析的隨機化區集設計中,我們把總變異分解成三個變異的來源: SS(Total) = SST + SSB + SSE 其中 SSB,即區集的平方和(sum of squares for blocks),測量區集之間的變異。 第12章 變異數分析 第373頁
43
隨機區集(二因子) 變異數分析 下表彙整我們使用於這項實驗設計的符號。 第1個區集中觀測值的平均數 第2個處理中觀測值的平均數
第12章 變異數分析 第375頁 表12.4
44
隨機區集實驗的平方和 將所有觀測值的總平均數平方之後,會得到以下的公式: 處理平均數的檢定統計量 隨機集區的檢定量統計
第12章 變異數分析 第 頁
45
ANOVA 表 如同一因子實驗,由隨機區集實驗產生的統計量可以彙整於一個ANOVA 表,它的一般式展示於 下表中:
第12章 變異數分析 第377頁 表12.5
46
範例 比較降低膽固醇的藥 Xm14-03 許多北美洲的民眾有高膽固醇的毛病,它可能導致心臟病。對於那些膽固醇水準非常高的人(超過 280 ) ,醫生開處方箋藥物以降低膽固醇水準。一家製藥公司最近研發了四種這類的新藥。為了決定它們的效果是否存有任何差異,於是籌組一項實驗。這家公司選取 25 組的人,每組4位男性,每一個人的膽固醇水準皆超過 280 。在每一個分組中,男性的年齡與體重相近。新藥物被控制服用超過兩個月的期問,並且記錄降低的膽固醇水準。這些結果是否允許該公司結論這四種新藥之間存有差異? 第12章 變異數分析 第376頁
47
範例12.3 比較降低膽固醇的藥 要被檢定的假設如下: H0: µ1 = µ2 = µ3 = µ4 H1: 至少兩個平均數不等 辨識方法
範例12.3 比較降低膽固醇的藥 辨識方法 要被檢定的假設如下: H0: µ1 = µ2 = µ3 = µ4 H1: 至少兩個平均數不等 第12章 變異數分析 第377頁
48
範例12.3 比較降低膽固醇的藥 辨識方法 反應變數是降低的膽固醇,處理是這四種新藥。 區集為這 25個類似的男性群組。 藉由建立實驗設計,可以消除與年齡和體重不同組合相關的膽固醇降低的變異。這可以幫助我們檢測由這四種新藥所造成的平均膽固醇降低是否有存有差異。 第12章 變異數分析 第377頁
49
範例12.3 比較降低膽固醇的藥 資料 處理 區集 範例中有 b = 25 個區集,與 k = 4 個處理。
範例12.3 比較降低膽固醇的藥 資料 處理 區集 範例中有 b = 25 個區集,與 k = 4 個處理。 第12章 變異數分析 第376頁
50
範例12.3 比較降低膽固醇的藥 計算 第12章 變異數分析 第377頁
51
範例12.3 比較降低膽固醇的藥 詮釋 當你結論差異存在而事實上它們並沒有差異時,是犯了型 I 錯誤。當檢定顯示沒有差異而它們至少有兩個平均數不同時,是犯了型 II 錯誤。兩種錯誤的成本是同樣昂貴的。我們以 5% 的標準來判斷 p-值。因為 p-值= .0094,我們下結論說有充分的證據去推論至少有兩種藥物是不同的。一項檢驗顯示使用新藥 2 與新藥 4 降低的膽固醇最多。建議進一步地檢驗以決定哪一種新藥是最好的。 第12章 變異數分析 第 頁
52
檢查必要的條件 變異數分析隨機化區集設計的F-檢定與獨立樣本設計有相同的條件。 也就是,隨機變數必須服從常態分配,且母體變異數必須相等。 直方圖( 沒有在此展示) 顯示支持我們結果的適用性;膽固醇的降低呈現常態分配。 變異數相等的需求也呈現出符合的狀態。 第13章 變異數分析 第378頁
53
必要條件的違背 當反應變量不服從常態分配,我們可以用Friedman 檢定取代隨機區集變異數分析。 第13章 變異數分析 第378頁
54
區集化的準則 在11.3 節中,我們列出執行配對實驗的優點和缺點。當我們討論執行區集實驗時,相同的論述也適用。區集的目的是降低因實驗單位間的差異所造成的變異。藉由將實驗單位分組成反應變數同質性高的區集,統計實作人員增加了偵測到處理平均數間真正差異的機會。因此,我們需要找到可以顯著地影響反應變數的區集準則。 第12章 變異數分析 第378頁
55
區集化的準則 例如,假設一個統計學教授想要決定四種統計教學方法中哪一種最好。在一因子實驗中,他可能抽取四個 10 位學生的樣本,每一個樣本採用一種不同的教學方法,在課程結束後給學生評分,並且執行F-檢定以決定是否有差異存在。但是,每個教學類組內的學生之間可能有非常大的差異,而這種差異可能會掩蓋教學類組之間真正的差異。 第12章 變異數分析 第378頁
56
區集化的準則 要減低這種變異,該統計學教授必須辨識與學生統計學成績有關的變數。例如,學生的整體能力、數學課程的完成,以及其他統計學課程的接觸等,全都與統計學課程的表現有關。 第13章 變異數分析 第378頁
57
區集化的準則 此實驗能夠以下列方式進行。該統計學教授隨機選取四位( 修統計學課程之前) 平均成績在95至100 分的學生。他接著再指派學生到四種不同教學方法的班級。他對平均成績在90-95 分、85-90 分,⋯⋯,以及50-55 分的學生重複這個過程。期末的統計學成績將被用來檢定班級間的差異。 第12章 變異數分析 第378頁
58
區集化的準則 任何與實驗單位有關的特性都是潛在的區集準則。例如,如果實驗單位是人,我們根據年齡、性別、收入、工作經驗、智商、居住地 ( 國家、鄉鎮或城市)、體重或身高來區集化。假如實驗單位是工廠,而我們將測量每小時的生產數量,區集準則包括勞工經驗、工廠的年齡和供應商的品質。 第12章 變異數分析 第378頁
59
發展對統計觀念的了解 如同我們先前解釋的,隨機區集實驗是13.3 節配對實驗的一個推廣。 在配對實驗,我們簡單地移除由實驗單位間差異所造成變異的影響。 這移除的影響可以由減小的標準誤值( 與獨立樣本檢定統計量產生的標準誤值做比較) 和增大的t-統計量值看出。 第12章 變異數分析 第379頁
60
發展對統計觀念的了解 在變異數分析的隨機區集實驗,我們以計算SSB實際測量了區集之間的變異性。 誤差平方和(SSE) 因為SSB而減小,使得偵測處理間的差異更加地容易。 此外,我們能夠檢定區集間是否不同——這是我們無法在配對實驗執行的程序。 第12章 變異數分析 第379頁
61
發展對統計觀念的了解 為了示範說明,讓我們回到範例11.4 和範例11.5,它們是用以決定主修財務和主修行銷MBA 間的起薪是否有差異的實驗。( 事實上,我們是檢定主修財務是否比主修行銷取得較高的薪資。但是,變異數分析只能檢定差異性。) 在範例11.4 (獨立樣本) 中,沒有充分的證據去推論兩類主修間的起薪有差異 在範例11.5 (配對實驗) 中,有充分的證據去推論差異的存在。 第12章 變異數分析 第379頁
62
發展對統計觀念的了解 如同我們在13.3 節中指出,以GPA 配對讓統計實作人員更容易分辨兩類主修間起薪的差異。假如我們用變異數分析重做範例13.4 和範例13.5,我們會得到相同的結論。下面呈現Excel 的輸出。 第12章 變異數分析 第379頁
63
發展對統計觀念的了解 第12章 變異數分析 第379頁
Similar presentations