第13章變異數分析與多變數分析 本章的學習主題 1. 變異數分析的應用時機 2. 變異數分析的假設前提 3. SSS , SSB , SST之算法及關係 4. 隨機集區設計之方法及應用 5. 多變異數分析的應用時機 6. 多重T檢定之方法 7. 變異數分析在SPSS軟體之操作說明
13.1 變異數分析的概念 1.當我們在檢定一個母體平均數或比較兩個樣本平均數時,通常是使用Z檢定或t檢定 H0:μ1 = μ2 13.1 變異數分析的概念 1.當我們在檢定一個母體平均數或比較兩個樣本平均數時,通常是使用Z檢定或t檢定 H0:μ1 = μ2 H1: μ1 ≠μ2
13.1 變異數分析的概念 H0:μ1 = μ2 = … = μm H1: 並非所有的 μ 皆相等 13.1 變異數分析的概念 2. 如果實驗變數超過二個的時候,利用多變量變異數分析 ( ANOVA )。變異數分析的作用在於分析各種變異的來 源,並進而加以比較,以瞭解不同的實驗變數所造成的結 果是否有顯著的差異,它的虛無和對立假設如下: H0:μ1 = μ2 = … = μm H1: 並非所有的 μ 皆相等
13.2 變異數分析的假設 進行 ANOVA 及 MANOVA 分析時,均必須符合以下之假定: 1.各母體呈常態分配。 2.變異數同質:各母體的變異數σ2都相等。 3.自變數不應有高度的共線性。 4.對極端值應有足夠的敏感性。 5.可加性:所有樣本都是隨機抽樣,而且彼此獨立,可以進行 累積與加減。 6.球面性:不同樣本在不同水準間重複測試 ,其變動情形應具 有一致性,否則型一誤差(Type I error,即H0是對 的而拒絕)的機率將增大
13.3 完全隨機設計 在此類變異數分析中,我們所要計算來作為檢定用途的,首先是樣本的離均差平方和,其內容有組內變異(誤差)的離均差平方和(sum of squares): 而組間變異(實驗變數)的離均差平方和為: j = 1, 2, 3, ….,m
13.3 完全隨機設計 最後總變異的離均差平方和,是等於組內變異的離均差平方和加上組間變異的離均差平方和,即: 範例 13.3 完全隨機設計 最後總變異的離均差平方和,是等於組內變異的離均差平方和加上組間變異的離均差平方和,即: 範例 試以變異數分析來判別三所大學辦學績效是否有顯著差異。 成大 台大 政大 評審一 9 7 5 評審二 8 6 4 評審三 3 評審四 評審五 評審六
13.3 完全隨機設計 SSW=SSW成+SSW台+SSW政 =12 SSB=SSB成+SSB台+SSB政 13.3 完全隨機設計 成大 台大 政大 評審一 9 7 5 評審二 8 6 4 評審三 3 評審四 評審五 評審六 平均 總平均 SSW=SSW成+SSW台+SSW政 =[(9-8)²+…+(7-8)²]+[(7-6)²+…+(5-6)²]+[(5-4)²+…+(3-4) ²] =12 SSB=SSB成+SSB台+SSB政 =[6(8-6)²+6(6-6)²+6(4-6)²] =48 SST=SSW+SSB=60
13.3 完全隨機設計 在求出上列各項離差平方和後,我們再加以求算它們的不偏變異數。 組內不偏變異數(mean square) : n為樣本總數,m為組數 組間變異的不偏變異數為:
13.3 完全隨機設計 上述兩個步驟完成後,便可求算其F值,再用F分配表檢定組間變異是否顯著,F值的算法如下: 13.3 完全隨機設計 上述兩個步驟完成後,便可求算其F值,再用F分配表檢定組間變異是否顯著,F值的算法如下: 如果F>Fα, 即組間變異顯著,代表所檢定的組別 中,最少有一組之平均數是與其他組有顯著差異的, 因此拒絕H0 如果F<Fα ,即組間變異不顯著(在α水準下),無 法拒絕H0
13.3 完全隨機設計 範例: 假設某電器用品廠商要測定其三家經銷商之平均銷售量是否相同,於是該廠商從甲店上個月各天的銷售量中隨機抽選五天的銷售量,從乙店抽選六天的銷售量,從丙店抽選四天的銷售量,所得資料如表13 – 1 所列。
13.3 完全隨機設計 表 13-1 三家經銷商的銷售量 單位新台幣10萬元: 經銷商 甲 乙 丙 銷售量 14 13 10 17 16 8 13.3 完全隨機設計 表 13-1 三家經銷商的銷售量 單位新台幣10萬元: 經銷商 甲 乙 丙 銷售量 14 13 10 17 16 8 5 12 11 6 9 平均數 變異數 7.5 8.67
13.3 完全隨機設計 針對此一問題我們所發展的假設如下: H0:μ1=μ2= μ3 ( 三家經銷商的平均銷售量相同 ) H1:至少一家經銷商的平均銷售量與其他不同
13.3 完全隨機設計 表 13-2 變異數分析表 ( 完全隨機設計 ) 變易來源 SS 自由度 MS F值 組間 ( 實驗變數 ) 66.93 2 MSB=33.47 3.79 組內 ( 誤差 ) 106.00 12 MSW=8.83 總變異 172.93 求出之F值為3.79 < F2,12,0.01值為6.9266,表不顯著,代表在1%的顯著水準下,無法拒絕H0的假設。換言之,我們並無足夠證據足以顯示這三家經銷商的平均銷售量有所不同。
13.4 隨機集區設計 隨機集區設計係先依據某一外在因素將實驗單位分成若干「集區」( block ),然後再衡量「實驗變數」的效果,其總離均差平方和( SST )可分割成集區離均差平方和( SSBB )、實驗變數離均差平方和( SSB )和誤差平方和( SSE )等三部份:
13.4 隨機集區設計 統一企業有四家生產飲料的工廠,我們想了解此四家工廠的飲料生產平均值是否有差異,隨機選擇三種品牌飲料,請用 5%的 顯著水準檢定不同品牌飲料的平均產出是否相同。 品種 地區 1 2 3 工廠A 15 14 16 工廠B 17 13 18 工廠C 10 12 工廠D
13.4 隨機集區設計 對於上述問研究我們所發展的假設如下: H0:μ1= μ2 = μ3 H1:至少有一個不相等。
13.4 隨機集區設計 表 13-4 變異數分析 ( 集區實驗 ) 變異來源 SS 自由度 MS F值 品種 14 3 – 1 = 2 7 3 集區 28 4 – 1 = 3 28/3 4 誤差 2 * 3 = 6 7/3 就品種方面而言,F=3,而Fα=5.14 (α=0.05, df=2,6),Fα值大於F值=3,故無法拒絕H0的假設,表示三種品牌飲料的平均產量無顯著不同。
13.5 事後檢定 在顯著水準α下,如果 H0 的假設被推翻時,接著我們會想知道這k組中到底兩兩之間是否有顯著的差異,這就是成對的事後比較。
13.5 事後檢定 ) / 1 ( n WMS t + 各組樣本數相同 1. Tukey’s HSD法 Tu= 2. LSD法 T= 13.5 事後檢定 各組樣本數相同 1. Tukey’s HSD法 Tu= 2. LSD法 T= 3. Duncan法 N WMS k Q ) , ( - a ) / 1 ( ' 2 i n WMS t + , k N - a n WMS k N Q ) , ( - a
13.5 事後檢定 各組樣本數不同時 1. 雪費法(Scheffé method) Scheffé法的事後比較是同時討論全體的對比,此一 13.5 事後檢定 各組樣本數不同時 1. 雪費法(Scheffé method) Scheffé法的事後比較是同時討論全體的對比,此一 方法用於樣本數n不相等的一種多重比較技術。 Sc = 2. Bonferroni法 解決型一錯誤的方式是向下調整α,最常用的方法 即是Bonferroni法 B0= n WMS k N F 2 ) , 1 ( - a tα/2m n WMS k 2 ) ( - m =
13.6 多變數的檢定 當研究資料中,依變數不再只有一個,而是有多個依變數,此時便需要使用多變數分析。單變異數分析 ( ANOVA ) 程序雖然可以個別計算每個依變數之變異數,但這樣做就會忽略了多個依變數之間的相關。將單變異數分析擴展成多個依變數,稱為多變數分析 ( MANOVA )。
13.6 多變數的檢定 MANOVA 可同時分析兩個或兩個以上的準則變數,為什麼不分別對每一個準則變數進行 ANOVA或 t 檢定即可呢? 這是因為個別的檢定會忽略依變數間的互動關係,未充分利用所有可用的資訊來評估各群體的整體差異,必然會影響檢定的效力。如果依變數間有複共線性 ( multicollinearity ) 存在,則利用 MANOVA 才能檢測出各準則變數間線性結合的影響 。
13.6 多變數的檢定 以本書範例而言,我們探討公司行為意圖的不同,檢定個體在構面的表現 (包括品牌忠誠、社群參與、社群推薦)上是否會有所不同。多變數分析之結果如表13- 4所示。
13.6 多變數的檢定 Phillai’s Trace=1.169 (F=115.318) 13.6 多變數的檢定 表 13-4 多變數分析 (不同行為意圖分群在各因素的比較 ) 1.低行為意圖群 n=59 2.中行為意圖群 n=106 3.高行為意圖群 n=85 F值 P值 Duncan 品牌忠誠(bli) 4.3448 6.3143 5.3844 96.932 0.000 (1,3,2) 社群參與(cpi) 3.8559 5.9623 3.6647 204.268 (31,2) 社群推薦(cri) 4.1441 6.5991 5.9412 244.119 Phillai’s Trace=1.169 (F=115.318) Wilk’sλ=0.132 (F=143.525)
13.6 多變數的檢定 由上表可得知,不同行為意圖分群在「品牌忠誠度」、「社群參與」、「社群推薦」上皆有差異。 13.6 多變數的檢定 由上表可得知,不同行為意圖分群在「品牌忠誠度」、「社群參與」、「社群推薦」上皆有差異。 並且就三個變數之線性關係而言,Phillai’s Trace值及Wilk’sλ值均達顯著之水準,可見行為意圖的三個變數之線性組合有顯著之差異,而且以高行為意圖之社群成員其內部品牌忠誠度、社群參與、社群推薦程度最高。
13.6 多變數的檢定 本書是以Duncan來做示範,其中(1,3,2)之意義為經過Duncan兩兩T檢定後,第1組、第3組與第二組之平均值則有顯著差異,亦即凡是有打逗點則此組與下一組有顯著差異(要注意在Duncan欄中組別出現之順序為由小到大之順序)。
13.6 多變數的檢定 表 13-5 多變數分析(不同行為意圖之分群在各研究構面的比較) n=59 n=106 n=85 1.低行為意圖群 13.6 多變數的檢定 表 13-5 多變數分析(不同行為意圖之分群在各研究構面的比較) 1.低行為意圖群 n=59 2.中行為意圖群 n=106 3.高行為意圖群 n=85 F P Duncan 成就動機(afm) 2.8008 2.8939 2.6500 0.951 0.388 (312) 權力動機(pm) 3.7585 5.0377 4.3206 23.556 0.000 (1,3,2) 從屬動機(acm) 4.7712 6.3774 5.3471 54.049 網站效能(opf) 3.7373 4.8255 4.3118 16.537 支持(ops) 4.5763 4.8962 4.3412 4.309 0.014 (31,2) 能力(ab) 4.4407 5.8489 5.1648 53.461 資訊基礎(ift) 4.3008 5.9458 4.8118 58.114 認同基礎(idt) 3.9407 5.4953 4.5765 39.850 與會員間分享(ks_co) 3.3670 4.3269 3.3371 18.729 與公司分享(ks_ks) 3.8138 5.2137 4.0548 43.686 (13,2)
13.6 多變數的檢定 從表13-5我們可得知,第二群之社群成員(高行為意圖分群)在所有的構面下均領先其他兩群,顯示高行為意圖群擁有最高的動機、機會及能力,且其信任及知識分享也是最高;而第三群之社群成員(中行為意圖分群)在許多方面也有相當不錯的表現;而第一群之社群成員(低行為意圖分群)在各構面的平均分數都較其他兩群來地低,顯示其動機、機會及能力最低,且其在信任及知識分享也是最差。 由此例我們可推斷出,當線上社群人員的行為意圖越高,其擁有較佳的動機、機會及能力,且其信任及知識分享也是最高。