第十二章 單因子變異數分析
F分配FDIST() FDIST(F,分子的自由度,分母的自由度) FDIST(x,degrees_freedom1,degrees_freedom2) F為用來求算此函數的F值。由於F值是兩個均方相除: 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且 因分子分母均為正值(均方),故其分配僅在0之右側而已。 本函數在求:於某兩個自由度下之F分配中,求自右尾累計到F值的總 面積(機率)。即傳回F分配之右尾累計機率值(下圖之陰影部份):
F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12 F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx 『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之 右尾累計機率:
F分配反函數FINV() FINV(左尾機率,分子的自由度,分母的自由度) FINV(probability,degrees_freedom1,degrees_freedom2) 本函數用以於已知自由度之F分配中,求某累計機率所對應之F值。 由於F分配之圖形及機率值,將隨自由度不同而略有不同。範例 Ch12.xlsx『FINV』工作表,是以自由度為(2,10)之情況下,所求得 之結果: 有了此函數,即可省去查『附錄五 F分配的臨界值』F分配表之麻煩。
馬上練習 查兩個自由度(d.f.)分別為1~10之情況下,單尾機率為5%之F值: (詳範例Ch12.xlsx『F分配的臨界值』工作表)
F檢定FTEST() 各樣本之母群體為常態分配(normality) 各樣本之母群體為獨立(independence) 變異數分析(Analysis-of-Variance簡稱ANOVA),為統計學家費雪 (Fisher,R.A.)首創,最常被用來檢定兩常母體之變異數是否相等(即, 變異數同質性的檢定)與檢定多組(大於兩組)母群平均數是否相等? (若為兩組則採用t檢定或z檢定) 要使用變異數分析的基本假設為: 各樣本之母群體為常態分配(normality) 各樣本之母群體為獨立(independence) 各組樣本之母群體變異數相同(homogeneity-of-variance)
兩常態母體之變異數檢定 FTEST(範圍1,範圍2) FTEST(array1,array2) 可傳回兩組資料(樣本數允許不同),變異數是否存有顯著差異的F檢 定之右尾機率值(P值)。判斷檢定結果時很簡單,只須看此P值之二 分之一是否小於所指定顯著水準之α值。(按理,係雙尾檢定,但通常 會將數字大者當分子,故只須看右尾之臨界值即可) 本函數,可用來測試兩組樣本的變異數是否相同?即變異數同質性的 檢定,其虛無假設與對立假設分別為: H0:σ12=σ22(兩變異數相等) H1:σ12≠σ22(兩變異數不等)
假定,要檢定甲乙兩班之母體變異數是否相同(α=0. 05)?隨機抽得範例 Ch12 假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例 Ch12.xlsx『F-TEST1』工作表之資料,以 =FTEST(B2:B10,C2:C11)/2 求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變 異數相等之虛無假設:
同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例 Ch12.xlsx『F-TEST2』工作表) 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕(#圖Ch12- DataAnalysis), 於『分析工具』處選選「F-檢定:兩個常態母體變異數的 檢定」 續 鈕
於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與 C1:C11) 點選「標記(L)」(因兩組資料均含『甲班』、『乙班』之字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E2位置
依此結果:自由度為(8,9),F值3. 4192>臨界值3. 2296(F10處之P值0. 0426<α=0 依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設) 按 鈕結束,即可獲致檢定結果
FTEST()函數實際上是以 計算求得F值,再代入FDIS()以(n1-1,n2-1)為自由度,求得其右尾機率。如以 前面例子n1=9、n2=10、 、 此值恰等於詳範例Ch12.xlsx『F-TEST3』工作表中,B16以FINV()函數所計 算之結果。將其代入FDIS()以(8,9)為自由度,求得其右尾機率為0.0426,恰 等於B15以FTEST()函數所計算之結果(該值係將雙尾機率除以2):
先檢定變異數再進行均數檢定 當以t檢定,進行兩獨立樣本(小樣本)均數檢定時,將視其變異數相 同或不同,而使用不同之計算方法。實務上,很多知名的統計套裝軟 體(如:SPSS、SAS),就先以F檢定,判斷其變異數是否相同?然 後再進行適當之t檢定。 如,要對範例Ch12.xlsx『F&T』工作表之資料,進行兩班抽樣成績 之均數檢定:
以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合 理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同: 由其F10處之P值為0.27>α=0.05,故無法棄卻兩變異數相等之虛無假設。
由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母 體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在 α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t 檢定之類型為2。且虛無假設與對立假設分別為: H0:μ1≧μ2 H1:μ1<μ2 故此類檢定為單尾檢定。所以,以 =TTEST(C2:C11,B2:B10,1,2) 或以『資料分析』之「t檢定:兩個母體平均數差異檢定,假設變異數相等」 增益集:
均可進行檢定: 無論由B16或F27之單尾P值來看,均顯示其值0.1856>α=0.05,故仍無法棄 卻兩班之均數相等的虛無假設,所以並無法證明乙班之平均成績會高過甲班。
馬上練習 以範例Ch12.xlsx『F&T馬上練習』工作表,利用F檢定,判斷北區與 南區給予剛畢業之大學生的薪資變異數是否相等(α=0.05)?續以適 當之t檢定,判斷北區給剛畢業之大學生的平均薪資是否高過南區 (α=0.05)?
由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定:
單因子變異數分析(ANOVA) 變異數分析的另一種用途,是用來檢定多組(>2)母群平均數是否相 等?亦即,Z與t檢定是用於兩組資料比較平均數差異時;而比較二組 以上的平均數是否相等時,就須使用到變異數分析。其虛無假設與對 立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 假定,範例Ch12.xlsx『ANOVA』工作表資料,為調查各地區對政府 施政的整體滿意程度(滿分為100分),試以α=0.01之顯著水準,檢 定各地區之滿意程度是否存有顯著差異?
本例,以使用『資料分析』進行處理最為便捷。其步驟為: 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「單因子變異數分析」 續按 鈕
於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍 即可(本例為B2:D12,別管其內可能仍含有空白儲存格) 將『分組方式』安排為「逐欄(C)」 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) α設定為0.01 設定輸出範圍,本例安排於目前工作表之G2位置
按 鈕結束,即可獲致單因子變異數分析之ANOVA表 依此結果:自由度為(2,24),F值10.79886>臨界值5.61(L13處之P值 0.00045<α=0.01),故可知三個地區之整體滿意度存有顯著差異。南區的滿意 度86.5要比其餘兩區(66.30與79.89)來得高。
馬上練習 某公司於報紙上進行廣告,範例Ch12.xlsx『廣告ANOVA』工作表, 為不同方式廣告當天所獲得之回應人數: 試以α=0.05之顯著水準,檢定不同方式廣告之回應人數是否存有顯著 差異?
答案:F=6. 56,d. f. =3,19,P-值=0. 00,不同方式廣告之回應人數間存有顯著 差異。全版與半版廣告之回應人數(1173
馬上練習 答案:F=0.46,d.f.=2,32,P-值=0.64,大學生每月刷卡金額並不會因其零用金來源不同而存有顯著差異。 依範例Ch12.xlsx『信用卡刷卡金額』工作表 試以α=0.05之顯著水準,檢定大學生每月刷卡金額是否隨零用金來源 不同而存有顯著差異?
馬上練習 將範例Ch12.xlsx『手機平均月費』工作表之內容 將其整理成僅剩有手機者(刪除無手機者),並以居住狀況分組:
試以α=0.05之顯著水準,檢定大學生每月手機月費是否隨其居住狀況不同而 存有顯著差異? 答案:F=6.887,d.f.=2,116,P-值=0.001<α=0.05,故大學生每月手機月費將隨其居住狀況不同而存有顯著差異,住家裡最高(572.36)、其次為住校外(447.59),最後為住學校宿舍(319.43)。這可能與住學校者較為節儉有關。
量表的檢定—多組 對於如: 等之評價量表,我們也經常得進行分組檢定。看對某一屬性之注重程 度,是否會因組別不同而有顯著差異?
若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進 行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進 行檢定。 以範例Ch12.xlsx『擁有手機時間長短X附屬功能多屬性』工作表,其內僅安 排一個『附屬功能多』評價項目(非常重要-5、……、非常不重要-1)及擁有 手機之時間長短資料(1.未滿六個月、2.六個月至一年、3.一年~一年半、4.一 年半以上):
由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進 行檢定。先將其資料整理成:
然後,以『資料分析』之「單因子變異數分析」來進行檢定
其檢定結果為:
由於本例之虛無假設及對立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 α=0.05 依此結果:F=2.9767,d.f.=3,115,P-值=0.0345<α=0.05,故大學生對『附 屬功能多』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。 擁有手機時間一年~一年半者的注重程度(2.79),低於其他各組(3.45以 上)。
馬上練習 依範例Ch12.xlsx『擁有手機時間長短X雙頻手機屬性』工作表內容 將其資料整理成:
然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手 機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異? 依此結果:F=2.747,d.f.=3,115,P-值=0.046<α=0.05,故大學生對『雙頻手機』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年半以上者的注重程度(4.2),高於其他各組。
於報告上量表檢定的寫法-多組 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。 以『資料分析』之「單因子變異數分析」來進行檢定,也是得一個一 個進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是Excel並不 是專門的統計軟體,能做到這樣也算是不錯的了。 最後,將其彙總成下表:(詳範例Ch12.xlsx『手機屬性-ANOVA』工 作表)
檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳 將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: 根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁 波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。 經逐一以F檢定,以擁有手機時間長短分組,對其注重程度進行檢定,發現有 『附屬功能多』與『雙頻手機』等屬性之注重程度會隨擁有手機時間長短不同, 而有顯著差異(P<α=0.05)。這些項目,均是『一年~一年半』組的著重程度 較低,可能是剛開始有手機者,會較注重這些項目,隨時間增長,慢慢地發現 其實這些項目也沒多大重要性;至於,『一年半以上』者,可能或真正發現沒 這些功能的不便性,或許也開始考慮要換手機,故其注重程度又明顯的高於其 他各組。
第十二章 結束 謝謝!