第九章 均數檢定
概說 在進行各種統計假設檢定時,我們通常將要否定(棄卻)之事實當作虛無假設(null hypothesis,以H0代表)。既然希望它是不對,以將其否定,那就表示會有一個希望它是對的對立假設(alternative hypothesis,以H1或Ha代表)。 當檢定結果,得否定該虛無假設時,就等於接受對立假設。注意,虛無假設與對立假設間必須是週延且互斥,其間絕無重疊的模糊地帶;也無任何無法涵蓋的真空地帶。
假設檢定之類型與單/雙尾檢定 假設檢定之類型與應使用單尾或雙尾檢定有: 等於與不等於之雙尾檢定 H0:μ1=μ2 H1:μ1≠μ2 無論檢定統計量之觀察值落在左側或右側之危險域(或稱棄卻域、拒絕域),均表示μ1≠μ2。更詳細一點,若落在左側之危險域,表示μ1<μ2;若落在右側之危險域,表示μ1>μ2。
等於與大於之右側單尾檢定 H0:μ1≦μ2 H1:μ1>μ2 或 H0:μ1=μ2 當檢定統計量之觀察值落右側之危險域,均表示μ1>μ2。
等於與小於之左側單尾檢定 H0:μ1≧μ2 H1:μ1<μ2 或 H0:μ1=μ2 當檢定統計量之觀察值落左側之危險域,均表示μ1<μ2。
檢定的步驟 設定虛無假設H0 設定對立假設H1 決定顯著水準(α) 選擇適當的檢定統計量(z、t、F、…),以及決定危險域(棄卻域之臨界點) 計算所選之檢定統計量的觀察值 結論:當檢定統計量的觀察值落入危險域,棄卻虛無假設H0;反之,無法棄卻虛無假設H0(接受虛無假設)
單一母體平均數檢定 單一母體,若母體標準差σ已知,其各項檢定所使用之檢定統計量為 若處理對象為大樣本(n>30),且母體標準差σ未知,則可使用樣本標準差S來替代: 於未使用電腦的情況,我們是查附錄二之『標準常態分配表』,若Z值大於查表所得之臨界值(critical value),則棄卻虛無假設。
若樣本為抽自常態母體之小樣本(n≦30),且母體μ與σ均未知。其各項檢定所使用之檢定統計量為:(T分配之自由度為n-1) 於未使用電腦的情況,我們是根據其自由度查附錄三之『t分配的臨界值』,若t值大於查表所得之臨界值(critical value),則棄卻虛無假設。
由於,t分配是取決於樣本大小(n);當樣本數超過30(n>30),t-分配就頗接近常態分佈。 且於同一個顯著水準下,t值大於等於z值,故其檢定結果會較為嚴格一點。 所以,SPSS就只提供一個可以大小通吃的T檢定,無論是大樣本或小樣本的平均數檢定,均以T檢定來處理。
雙尾檢定 如,自全班隨機抽取幾位學生之成績: 75 85 78 70 80 80 54 78 85 88 85 85 80 85 56 82 75 85 78 70 80 80 54 78 85 88 85 85 80 85 56 82 25 85 78 75 78 82 47 83 60 80 78 70 82 78 60 75 80 88 78 83 90 90 49 82 於α=0.05之顯著水準,是否可接受全班成績為70分之假設?其處理步驟為:
設定虛無假設H0 H0:μ=70 設定對立假設H1 H1:μ≠70,為雙尾檢定 決定顯著水準(α) α=0.05 選擇適當的檢定統計量,以及決定危險域 由於是大樣本,以Z檢定統計量,採雙尾檢定,應查α=0.025之表。 查附錄二之『標準常態分配表』,累積機率為0.475時,其棄卻域之臨界點為1.96。所以,若Z檢定統計量<-1.96或>1.96,就應該棄卻虛無假設。
計算所選之檢定統計量的觀察值 將以計算機所求算之樣本均數與樣本標準差 =75.55、S=13.54及已知之μ=70,代入Z檢定統計量之公式 結論 檢定統計量Z=2.592>1.96之臨界值,已落入危險域,故應棄卻虛無假設H0:μ=70。也就是應接受其對立假設H1:μ≠70。所以,無法接受全班成績為70分之假設。
但若使用SPSS,先將資料輸入到『SPSS範例\Ch09\單一母體平均數檢定.sav』: 續以下示步驟執行檢定: 執行「分析(A)/比較均數法(M)/單一樣本T檢定(S)…」
選『成績』,按 鈕,將其送到右側之『檢定變數(T)』方塊 於『檢定值(V)』處,輸入70(已知μ=70)
按〔確定〕鈕,可查知均數與標準差分別為75.55與13.54,檢定結果之t值2.592恰等於我們先前所算之Z值。
判斷檢定結果時很簡單,於雙尾檢定只須看此『顯著性(雙尾)』是否小於所指定之α值;於單尾檢定則看此『顯著性(雙尾)』除以2是否小於所指定之α值。 如本例係雙尾檢定,『顯著性(雙尾)』為0.013<α=0.05,即表示在α=0.05時,此檢定結果要棄卻虛無假設,接受對立假設。故應棄卻H0:μ=70。也就是應接受H1:μ≠70。所以,無法接受全班成績為70分之假設。
單尾檢定 假定,五年前大學生每週平均運動時間為75分鐘,『SPSS範例\Ch09\運動時間.sav』內本年度之資料,是否可顯示本年度運動時間已經明顯增加(α=0.05)?
以前節之操作步驟,執行「分析(A)/比較均數法(M)/單一樣本T檢定(S)…」,檢定『運動時間』是否超過75:
獲致
解: H0:μ≦75 H1:μ>75,為右尾單尾檢定 α=0.095,右尾單尾檢定,只須看此『顯著性(雙尾)』除以2是否小於所指定之α值 『顯著性(雙尾)』0.095除以2為0.0475<α=0.05 結論:棄卻虛無假設,接受本年度每週運動時間均數超過75分鐘之對立假設。
馬上練習 假定,某報宣稱大學生一週平均飲料花費已≧100元。以問卷調查蒐集範例『飲料花費』之資料,是否可否定該結論(α=0.05)?
H0:μ≧100 H1:μ<100,左尾單尾檢定 α=0.05,左尾單尾檢定,以『顯著性(雙尾)』除以2是否小於所指定之α值進行判斷 結論:『顯著性(雙尾)』0.004除以2為0.002<α=0.05,應棄卻虛無假設,可以否定該結論。接受大學生一週平均飲料花費不超過100元之對立假設,平均數為83.23元。
馬上練習 本校去年學生平均通學距離為11.8公里,今年因商學院搬往另一校區,以『SPSS範例\Ch09\通學距離.sav』內容,是否可證明今年學生平均通學距離大於去年?(α=0.05)
H0:μ≦11.8 H1:μ>11.8 α=0.05 採右尾單尾檢定,以『顯著性(雙尾)』除以2是否小於所指定之α值進行判斷 『顯著性(雙尾)』0.002除以2為0.001<α=0.05,應棄卻虛無假設H0:μ≦11.8;也就是接受其對立假設H1:μ>11.8。所以,今年學生平均通學距離大過去年。樣本平均數為21.045公里。
獨立樣本T檢定 獨立樣本T檢定,適用於對兩樣本平均數的檢定,旨在比較變異數相同的兩個母群之間平均數的差異,或比較來自同一母群之兩個樣本之均數的差異。其檢定方式,隨變異數是否相同,又可分為兩種: 兩獨立小樣本均數檢定(變異數相同) 兩獨立小樣本均數檢定(變異數不同)
獨立小樣本均數檢定(變異數相同) 若兩母群體之變異數相同(σ12=σ22),是採用匯總變異數t檢定(pooled-variance t test)。其相關公式為:式中,Sp2 即是匯總變異數
兩獨立小樣本均數檢定(變異數不同) 若兩母群體之變異數不同(σ12≠σ22),則將用個別變異數的t統計量(Cochran & Cox法)。其相關公式為: 請注意,其自由度已不再是兩母群體之變異數相等時簡單的d.f. = N1+N2-2,依此處公式計算之自由度可能會含小數。
不過,這些都不重要!因為SPSS會自動幫我們檢定兩母群體之變異數是否不同?我們只要會讀報表結果就好了! 以『SPSS範例\Ch09\男女之飲料花費.sav』為例:(性別1=男、2=女)
試檢定男/女平均一週飲料花費是否存有顯著差異?(α=0.05) 本例之虛無假設與對立假設分別為: H0:μ1-μ2=0 H1: μ1-μ2≠0 或簡化成 H0:μ1=μ2 H1: μ1≠μ2 此為一雙尾檢定,以『顯著性(雙尾)』是否小於所指定之α值進行判斷。
其處理步驟為: 執行「分析(A)/比較均數法(M)/獨立樣本T檢定(T)…」
選『飲料花費』,按 鈕,將其送到右側之『檢定變數(T)』方塊 選『性別』,按 鈕,將其送到右側之『分組變數(G)』方塊。其後括號內會顯示兩個問號,等待定義組別
按 鈕,獨立樣本T檢定,只能處理兩組均數之檢定,我們的性別也恰為兩組,故於『組別1』與『組別2』處,分別輸入1、2
按〔繼續〕鈕,回上一層對話方塊。『性別』後括號內會顯示1與2
按〔確定〕鈕,可得知男/女樣本數分別為73與127;其一週平均飲料花費分別為93.29與77.44。
判讀底下之T檢定結果,首先應先看左半部之F檢定的結果,它是用來檢定兩母群體之變異數是否不同?其虛無假設與對立假設分別為: H0: σ12=σ22 H1: σ12≠σ22 若F檢定之顯著性<0.05,應棄卻虛無假設,接受兩母群體之變異數不等,故應讀『不假設變異數相等』列之T檢定結果;反之,若F檢定之顯著性>0.05,應接受兩母群體變異數相等之虛無假設,故應讀『假設變異數相等』列之T檢定結果。
本例F檢定之顯著性為0. 752>0. 05,應接受兩母群體變異數相等之虛無假設,故應讀『假設變異數相等』列之T檢定結果。即t=1
馬上練習 以『SPSS範例\Ch09\男女運動時間.sav』內容(單位:分,性別1=男、2=女),檢定男生平均運動時間是否大過女生?(α=0.05)
馬上練習 『SPSS範例\Ch09\地區所得』資料內容:(地區1=甲、2=乙),是否表示乙地區之所得明顯高過甲地區:(α=0.05)
量表檢定-兩組 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。對於如: 請就下列有關洗面乳之產品屬性勾選其重要程度。 非常重要 重要 普通 不重要 非常不重要 1)抗痘 □ □ □ □ □ 2)去油 □ □ □ □ □ 3)美白 □ □ □ □ □ 4)保濕 □ □ □ □ □ 5)去角質 □ □ □ □ □ 6)緊緻毛孔 □ □ □ □ □ 7)卸妝 □ □ □ □ □
之評價量表(非常重要=5、非常不重要=1),我們也經常得以性別進行分組檢定。看對某屬性之注重程度,是否會因性別而有顯著差異?其資料存於『SPSS範例\Ch09\洗面乳屬性.sav』:
由於性別僅兩組,故也是以「分析(A)/比較平均數法(M)/獨立樣本T檢定(T)…」來進行檢定。其處理步驟為: 於左側,以拖曵滑鼠一次選取『抗痘~卸妝』等變數
按 鈕,將其送到右側之『檢定變數(T)』方塊 選『性別』,按 鈕,將其送到右側之『分組變數(G)』方塊。其後括號內會顯示兩個問號,等待定義組別
按 鈕,於『組別1』與『組別2』處,分別輸入1、2
按〔繼續〕鈕,回上一層對話方塊。『性別』後括號內會顯示1與2
按〔確定〕鈕,獲致
於整體分析時,我們尚需要全體受訪者對各屬性之評價均數。故續以下示步驟求得: 執行「分析(A)/描述性統計(E)/描述性統計量(D)…」 於左側,以滑鼠拖曵一次選取『抗痘』~『卸妝』等變數,按 鈕,將其送到右側之『變數(V)』方塊
按 鈕,設定僅要求得平均數
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致
轉入Word撰寫報告 前節之分析結果,分散於幾個不同之報表,還是得轉入Excel,加以整理,將其均數、適當之t值、顯著性以及全體均數等,彙總到Word表格,並安排其注重程度的排名,才比較容易撰寫報告。
取得男/女對各屬性之注重程度均數 首先,先取得男/女對各屬性之注重程度均數,其處理步驟為: 於『組別統計量』報表物件上,單按滑鼠右鍵,續選取「複製(C)」,記下組別統計量內容
轉入Excel,切換到『常用』索引標籤,按『剪貼簿』群組之 『貼上』鈕,將內容貼到Excel
於A2輸入『屬性』字串 按第一列之標題按鈕,選取該列,續按Ctrl+-鍵,將該列刪除 按住Ctrl鍵,續按C、E、F欄之標題按鈕,選取不連續之三欄,續按Ctrl+-鍵,將這幾欄刪除
於C1、D1輸入『男』、『女』字串,作為男女均數欄之標題 按A欄之標題按鈕,選取該欄,續按Ctrl++鍵,插入一空白新欄
於A1輸入『編號』字串,A2輸入數字1,A3輸入數字2
選取D2:D15之數字資料,按『數值』群組之 『減少小數位數』鈕,將小數調整為2位 選取D3:D15之數字資料(D3為女性對『抗痘』屬性注重程度的均數)
按『剪貼簿』群組之 『複製』鈕,記下所選取之內容 停於E2,按『剪貼簿』群組之 『貼上』鈕,將選取內容複製到E2以下 按『剪貼簿』群組之 『複製』鈕,記下所選取之內容 停於E2,按『剪貼簿』群組之 『貼上』鈕,將選取內容複製到E2以下 對照一下,可發現編號為奇數(有屬性名稱者)之各列,D與E欄之內容,恰為男/女對各該屬性注重程度的均數。如,原男/女性對『抗痘』屬性注重程度的均數4.02與3.91,是分別擺於不同列之D2:D3,目前已安排於同一列之D2:E2。
點按B欄之任一格(如:B2),切換到『資料』索引標籤,按『排序與篩選』群組之
按住第9列之標題按鈕,往下拖曳到第15列,選取這幾列,續按Ctrl+-鍵,將其等刪除。等於刪除了所有C欄為女之所有內容,別擔心,其資料已複製到E欄。目前之問題是,B欄屬性之順序並非原問卷上排列之順序。還好,我們有A欄之編號!
點按A欄之任一格(如:A2),再按 『從最小到最大排序』鈕,可將整個表格資料依『編號』遞增排序,即可還原成原問卷上排列之順序,且也分別取得男/女對各屬性注重程度的均數
取得對各屬性之注重程度全體均數 接著,再來處理各屬性之注重程度之全體均數。 轉回SPSS,於『敘述統計』報表物件上,單按滑鼠右鍵,續選取「複製(C)」,記下敘述統計內容
轉入Excel之另一個空白工作表,切換到『常用』索引標籤,按『剪貼簿』群組之 『貼上』鈕,將內容貼到Excel
選取C3:C9之數字資料,按『數值』群組之 『減少小數位數』鈕,將小數調整為2位
按『剪貼簿』群組之 『複製』鈕,記下所選取之內容(各屬性注重程度之全體均數) 轉回上節男/女均數之工作表,點選F2,續按『剪貼簿』群組之『貼上』鈕,將各屬性注重程度全體均數,複製到F2以下。(得確定一下,是否已正確將資料抄到適當之屬性列)
刪除C欄,於E1輸入『全體』字串。完成取得各屬性注重程度全體均數之工作
計算排名 若屬性之項目較多,想一下判讀出較被注重的是那幾個屬性?其排名順序如何?實也不太容易!可以下示步驟,利用Excel的RANK()函數,計算出各屬性注重程度的排名: 續前例,於F1輸入『排名』字串,於F2輸入公式 =RANK(E2,$E$2:$E$8)
雙按F2右下角之複製控點,將公式複製到F3:F8,求算出所有屬性注重程度之排名
一般分析,並不用排名到最後一個,僅須保留前幾名即可,故我們將排名5以後者刪除
取得t值與顯著水準 最後,以下式步驟,取得獨立樣本T檢定之t值與顯著水準: 轉回SPSS,於『獨立樣本檢定』報表物件上,單按滑鼠右鍵,續選「複製(C)」,記下獨立樣本檢定內容
轉入Excel之另一個空白工作表,切換到『常用』索引標籤,按『剪貼簿』群組之 『貼上』鈕,將內容貼到Excel
刪除H欄以後之各欄以及第1、2與4列,雙按B欄標題按鈕,顯示其完整內容
刪除F欄 選取C2:F15之數字資料,切換到『常用』索引標籤,按『數值』群組之 『減少小數位數』鈕,將小數調整為2位
依判讀方法,按住Ctrl鍵,續以滑鼠於E與F欄,選取適當之t值與其右側之顯著性。最後,一併選取E1:F1之標題
按『剪貼簿』群組之 『複製』鈕,記下所選取之不連續內容 轉回上節處理後之工作表,點選G1,續按『剪貼簿』群組之『貼上』鈕,複製出各屬性檢定結果之t值、顯著性及標題。(得確定一下,是否已正確將資料抄到適當屬性右側)
轉成單尾並加附註 由於,是在檢定男>女或女<男,故得以下示步驟,將先前之『顯著性(雙尾)』除以2,求其單尾顯著性,並於其後加註是否小於α=0.05: 於I1輸入『顯著性(單尾)』,於I2輸入公式 =H2/2
按『數值』群組之 『減少小數位數』鈕,將小數調整為2位 續雙按其右下角之複製控點,將其抄到I3:I8
按『剪貼簿』群組 『複製』鈕,記下所選取之容 按『剪貼簿』群組『貼上』鈕的下拉紐,續選「貼上值(V)」,將其由公式轉為常數(以免將來H欄被刪除時,本欄會變為錯誤)
刪除H欄之雙尾顯著性,僅保留單尾顯著性
於I1輸入『<α』字串,於I2輸入公式 =IF(H2<0.05,"*","") 續雙按其右下角之複製控點,將其抄到I3:I8。可將檢定結果顯著者,於其『<α』欄加註"*"(表其<α=0.05)
最底下一列,B9輸入『樣本數』,C9:C10輸入男/女樣本數46與104 選取B欄~I欄,雙按任一個欄表題按鈕之右側邊框,將其調整為最適寬度。續選取B1:I8
按『剪貼簿』群組 『複製』鈕,記下所選取內容 再轉到Word文件,停於要插入表格之位置。切換到『常用』索引標籤,按『剪貼簿』群組『貼上』鈕,將選取內容複製過來
於撰寫報告時,僅需就『<α』欄加註"*"(表其<α=0.05)之部份詳加解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: 根據調查解果,受訪者較注重之洗面乳屬性,依序為:『去油』、『抗痘』、『保濕』、『美白』與『緊緻毛孔』。 經逐一以T檢定,依性別分組對其注重程度進行檢定,發現有『去油』、『美白』、『保濕』、『去角質』、『緊緻毛孔』與『卸妝』等屬性之注重程度,會隨性別不同,而有顯著差異。 這些有顯著差異之項目,除『去油』外;著重程度均是女性較男性來得高些。其原因可能是女性一般較懂得化妝且有愛美之天性,故較注重洗面乳之『美白』、『保濕』、『去角質』、『緊緻毛孔』與『卸妝』等屬性。而男性可能是經常在戶外運動,且又不化妝,故只要注重洗面乳是否能『去油』而已!
成對樣本 前面『獨立樣本T檢定』,其兩組受測樣本間為獨立,並無任何關聯。如:甲乙班、男女生、兩不同年度、都市與鄉村、……。
其相關公式為: 式中,d即同一配對之兩資料相減之差。
假定,要比較兩廠牌輪胎之壽命。抽7部車,左右使用不同廠牌輪胎,每車各由同一個人駕駛(同一駕駛習慣),經過一段時間後,獲得下示輪胎磨損之配對資料(以千分之一吋為單位),是否可證明,在α=0.05之顯著水準下,甲廠牌輪胎磨損程度較乙廠牌大?
首先,將其資料輸入到SPSS,存入『SPSS範例\Ch08\輪胎磨損.sav』: 由於是配對樣本,其虛無假設與對立假設分別為: H0:μd≦0 H1:μd>0 故此類檢定為右側單尾檢定,以『顯著性(雙尾)』是否小於所指定之α值進行判定。
接著,以下示步驟進行配對T檢定: 執行「分析(A)/比較均數法(M)/成對樣本T檢定(P)…」 選『甲廠』與『乙廠』,左下『目前的選擇』處,會將兩變數分別安排成『變數1』與『變數2』
按 鈕,將其送到右側之『配對變數(V)』方塊
按〔確定〕鈕,獲致
可看出甲廠及乙廠輪胎的平均磨損程度分別為96. 00與87 可看出甲廠及乙廠輪胎的平均磨損程度分別為96.00與87.43。由於本例是在檢定甲廠牌輪胎磨損程度是否大於乙廠牌,故為一單尾檢定。應以『顯著性(雙尾)』除以2是否小於所指定之α值進行判斷。 依此結果:自由度為6,t統計值2.299,『顯著性(雙尾)』0.06除以2為0.03<α=0.05,故可知甲廠牌輪胎磨損程度大於乙廠牌。
馬上練習 假定,要比較一套新打字教法之效果。隨機抽取10位未經任何訓練之學生,加以訓練。『SPSS範例\Ch09\打字訓練.sav』內: 訓練前及訓練後之每分鐘打字速度(字),於α=0.05之水準下,是否表示此套訓練可讓學生每分鐘平均多打40個字:(此為單尾檢定)
本例得先以「轉換(T)/計算(C)…」計算『訓練後』-40之值為何?存入『訓練後減40』
再取『訓練前』與『後減40』進行配對T檢定。其虛無假設與對立假設分別為: H0:μd≦0 H1:μd>0 故此類檢定為右側單尾,以『顯著性(雙尾)』除以2是否小於所指定之α值進行判斷
本例為一單尾檢定。應以『顯著性(雙尾)』除以2是否小於所指定之α值進行判斷。依此結果:自由度為9,t統計值-. 547,『顯著性(雙尾)』0
馬上練習 假定,要比較一套新減肥法之效果。隨機抽取12位受測者進行測試一個月。『SPSS範例\Ch09\減肥成效.sav』內減肥前及減肥後之體重(公斤): 於α=0.05之水準下,是否表示此套新減肥法可讓受測者至少減5公斤?
(答案:此為單尾檢定,於α=0.05之水準下,此套新減肥法至少可讓受測者平均減5公斤)
第九章 結束 辛苦啦!