單元十四、平均數檢定 國立高雄餐旅學院 沈瑞棋
概說 由於我們對於母體的不瞭解,任何有關母體的敘述都只是假設而己(統計假設),除非是作普查,否則,一個統計假設是對或錯?根本就不可能獲得正確之答案。但因大多對情形是不允許也無法進行普查。所以才會透過抽樣調查,以抽樣結果所獲得的資料,來檢定先前統計假設,以判斷其對或錯? 如果檢定後發現抽樣結果與統計假設間之差異很大,我們就無法接受該統計假設(也就是說否定或拒絕該假設)。反之,若檢定後發現抽樣結果與統計假設間之差異不大,我們就無法拒絕(否定)該統計假設。一般會比較保守的說:無充分證據證明該假設是錯的,而不會直接說接受該統計假設。 在進行各種統計假設檢定時,我們通常將要否定(拒絕)之事實當作虛無假設(以H0代表),即然希望它是不對的,以將其否定,因此對立假設(以H1代表)表示我們希望是正確的假設。 當檢定結果,得到的是否定虛無假設,就是等於接受對立假設。
概說 需要注意的是,虛無假設與對立假設間,必須滿足完整性與互斥性。其間絕無重疊的模糊地帶,也無任何無法涵蓋的真空地帶。例如: 若安排成下式,在等於時會發生重疊,而無法互斥。 若安排成下式,則當兩者恰好等於時,就變成真空地帶,沒有被任何一個假設涵蓋。
假設檢定之類型與單/雙尾檢定 雙尾檢定(等於與不等於) 無論檢定統計量之觀察值落在左側或右側之拒絕域,均表示1 2 拒絕域 拒絕域 H0:1= 2 H1: 1 2 也就是說,若落在左側之拒絕域則表示 1 2 :若落在右側之拒絕域則表示 1 2
假設檢定之類型與單/雙尾檢定 右尾檢定(大於) 拒絕域 H0:1 2 H1: 1 2 當檢定統計量之觀察值落在右側之拒絕域,則表示 1 2
假設檢定之類型與單/雙尾檢定 左尾檢定(小於) 拒絕域 H0:1 2 H1: 1 2 當檢定統計量之觀察值落在左側之拒絕域,則表示 1 2
檢定的步驟為: 檢定的步驟 設定虛無假設H0。 設定對立假設H1。 決定顯著水準()。 選擇適當的檢定統計量(z、t、F、)以及決定拒絕域(拒絕域的臨界點) 計算所選定之檢定統計量的觀察值。 結論:當檢定統計量的觀察值落入拒絕域,拒絕虛無假設H0 ;反之,無法拒絕虛無假設則接受對立假設H1 。
單一母體,若母體標準差己知,其各項檢定所用之檢定統計量為 單一母體平均數檢定 單一母體,若母體標準差己知,其各項檢定所用之檢定統計量為 若處理對象為大樣本(n30)且母體標準差未知,則可使用樣本標準差S來代替:
單一母體平均數檢定 如未使用電腦的情況下,可以查『標準常態分配表』若z值大於查表所得之臨界值,則拒絕虛無假設。 若樣本為抽自常態母體之小樣本(n 30),且母體與均未知。其各項檢定所用之檢定統計量為 T分配之自由度為n-1。 於未使用電腦分析時可查『t分配的臨界值』,若t值大於查表所得之臨界值則拒絕虛無假設。
單一母體平均數檢定 由於,t分配是取決於樣本大小(n),當樣本數超過30(n30),t-分配就頗接近常態分佈。且於同一個顯著水準下,t值大於等於z值,所以其檢定結果會較為嚴格一點,所以在spss就只提供一個可以大小通吃的T檢定,無論是大樣本或小樣本的平均數檢定,均以T檢定來處理。
雙尾檢定 例如:自一班中隨機抽取幾位學生之成績(存為『單一母體平均數檢定.sav』檔),於=0.05之顯著水準下,是否可接受全班成績為70分之假設? 其處理步驟為: 設定虛無假設H0 設定對立假設H1
雙尾檢定 決定顯著水準()。=0.05 選擇適當的檢定統計量,以決定拒絕域。 由於是大樣本,以Z檢定統計量採雙尾檢定。查表當=0.025時,拒絕域之臨界點為1.96。所以,若Z檢定統計量 -1.96或 1.96,就應該拒絕虛無假設。 計算所選之檢定統計量的觀察值。 將計算所得之平均數與標準差及己知之平圴數代入Z檢定統計量之公式 結論:Z=2.5921.96之臨界值,己進入拒絕域,故應拒絕虛無假設接受對立假設。所以無法接受全班成績為70分之假設
SPSS的操作
雙尾檢定─分析 判定檢定結果於雙尾檢定時只須看『顯著性(雙尾)』是否小於所指定的值;於單尾檢定則看『顯著性(雙尾)』除以2是否小於所指定的值。 本例由於是雙尾檢定, 『顯著性(雙尾)』為0.013=0.05,表示在=0.05時,此檢定結果要拒絕虛無假設,接受對假設。所以,無法接受全班成績為70分之假設。
單尾檢定(右尾檢定) 假設五年前大學生每週運動時間為70分鐘,本年度調查大學生每週運動時間資料存為『運動時間.SAV』檔,是否可顯示本年度運動時間己明顯增加,假設顯著水準為0.05。 本例由於是單尾檢定: =0.05右尾檢定只須看『顯著性(雙尾)』除以2是否小於所指定之值,『顯著性(雙尾)』0.01除以2為0.005=0.05。 結論:拒絕虛無假設接受對立假設,本年度每週運動時間平均數超過70分鐘之對立假設。
SPSS的操作
練習題一:單尾檢定(左尾檢定) 假定,某報調查宣稱大學生一週平均飲料花費大於等於100元,以問卷調查蒐集之資料存於『飲料花費.sav』檔中,在=0.05下是否可否定該結論: 問卷資料放置於ftp://203.68.0.44,檔名為『飲料花費.sav』。 本題結論:應拒絕虛無假設,接受大學生一週平均飲料花費不超過100元之對立假設。均數為83.23
練習題二:單尾檢定(右尾檢定) 學校去年學生平均通學距離為6.8公里,今年因成立新校區,以問卷調查蒐集之學生通學資料存於『通學距離.sav』檔中,在=0.05下是否可證明今年學生平均通學距離大於去年? 問卷資料放置於ftp://203.68.0.44,檔名為『通學距離.sav』。 本題結論:應拒絕虛無假設,接受學生今年平均通學距離大於去年。樣本平均數為21.045公里。
獨立樣本T檢定 獨立樣本T檢定,適用於對兩樣本平均數的檢定,主要在比較變異數相同的兩個母體群之間平均數的差異,或比較來自同一母體之兩個樣本之平均數的差異。其檢定方式,依變異數是否相同,可分為兩種: 兩獨立小樣本平均數檢定(變異數相同) 兩獨立小樣本平均數檢定(變異數不同)
兩獨立小樣本平均數檢定(變異數相同) 若兩母體之變異數相同(12=22),採用匯總變異數t檢定(pooled-variance t test)。其相關公式如下: 式中 即為匯總變異數。
兩獨立小樣本平均數檢定(變異數不同) 若兩母體之變異數不同(1222) ,則用個別變異數的t統計量(Cochran & Cox法)。其相關公式如下: 其自由度可能會含小數。不過這些都不重要,因為SPSS會自動幫我們檢定兩母體之變異數是否不同?我們只要會讀報表結果就好了。
例題 調查男/女之飲料花費結果存於『男女之飲料花費.SAV』檔。1代表男性,2代表女性。 試檢定男女平均飲料花費是否存在有顯著差異(=0.05)?本例之虛無假設與對立假設分別為: 此為一雙尾檢定,以『顯著性(雙尾)』是否小於所指定之值進行判定。
例題:SPSS操作步驟
結果分析 上述分析可知,男/女樣本數分別為73與127。一週平均飲料花費分別為93.29與77.44。 判讀T檢定結果,首先應先看左半部之F檢定的結果,它是用來檢定兩母體之變異數是否不同?其虛無假設與對立假設分別如下: 若F檢定之顯著性0.05,應拒絕虛無假設接受兩母體之變異數不等。因此應讀『不假設變異數相等』列之T檢定結果;反之,若F檢定之顯著性0.05,應接受兩母體變異數相等之虛無假設,所以應讀『假設變異數相等』列之T檢定結果。 本例F檢定之顯著性為0.7520.05,所以應讀『假設變異數相等』列之T檢定結果,即t=1.315、自由度198、『顯著性(雙尾)』=0.190.05。故無法拒絕虛無設,也就是說男女之一週飲料花費平均數並無顯著差異。
練習題一:獨立樣本T檢定 假定,調查大學生男/女生運動時間,以問卷調查蒐集之資料存於『男女運動時間.sav』檔中(單位:分,性別 1=男、2=女),在=0.05下檢定男生平均運動時間是否大於女生? 問卷資料放置於ftp://203.68.0.44,檔名為『男女生運動時間.sav』。 本題結論: F檢定之顯著性大於0.05,應接受兩母體變異數相等之虛無假設,故應讀『假設變異數相等』列之T檢定結果,即t=1.584,自由度為113。『顯著性(雙尾)』為0.116除以2為0.0558=0.05。故無法拒絕虛無假設,也是說男生平均運動時間未明顯超過女生。
練習題二:獨立樣本T檢定 假定,調查甲乙兩地所得資料,以問卷調查蒐集之資料存於『地區所得.sav』檔中(地區:1=甲、2=乙),在=0.05下檢定是否表示乙地區之所得明顯高過甲地區? 問卷資料放置於ftp://203.68.0.44,檔名為『男女生運動時間.sav』。 本題結論:F檢定之顯著性小於0.05,應拒絕兩母體變異數相等之虛無假設,故應讀『不假設變異數相等』列之T檢定結果,即t=3.099,自由度為10.954。『顯著性(雙尾)』為0.01除以2為0.005=0.05。故應拒絕虛無假設,也是說甲地區之所得明顯高過乙地區。
量表檢定─兩組 通常問卷上的評價量表,絕不會是少數的幾個評價項目而己。如下所示: 請先就下列有關手機之產品屬性勾選其重要程度。 大小適中 非常重要重要普通不重要非常不重要 重量輕巧非常重要重要普通不重要非常不重要 顏色炫麗非常重要重要普通不重要非常不重要 外形大方非常重要重要普通不重要非常不重要 符合人體工學非常重要重要普通不重要非常不重要 附屬功能多非常重要重要普通不重要非常不重要 收訊狀況佳非常重要重要普通不重要非常不重要 內建式震動非常重要重要普通不重要非常不重要
量表檢定─兩組 可換殼 非常重要重要普通不重要非常不重要 可編曲 非常重要重要普通不重要非常不重要 可掀蓋式非常重要重要普通不重要非常不重要 雙頻手機非常重要重要普通不重要非常不重要 中文螢幕顯示非常重要重要普通不重要非常不重要 待機時間較長非常重要重要普通不重要非常不重要 品牌知名度較高非常重要重要普通不重要非常不重要 電磁波的傷害非常重要重要普通不重要非常不重要
量表檢定─兩組 對上述評價量表(非常重要=5、非常不重要=1)我們經常得以性別進行分組檢定,看對某屬性之注重程度。例如以性別分組檢定,看是否會因性別而有顯著差異?本量表資料存於『手機屬性.SAV』。 由於性別僅兩組,所以也是以『分析/比較均數法/獨立樣本T檢定』來進行檢定。其處理步驟如下: 然後,針對分析結果,一個變數一個變數逐一將其均數、適當之T值、顯著性以及全體均數彙總起來如下表格。並安排其注重程度的排名。
手機屬性 平均數 排名 T值 單尾顯著性 男 女 全體 大小適中 3.64 3.99 3.85 4 -2.044 0.02 * 重量輕巧 3.61 4.00 3.84 5 -2.424 0.01 顏色炫麗 3.12 -0.044 0.48 外形大方 3.35 3.49 3.43 -0.988 0.16 符合人體工學 3.38 3.63 3.53 9 -1.768 0.04 附屬功能多 3.51 10 -0.016 0.49 收訊狀況佳 3.90 4.24 4.10 1 -1.547 0.06 內建式震動 3.66 3.82 3.76 6 -0.876 0.19 可換殼 2.92 2.86 2.88 0.458 0.32 可編曲 2.84 2.87 -0.171 0.43 可掀蓋式 3.05 2.79 2.90 1.800 雙頻手機 3.58 3.60 8 0.368 0.36 中文螢幕顯示 3.68 7 -0.128 0.45 待機時間較長 3.91 3.96 3 -0.481 品牌知名度較高 3.45 0.049 電磁波的傷害 3.74 4.12 3.97 2 -1.860 0.03
結論 由於,是在檢定男女或女男,故僅取其『顯著性(雙尾)』除以2之單尾顯著性,檢定結果顯著者,於其『』欄加註*(表其=0.05),並於報告中對其詳加解釋:檢定不顯著者,則僅解釋其重要程度之排序即可。如: 根據調查結果,受訪者較注重之手機屬性,依序為『收訊狀況佳』、 『電磁波的傷害』、 『待機時間長』、 『大小適中』與『重量輕巧』。 經逐一以T檢定依性別分組對其注程度檢定,發現有『大小適中』、 『重量輕巧』、 『符合人體工學』、 『可掀蓋式』與『電磁波的傷害』等屬性之注重程度會隨性別不同,而有顯著差異(=0.05)。 這些顯著差異之項目,除『可掀蓋式』外著重程度均是女性較男性來得高些。其原因可能是女性一般較為嬌小,不願其手機太大或太重且要符合人體工學。 對於『電磁波的傷害』也是女性較為重視。那應是女性較心細與嬌柔的因素。男性通常較散漫粗獷,自認強壯較不怕是否存在都不知道的電磁波。 至於『可掀蓋式』可能是男性認為其較為帥氣,所以較女性注視此一屬性。
成對樣本 上述分析的是『獨立樣本T檢定』兩組受測樣本間為獨立,並無任何關聯。例如:甲乙班、男女生、兩不同年度、都市與鄉村 式中,d即同一配對之兩資料相減之差。
成對樣本 假定,要比較兩廠牌輪胎之壽命。抽7部車,左右使用不同廠牌輪胎,每車各由同一個人駕駛(同一駕駛習慣),經過一段時間後,獲得下示輪胎磨損之配對資料(千分之一吋為單位)。是否可證明,在=0.05之顯著水準下,甲廠牌輪胎磨損程度較乙廠牌大? 甲廠:143、68、100、35、105、123、98 乙廠:125、64、 94、38、 90、125、76 上述資料存於檔案『輪胎磨損.sav』 由於是配對樣本,其虛無假設與對立假設分別為: H0: d 0 H1: d 0 此類檢定為右尾檢定,以『顯著性(雙尾)』是否小於所指定之值進行判定。 配對T檢定之步驟如下:
配對T檢定的步驟 執行『分析/比較均數法/成對樣本T檢定』。 選『甲廠』與 『乙廠』左下 『目前的選擇』處,會將兩變數分別安排成 『變數1』與『變數2』。 按向右選取鈕將其送到右側之『配對變數』方塊。 按確定鈕,可獲得結果。 結論:可看出甲廠及乙廠的平均磨損程度分別為96與87.43。由於本例是在檢定甲廠牌輪胎磨損程度是否大於乙廠牌。故為一單尾檢定。應以『顯著性(雙尾)』除以2是否小於所指定之值進行判斷。依此結果:自由度為6,t統計值為2.299,『顯著性(雙尾)』=0.06除以2為0.03 =0.05,所以可知甲廠牌輪胎磨損程度大於乙廠牌。
練習題一:成對樣本T檢定 假定,要比較一套新打字法之效果,隨機抽取10位未經任何訓練之學生,加以訓練。訓練前及訓練後之每分鐘打字速度資料於『打字訓練.sav』檔案中,在=0.05之水準下,檢定是否表示此套訓練可讓學生每分鐘平均多打40個字?本例應先以『轉換/計算』計算『訓練後』-40之值為何?存入『後減40』變數。再取『訓練前』與『後減40』進行配對T檢定。其假設如下所示: 問卷資料放置於ftp://203.68.0.44,檔名為『打字訓練.sav』。 本題結論: 本例為單尾檢定。應以『顯著性(雙尾)』除以2是否小於所指定=0.05值進行判斷。依結果:自由度為9,t統計值為-.547, 『顯著性(雙尾)』=0.598除以2為0.299 =0.05,故無法拒絕虛無假設,表示此套訓練並無法讓學生每分鐘多打40個字。
練習題二:成對樣本T檢定 假定,要比較一套新減肥法之效果,隨機抽取12位受測者,進行測試一個月。減肥前及減肥後之體重資料存於『減肥成效.sav』檔案中,在=0.05之水準下,檢定是否表示此套減肥法可讓受測者至少減少5公斤?本例應先以『轉換/計算』計算『減肥後』-5之值為何?存入『後減5』變數。再取『減肥前』與『後減5』進行配對T檢定。其假設如下所示: 問卷資料放置於ftp://203.68.0.44,檔名為『減肥成效.sav』。 本題結論: 本例為單尾檢定。應以『顯著性(雙尾)』除以2是否小於所指定=0.05值進行判斷。依結果:此套新減肥法至少可讓受測者平均減5公斤。