第十一章 假設檢定
概說 由於我們對母體的不瞭解,任何有關母體的敘述,都只是假設而已 (統計假設)。除非我們進行全面普查,否則,一個統計假設是對或 錯?根本就不可能獲得正確之答案。但因為絕大多數之情況,是不允 許也無法進行普查。所以,才會透過抽樣調查,以抽查結果所獲得的 資料,來檢定先前統計假設,以判斷其對或錯? 如果,檢定後發現抽樣結果與統計假設間之差異很大,我們就無法接 受該統計假設(亦即,否定或棄卻該假設)。反之,若檢定後發現抽 樣結果與統計假設間之差異不大,我們就無法棄卻(否定)該統計假 設。不過,我們會比較保守的說:無充分證據證明該假設是錯的;而 不直接說接受該統計假設。
在進行各種統計假設檢定時,我們通常將要否定(棄卻)之事實當作虛無假設 (null hypothesis,以H0代表)。既然希望它是不對,以將其否定,那就表 示會有一個希望它是對的對立假設(alternative hypothesis,以H1或Ha代 表)。當檢定結果,得否定該虛無假設時,就等於接受對立假設。注意,虛無 假設與對立假設間必須是週延且互斥,其間絕無重疊的模糊地帶;也無任何無 法涵蓋的真空地帶。如: H0:μ1=μ2 H1:μ1≠μ2 若安排成 H1:μ1≦μ2 就有等於時會發生重疊,而無法互斥。 但若安排成 H0:μ1<μ2 H1:μ1>μ2 則當兩者恰好等於時,就變成真空地帶,沒有被任一個假設涵蓋。
假設檢定之類型與單/雙尾檢定 等於與不等於之雙尾檢定 H0:μ1=μ2 H1:μ1≠μ2 無論檢定統計量之觀察值落在左側或右側之危險域(或稱棄卻域、拒 絕域),均表示μ1 ≠ μ2 。更詳細一點,若落在左側之危險域,表示μ1 <μ2;若落在右側之危險域,表示μ1>μ2。
等於與大於之右側單尾檢定 H0:μ1≦μ2 H1:μ1>μ2 或 H0:μ1=μ2 當檢定統計量之觀察值落右側之危險域,均表示μ1>μ2。
等於與小於之左側單尾檢定 H0:μ1≧μ2 H1:μ1<μ2 或 H0:μ1=μ2 當檢定統計量之觀察值落左側之危險域,均表示μ1<μ2。
檢定的步驟 設定虛無假設H0 設定對立假設H1 決定顯著水準(α) 選擇適當的檢定統計量(z、t、F、……),以及決定危險域(棄卻 域之臨界點) 計算所選之檢定統計量的觀察值 結論:當檢定統計量的觀察值落入危險域,棄卻虛無假設H0;反之, 無法棄卻虛無假設H0(接受虛無假設)
單一母體平均數檢定--大樣本Z檢定 單一母體,若母體標準差σ已知,其各項檢定所使用之檢定統計量為: 若處理對象為大樣本(n>30),且母體標準差σ未知,則可使用樣本 標準差S來替代: 於未使用電腦的情況,我們是查附錄二之『標準常態分配表』,若Z值 大於查表所得之臨界值(critical value),則棄卻虛無假設。
雙尾檢定 如範例Ch11.xlsx『單一母體平均數檢定』工作表A1:H5之資料 為自全班隨機抽取幾位學生之成績,於α=0.05之顯著水準,是否可接 受全班成績為70分之假設?
其處理步驟為: 設定虛無假設H0 H0:μ=70 設定對立假設H1 H1:μ≠70,為雙尾檢定 決定顯著水準(α)| α=0.05 選擇適當的檢定統計量,以及決定危險域 以Z檢定統計量,採雙尾檢定,應查α=0.025之表。 查附錄二之『標準常態分配表』,累積機率為0.475時,其棄卻域之臨界點為 1.96。所以,若Z檢定統計量<-1.96或>1.96,就應該棄卻虛無假設。 計算所選之檢定統計量的觀察值 將所求算之樣本均數與樣本標準差 =75.5、S=13.69及已知之μ=70,代入Z 檢定統計量之公式 結論 檢定統計量的觀察值Z=2.33>1.96之臨界值,已落入危險域,故應棄卻虛無 假設H0:μ=70。也就是應接受其對立假設H1:μ≠70。所以,無法接受全 班成績為70分之假設。
ZTEST()函數 若使用Excel,此一檢定結果,可直接以ZTEST()函數來求算,其語法 為: ZTEST(數列,μ,[σ]) ZTEST(array,μ,[sigma]) 將傳回單尾z檢定之P值(常態分配的單尾機率值)。即 1 – NORMSDIST(z) 之結果。式中,方括號所包圍之內容,表其可省略。z即常態分配之z 值。 故本函數即算出: 1 - 自標準常態分配的左尾累加到z值處的機率 即下圖之右尾的機率:
數列是要檢定相對於μ之陣列或資料範圍 μ是要檢定之母體均數 σ是母群體已知的標準差。若輸入有σ,本函數之公式為: 若省略σ,則自動使用樣本標準差,本函數之公式將為: 如: ZTEST(數列,μ) 表以樣本標準差代替母體標準差,取抽樣之數列的均數( )與母體均數 (μ)進行檢定。
判斷檢定結果時很簡單,只須看此P值是否小於所指定之α值(單尾檢定); 或小於所指定之α值的一半(雙尾檢定)。如:於雙尾檢定時,P若為 0 所以,範例Ch11.xlsx『單一母體平均數檢定』工作表資料,於D13以 =ZTEST(A1:H5,C7) 所求算出0.0098<0.025(雙尾檢定,取α/2),即可判定要棄卻虛無假設H0: μ=70;也就是應接受其對立假設H1:μ≠70。
既然有ZTEST(),即可不用再查表決定危險域(棄卻域之臨界點),也不用再 計算所選之檢定統計量的觀察值;而可直接以ZTEST()之機率值來判斷檢定結 果。 不過,本函數的計算基礎為μ≦ ;若μ> ,將會傳回大於0.5~1的值。如, 將前例之μ改為80,其結果竟為0.9899:(若將μ改為>84之任一值,其結果 將恆為1,詳範例Ch11.xlsx『單一母體平均數檢定2』工作表)
為避免此依不合理現象,可將其修正為: =MIN(ZTEST(array,x,[sigma]), 1 - ZTEST(array,x,[sigma])) 則無論μ≦ 或μ> ,均可算出正確值。如範例Ch11.xlsx『單一母體平均 數檢定3』工作表之C9,使用 =MIN(ZTEST(A1:H5,C7), 1 - ZTEST(A1:H5,C7)) 當μ為80(μ> ),ZTEST()之結果為0.0111;不再是先前的0.9889。其結 論當然完全不同:
即使,將其μ改回為70(μ< ),ZTEST()之結果仍可求得先前之0.0098:
單尾檢定 假定,五年前大學生每週平均運動時間為75分鐘,範例Ch11.xlsx 『運動時間』本年度之資料,是否可顯示本年度運動時間已經明顯增 加(α=0.05)? 解: H0:μ≦75 H1:μ>75,為右尾單尾檢定 α=0.05,右尾單尾檢定,直接以α=0.05進行判定 ZTEST-P值=0.046<α=0.05 結論;棄卻虛無假設,接受本年度每週運動時間均數超過75分鐘之對 立假設。 E11所使用之公式為: =MIN(ZTEST(B2:B116,F2), 1-ZTEST(B2:B116,F2))
馬上練習 假定,某報宣稱大學生一週平均飲料花費已≧100元。以問卷調查蒐集 範例Ch11.xlsx『飲料花費』之資料,是否可否定該結論(α=0.05)? H0:μ≧100 H1:μ<100,左尾單尾檢定 α=0.05,左尾單尾檢定,直接以α=0.05進行判定 ZTEST-P值=0.00<α=0.05 結論;棄卻虛無假設,可以否定該結論。接受大學生一週平均飲料花 費不超過100元之對立假設。
馬上練習 於全年級300位學生中,抽取範例Ch11.xlsx『成績』工作表之幾個學 生成績,是否可證明全年級之母體均數大於75分?(α=0.05) H0:μ≦75 H1:μ>75,右尾單尾檢定 α=0.05,右尾單尾檢定,直接以α=0.05進行判定 ZTEST-P值=0.19>α=0.05 結論;無法棄卻母體均數≦75分之虛無假設
小樣本 若樣本為抽自常態母體之小樣本(n≦30),且母體μ與σ均未知。其 各項檢定所使用之檢定統計量為: 分配之自由度為n-1。 假定,五年前行政院公佈大學生每月平均外食費用為4000元。假設其 分配為常態,範例Ch11.xlsx『外食費用-小樣本』工作表中之今年資 料,是否可證明學生每月平均外食費用超過4000元?(α=0.05) 檢定步驟為: 設定虛無假設H0 H0:μ≦4000 設定對立假設H1 H1:μ>4000 決定顯著水準(α) α=0.05
選擇適當的檢定統計量,以及決定危險域 以t檢定統計量,採右尾單尾檢定,樣本數n=15,應查t(14),α=0 選擇適當的檢定統計量,以及決定危險域 以t檢定統計量,採右尾單尾檢定,樣本數n=15,應查t(14),α=0.05之表。 查附錄四之『t分配的臨界值』,自由度為14,右尾機率為0.05時,其棄卻域 之臨界點為1.761。所以,若t檢定統計量>1.761,就應該棄卻虛無假設。 計算所選之檢定統計量的觀察值 將所求算之樣本均數 =6026.67與樣本標準差S=2879.35及已知之μ=4000, 代入t檢定統計量之公式 結論 檢定統計量的觀察值t=2.726>1.761之臨界值,已落入危險域,故應棄卻虛 無假設H0:μ≦4000;也就是應接受其對立假設H1:μ>4000。所以,大學 生每月平均外食費用應超過4000元。
馬上練習 本校去年學生平均通學距離為6.8公里,今年因商學院搬往另一校區, 假定其分配為常態,以範例Ch11.xlsx『通學距離-小樣本』工作表內 容,是否可證明今年學生平均通學距離大於去年?(α=0.05)
z檢定:兩個獨立大樣本母體平均數差異檢定 若曾安裝『分析工具箱』,則可以『資料分析』增益集之「z檢定:兩 個母體平均數差異檢定」,進行檢定兩個母體之平均數差異。不過, 其先決條件為母體變異數須為已知。若處理對象為大樣本(n>30), 且母體變異數σ2未知,則可使用樣本變異數S2來替代。 以範例Ch11.xlsx『男女之飲料花費』工作表為例,我們得先以 DVAR()求得男/女之飲料花費的變異數7875.85與6081.30:
然後,再依下示步驟檢定男/女之平均一週飲料花費是否存有顯著差異? 本例之虛無假設與對立假設分別為: H0:μ1-μ2=0 H1: μ1-μ2≠0 或簡化成 H0:μ1=μ2 H1: μ1≠μ2 假定,顯著水準設定為α=0.05,此為一雙尾檢定。其處理步驟為: 停於『性別』欄,切換到『資料』索引標籤,按『排序與篩選』群組之『從 最小到最大排序』鈕,依性別遞增排序,使相同性別之資料能集中在一起
切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「z檢定:兩個母體平均數差異檢定」 按 鈕
於『變數1的範圍』設定男性組資料之範圍(B2:B74) 於『假設的均數差』輸入0,兩均數若相等其差為0 於『變數1之變異數』與『變數2之變異數』處,輸入母體變異數(7875.85 與6081.30,因母體變異數未知,使用樣本變異數來替代) 不點選「標記(L)」(因兩組資料均不含字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E7位置
按 鈕結束,即可獲致檢定結果 由於本例僅在檢定其是否相等,故為一雙尾檢定。依此結果:z值1. 269679< 雙尾臨界值1 按 鈕結束,即可獲致檢定結果 由於本例僅在檢定其是否相等,故為一雙尾檢定。依此結果:z值1.269679< 雙尾臨界值1.959964(F17之P值為0.204199>α=0.05),故無法棄卻虛無假 設,也就是說男女之一週飲料花費均數並無顯著差異。
本例,也可以於依性別排序後,將其整理成兩欄資料:(詳範例Ch11.xlsx 『男女分組之飲料花費』工作表) 然後於各欄下,以VAR()求算其樣本變異數:
接著,再仿前述步驟進行『資料分析』之「z檢定:兩個母體平均數差異檢 定」:
亦可獲至相同結果,異於前例之處為資料範圍加有『標記』,故可顯示出『男 性』『女性』之標題:
事實上,「z檢定:兩個母體平均數差異檢定」所使用之公式為:若已知兩母 體之均數為μ1、μ2,母體之變異數為σ12、σ22,當兩母體為常態或樣本數均> 30,大樣本μ1-μ2之檢定統計量為: 式中,δ0為已知常數。 若處理對象為大樣本(n>30),且母體變異數σ12、σ22未知,則可使用樣本變 異數S12、S22來替代:
所以,將各組均數、變異數與樣本數代入公式(詳範例Ch11. xlsx『男女分組 之飲料花費1』工作表之L9) 所得之1 所以,將各組均數、變異數與樣本數代入公式(詳範例Ch11.xlsx『男女分組 之飲料花費1』工作表之L9) 所得之1.26968即為先前I9儲存格之內容。 若要求算其右尾單尾機率之P值,也可以直接以 =1-NORMSDIST(1.27) 亦可求得0.1021(詳範例Ch11.xlsx『男女分組之飲料花費1』工作表之L10), 即為先前I10儲存格之內容;若要求算雙尾機率之P值,也可以直接以 =(1-NORMSDIST(1.27))*2 亦可求得0.2042(詳範例Ch11.xlsx『男女分組之飲料花費1』工作表之L12), 即為先前I12儲存格之內容:
馬上練習 以範例Ch11.xlsx『男女運動時間之均數檢定』工作表內容 檢定男生平均運動時間是否大過女生?(α=0.10)
量表的檢定—兩組 對於如: 等之評價量表,我們也經常得以性別進行分組檢定。看對某依屬性之 注重程度,是否會因性別而有顯著差異?由於性別僅兩組,且我們的 問卷通常也都是大樣本,故也是以『資料分析』之「z檢定:兩個母體 平均數差異檢定」來進行檢定。
以範例Ch11.xlsx『男女性注重之手機屬性』工作表,其內僅安排一個『大小 適中』評價項目(非常重要-5、……、非常不重要-1)及性別資料(男-1、女 -2)。我們就以它來說明,如何依性別分組進行注重程度之均數檢定: 安排妥標題字串及條件內容,以DVAR()求出男女各組之變異數 停於『性別』欄,切換到『資料』索引標籤,按『排序與篩選』群組之『從 最小到最大排序』鈕,依性別遞增排序,使相同性別之資料能集中在一起 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「z檢定:兩個母體平均數差異檢定」,續按 鈕 於『變數1的範圍』設定男性組資料之範圍(B2:B78) 於『變數2的範圍』設定女性組資料之範圍(B79:B192)
於『假設的均數差』輸入0,兩均數若相等其差為0 於『變數1之變異數』與『變數2之變異數』處,輸入母體變異數(1.55與 1.14,因母體變異數未知,使用樣本變異數來替代) 不點選「標記(L)」(因兩組資料均不含字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E7位置
按 鈕結束,即可獲致檢定結果 由於本例之虛無假設及對立假設為: H0:μ1≧μ2 H1:μ1<μ2 α=0.05 此為一左尾單尾檢定,依此結果:z值之絕對值2.04439>單尾臨界值1.645(F15之P值為0.020<α=0.05),故應棄卻虛無假設,也就是說,女生對『大小適中』之著重程度顯著高過男生(3.991對3.636)。
馬上練習 依範例Ch11.xlsx『性別x注重之手機屬性』工作表內容,檢定女性對 『重量輕巧』屬性之注重程度,是否會高於男性?
於報告上量表檢定的寫法-兩組 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。 以「z檢定:兩個母體平均數差異檢定」來進行檢定,得一個一個逐一 進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是Excel並不是 專門的統計軟體,能做到這樣也算是不錯的了。 當然也可以將DAVERAGE()、DVAR()與DCOUNT()等函數,所求得 之分組均數、變異數及樣本數,代入 來計算z值,再利用 =(1-NORMSDIST(z))*2 =1-NORMSDIST(z) 來計算單/雙尾之機率P值:(詳範例Ch11.xlsx『手機屬性』工作表)
F欄處理分組均數、變異數、樣本數、Z值與P值之公式分別為: F194均數 =DAVERAGE($A$1:$AB$192,F$1,$D$194:$D$195) F195變異數 =DVAR($A$1:$AB$192,F$1,$D$194:$D$195) F196樣本數 =DCOUNT($A$1:$AB$192,F$1,$D$194:$D$195) F197均數 =DAVERAGE($A$1:$AB$192,F$1,$D$198:$D$199) F198變異數 =DVAR($A$1:$AB$192,F$1,$D$198:$D$199) F199樣本數 =DCOUNT($A$1:$AB$192,F$1,D198:D199) F200 z值 =(F194-F198)/SQRT((F195/$F$196)+(F199/$F$200)) F201 P值 =1-NORMSDIST(ABS(F202)) 最後,再利用轉置剪貼之技巧,將Z值與P值轉貼到下表(詳下文說明):
檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳 加解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: 根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁 波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。 經逐一以Z檢定依性別分組對其注重程度進行檢定,發現有『大小適中』、 『重量輕巧』、『符合人體工學』、『可掀蓋式』與『電磁波的傷害』等屬性 之注重程度會隨性別不同,而有顯著差異(P<α=0.05),這些項目,除『可 掀蓋式』外;著重程度均是女性較男性來得高些。其原因可能是女性一般較為 嬌小,當然不願其手機太大或太重且要符合人體工學!對於『電磁波的傷害』 也是女性較為重視,那應是女性較心細與嬌柔所致,男性通常較散漫,自認是 強壯的英雄,怎會怕那是否存在都不知道的電磁波?至於,『可掀蓋式』可能 是男性認為其較帥氣,所以較女性更注重此一屬性。
相關處理技巧 上表,AF4求男性組均數之公式為 =DAVERAGE($A$1:$AB$192,$AD4,AF$2:AF$3) 將其抄給AG4: AH4,可求得女性組及全體均數,其公式變為 =DAVERAGE($A$1:$AB$192,$AD4,AG$2:AG$3) =DAVERAGE($A$1:$AB$192,$AD4,AH$2:AH$3) 續將AF4: AH4抄給AF4: AH19,即可求得所有屬性之各組均數:
AF20求男性組樣本數之公式為 =DCOUNTA($A$1:$AB$192,1,AF2:AF3) 將其抄給AG20:AH20,可求得女性組及全體樣本數:
AI4求『大小適中』屬性之排名的公式為 =RANK(AH4,$AH$4:$AH$19) 將其抄給AI4:AI20,可求得全部屬性之注重程度的排名:
至於AJ欄之z值言,係由F202:U202轉置剪貼過來,其處理步驟為: 按『剪貼簿』群組之『貼上』鈕之向下箭頭,選「貼上值(V)」,將其等由公 式轉為常數。這純是為了方便後續步驟之轉置。若無此過程,轉置後,將無 法取得正確值!
於轉為常數之Z值(F206:U206),尚呈選取之狀態,按『剪貼簿』群組之 『複製』鈕,記下所有Z值的常數 移到『Z值』標題下之AJ4,按『剪貼簿』群組之『貼上』鈕之向下箭頭之向 下箭頭,選「轉置(T)」,可將原以列方式排列之所有屬性的Z值,轉置為以 欄方式排列,複製到AJ4:AJ20 AK欄之P值也可以仿前文之操作方式取得: 而AL欄之“*”號,則是於AL4以 =IF(AK4<0.05,"*","") 於判斷AK4之P值小於0.05時,轉為顯示出"*"號。將其抄給AL4:AL20即大 功告成。
t檢定TTEST()函數 TTEST(第一組資料,第二組資料,單尾或雙尾,類型) TTEST(array1,array2,tails,type) 是用來進行兩組小樣本(n<30)資料之均數檢定,或成對樣本的均數 差檢定。除成對樣本外,兩組資料之樣本數允許不同。 單尾或雙尾是以1或2來標示,其類型則可分為下列三種: 1 成對 2 具有相同變異數的二個樣本 3 具有不同變異數的二個樣本 本函所回應之值為其右尾之機率(P),判斷檢定結果時很簡單,只須 看此P值是否小於所指定顯著水準之α值(單尾);或α值的一半(雙 尾)。
每個取樣必須隨機(random)且獨立(independent)。 所取樣本的母群體必須為常態分配(normal distribution)。 由於,t分配是取決於樣本大小(n);當樣本數超過30(n>30),t-分配就頗接近 常態分佈,故檢定時可改查常態分配表,或使用『資料分析』之「z檢定:兩 個母體平均數差異檢定」。
兩獨立小樣本均數檢定(變異數相同) 兩樣本平均數的t檢定,旨在比較變異數相同的兩個母群之間平均數的 差異,或比較來自同一母群之兩個獨立樣本之均數的不同。 若兩母群體之變異數相同(σ12=σ22),是採用匯總變異數t檢定 (pooled-variance t test)。其相關公式為: 式中, 即是匯總變異數
假定,班上男女生之成績的變異數相同。依範例Ch11. xlsx『T-TEST1』工作 表之抽樣資料,是否可證明在α=0 由於是變異數相同,t檢定之類型為2。且虛無假設與對立假設分別為: H0:μ1=μ2 H1:μ1≠μ2 故此類檢定為雙尾。所以,B15處之公式為 =TTEST(B2:B11,C2:C9,2,2)
由其TTEST()函數所獲得之P值為0. 019<α/2=0. 025,故將棄卻男女成績相等 之虛無假設。也就是說,在α=0 同樣之例子,若使用『資料分析』。其處理步驟為:(詳範例Ch11.xlsx『T- TEST2』工作表) 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「t檢定:兩個母體平均數差異檢定,假設變異數相等」 續 鈕
於『變數1的範圍』與『變數2的範圍』設定兩組資料之範圍(B1:B11與 C1:C9) 於『假設的均數差』輸入0,兩均數若相等其差為0 點選「標記(L)」(因兩組資料均含『男』、『女』之字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E1位置
按 鈕結束,即可獲致檢定結果 由於本例僅在檢定其是否相等,故為一雙尾檢定。依此結果:自由度為16,t 統計值之絕對值2.6009>雙尾臨界值2.1199(F13處之P值0.019<α/2=0.025, 同於B15),故得棄卻男女成績均數相等之虛無假設(兩者存有顯著差異, 女性明顯高於男性)。
馬上練習 假定,兩年度之所得變異數相同。若α=0.05,範例Ch11.xlsx『T- Test變異數相同』工作表資料,是否表示2006年之每月所得明顯高過 2003年:(此為單尾檢定) 無法棄卻2003年度的每月所得大於等於2006年度之虛無假設
兩獨立小樣本均數檢定(變異數不同) 若兩母群體之變異數不同(σ12≠σ22),則將用個別變異數的t統計量 (Cochran & Cox法)。其相關公式為: 請注意,其自由度已不再是兩母群體之變異數相等時簡單的 d.f.=N1+N2-2,依此處公式計算之自由度可能會含小數。 假定,甲乙兩班成績的變異數不相同。依範例Ch11.xlsx『T-TEST3』 工作表之抽樣資料,是否可證明在α=0.05之顯著水準下,甲班成績優 於乙班?
由於是變異數不同,t檢定之類型為3。且虛無假設與對立假設分別為: H0:μ1≦μ2 H1:μ1>μ2 故此類檢定為右側單尾檢定。所以,B15處之公式為: =TTEST(B2:B8,C2:C11,1,3)
由其TTEST()函數所獲得之P值為0. 023<α=0. 05,故將棄卻甲班成績≦乙班成 績之虛無假設。也就是說,在α=0 同樣之例子,若使用『資料分析』,其處理步驟為:(詳範例Ch11.xlsx『T- TEST4』工作表) 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「t檢定:兩個母體平均數差的檢定,假設變異數不相等」 按 鈕
於『變數1的範圍』與『變數2的範圍』設定兩組資料之範圍(B1:B8與 C1:C11) 於『假設的均數差』輸入0,兩均數若相等其差為0 點選「標記(L)」(因兩組資料均含『甲班』、『乙班』之字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E2位置
按 鈕結束,即可獲致檢定結果 由於本例是在檢定甲班平均是否大於乙班平均,故為一右側單尾檢定。依此 結果:自由度為14,t統計值2.183>單尾臨界值1.761(F11處之P值 0.023<α=0.05,同於B15),故得棄卻甲班平均成績≦乙班平均成績之虛無 假設,接受甲班平均成績>乙班平均成績之對立假設。
馬上練習 假定,兩地區之所得變異數不同。若α=0.05,範例Ch11.xlsx『T- Test變異數不同』工作表內容,是否表示甲地區之所得明顯高過乙地 區:(此為單尾檢定) 甲地區之所得明顯高過乙地區
成對樣本 前面兩類『兩獨立樣本均數檢定』,無論其變異數是否相等,其共通 點為兩組受測樣本間為獨立,並無任何關聯。如:甲乙班、男女生、 兩不同年度、都市與鄉村、……。 但若同組人,受訓後的打字速度是否高於受訓前。同一部車,左右使 用不同廠牌輪胎,經過一段時間後,檢查其磨損程度,看甲廠牌之輪 胎是否優於乙廠牌?……。諸如此類之例子,兩組受測樣本間為相依 (同一個人、同一部車),就要使用配對樣本的t檢定。 其相關公式為: 式中,d即同一配對之兩資料相減之差。
假定,要比較兩廠牌輪胎之壽命。抽7部車,左右使用不同廠牌輪胎,每車各 由同一個人駕駛(同一駕駛習慣),經過一段時間後,獲得下示輪胎磨損之配 對資料(以千分之一吋為單位,詳範例Ch11.xlsx『T-TEST5』工作表)。是 否可證明,在α=0.05之顯著水準下,甲廠牌之輪胎磨損程度較乙廠牌大? 由於是配對樣本,t檢定之類型為1。且虛無假設與對立假設分別為: H0:μd≦0 H1:μd>0 故此類檢定為右側單尾。所以,B12處之公式為 =TTEST(B2:B8,C2:C8,1,1)
由其TTEST()函數所獲得之P值為0. 03<α=0. 05,故將棄卻甲乙廠輪胎的耐磨 程度相等之虛無假設。也就是說,在α=0 同樣之例子,若使用『資料分析』,其處理步驟為:(詳範例Ch11.xlsx『T- TEST6』工作表) 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「t檢定:成對母體平均數差異檢定」 按 鈕
於『變數1的範圍』與『變數2的範圍』設定兩組資料之範圍(B1:B8與 C1:C8) 於『假設的均數差』輸入0,配對均數若相等其差為0 點選「標記(L)」(因兩組資料均含『甲廠』、『乙廠』之字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之F2位置
按 鈕結束,即可獲致檢定結果 由於本例是在檢定甲廠牌輪胎磨損程度是否大於乙廠牌,故為一單尾檢定。 依此結果:自由度為6,t統計值2.299>單尾臨界值1.943(G12處之P值 0.03<α=0.05,同於B12),故可知甲廠牌輪胎磨損程度大於乙廠牌。
馬上練習 假定,要比較一套新打字教法之效果。隨機抽取10位未經任何訓練之 學生,加以訓練。範例Ch11.xlsx『配對1』工作表,訓練前及訓練後 之每分鐘的打字速度(字),於α=0.05之水準下,是否表示此套訓練 可讓學生每分鐘平均多打40個字:(此為單尾檢定) (請注意,數字較大之『訓練後』數列,應置於『變數1』之範圍)
此例若要以TTEST()進行檢定,應另將訓練後之值-40置於另一新欄,再將其 與訓練前之值進行配對檢定:(範例Ch11 此例若要以TTEST()進行檢定,應另將訓練後之值-40置於另一新欄,再將其 與訓練前之值進行配對檢定:(範例Ch11.xlsx『配對2』工作表) 兩種方式,均顯示此套訓練並無法讓學生每分鐘多打40個字。
馬上練習 假定,要比較一套新減肥法之效果。隨機抽取12位受測者進行測試一 個月。範例Ch11.xlsx『配對3』工作表,減肥前及減肥後之體重(公 斤),於α=0.05之水準下,是否表示此套新減肥法可讓受測者至少減5 公斤:(此為單尾檢定) 答案:於α=0.05之水準下,此套新減肥法至少可讓受測者平均減5公斤
第十一章 結束 謝謝!