第9章 假設檢定
前言 如果在進行抽樣調查蒐集資料之前,就存在著某個關於母體參數的理論(又叫做假設),經過抽樣調查和資料分析後,就可以據以判斷是否該拒絕原先的假設。 例如理論指出手機電池的待機時數的平均數為60小時,而蒐集到的資料的95%信賴區間為46.08到53.92之間,並沒包括該參數的數值(60小時),可判定這個理論並不成立。
第一節 統計假設 (1) 假設分為兩種:研究假設和統計假設。研究假設通常以一般的陳述方式寫出,例如國人贊成興建核電廠的比率不到一半。進行統計分析時,就要換做統計的語言,這就變成統計假設。 統計假設的檢定就是將參數q分為兩個互斥且周延的兩個假設:虛無假設(null hypothesis)和對立假設(alternative hypothesis)。 所謂互斥且周延指的是我們將會從虛無假設和對立假設中擇一而用。虛無假設以H0表示,對立假設則以H1表示。
第一節 統計假設 (2) H0:q = q0,H1:q = q1; H0:q = q0,H1:q q0; 在虛無假設裡,都會有個等號,即等於某一個值。必須從理論來看這兩個假設是周延且互斥。
第一節 統計假設 (3) 對立假設是研究者最關心且想獲得的結果,必須是透過反證法(method of contradiction)才能得到。在虛無假設為真的情況下,得到這樣的資料的可能性是否很低?如果很低,表示虛無假設不是真的。 由於母體的情形無人知曉,無論是否要推翻虛無假設都可能出錯: 第一型錯誤a :虛無假設為真卻推翻它 第二型錯誤b :虛無假設為假卻接受它。
第一節 統計假設 (4) 通常寧可犯第二型錯誤,而不願犯第一型的錯誤,所以將a訂得很小,如0.1,0.05,或0.01。 b:新品較好卻沒說。嫌犯有罪卻沒說。 犯了第一型錯誤,其損失就是無端攪亂一湖春水。犯了第二型錯誤,其代價就是研究白做了。 虛無假設為假,而也推翻虛無假設,就是裁決正確,其機率為1-b,這稱為統計檢定力(power of test)。
第一節 統計假設 (5) 雙尾檢定 單尾檢定 H0:m = 5000 H1:m 5000 樣本平均數遠大於或遠小於5000,都推翻H0。
第一節 統計假設 (6) 在理論模糊的階段,多採用雙尾檢定。經過知識的累積,我們越有信心母體參數的方向,此時就宜改用單尾檢定。 例如想探討吃檳榔的人得到口腔癌的機率和不吃者的機率,如果對於檳榔和口腔癌的理解相當有限,就採雙尾檢定。隨著科技的進步,知道吃檳榔得口腔癌的機率不可能小於不吃者,屬於單尾檢定。
第一節 統計假設 (7) 訂顯著水準為a,在雙尾檢定時,一邊就是a/2。如果是單尾檢定,那麼只有一邊是a。無論是雙尾檢定或單尾檢定,實際在進行統計檢定時都是利用q = q0。 兩階段的假設檢定的缺失: 1. 第一型的錯誤機率不是a,而是a+a/2。 2. 這種作法不合邏輯。因為根據理論或前人研究而形成虛無假設,怎可因為實際資料就改變當初的虛無假設。
第一節 統計假設 (8) H0:m = 5000 H1:m 5000 母體標準差已知為1000。抽樣100個家庭,計算其平均支出 ,如果 大於5200或小於4800,就拒絕虛無假設。反之,則接受虛無假設。
第一節 統計假設 (9) 如果虛無假設為真, 由於決定 大於5200或小於4800,就拒絕虛無假設,因此犯第一型錯誤的機率就是圖1的灰色部分。 等於5200的z值為:
第一節 統計假設 (10) 如果母體平均數不是5000,而是5100。那麼犯第二型錯誤的機會又有多大呢?由於若在4800和5200之間,就接受虛無假設,因此就犯了第二型錯誤。如果文化支出不是5000,而是5100,則 的分佈並不是圖1,而是圖2中右邊的分佈。 圖2右邊分佈的平均數是5100,標準差是100。圖2中灰色面積就是犯第二型錯誤的機率。
第一節 統計假設 (11) a 與b 的特性 1. 調整決策條件,可以使得第一型錯誤降低。 2. 降低a會增加b 。 1. 調整決策條件,可以使得第一型錯誤降低。 2. 降低a會增加b 。 3. 參數值與虛無假設越接近,b越大。 4. 降低s2/n可以降低a 。提高n比降低s2容易。 5. 當固定a時,降低s2/n可降低b 。只要H1為真,增加樣本數,必然可以成功拒絕虛無假設。
第二節 一個母體平均數的檢定 (1) 母體變異數已知的Z檢定 ~ N(m, s2/n) ,因此 是Z分佈。 如果從樣本求得的z值超出a顯著水準的標準常態分佈的z值,在此稱為臨界值(critical value),就拒絕虛無假設。
第二節 一個母體平均數的檢定 (2) 如果計算的z值超過臨界值,表示在虛無假設為真的情況下,會得到這樣的樣本平均數的可能性很低,因此虛無假設不大可能為真。 如果求得的z值並沒超過臨界值,表示在虛無假設為真的情況下,仍然有可能會得到這樣的樣本平均數,因此無法推翻虛無假設。 公式(9.1)稱為檢定式(test statistic)
第二節 一個母體平均數的檢定 (3) 採不放回抽樣,且樣本數佔母體數的比例不小 是Z分佈 若樣本的z值超出臨界值,就拒絕虛無假設,
第二節 一個母體平均數的檢定 (4) 例子1 過去的研究指出國小學童的智商為常態分佈N(105, 225),我們認為時代改變了,很可能智商平均數和過去不一樣。於是隨機抽樣1000位學童,得到樣本平均數105.92,試問是否可以推翻過去的研究結果?
第二節 一個母體平均數的檢定 (5) 作法 H0:m = 105 H1:m 105 計算檢定式,得 由於計算的z值1.94,並沒超過顯著水準為0.05的臨界值1.96,因此無法拒絕虛無假設。
第二節 一個母體平均數的檢定 (6) 如果顯著水準a訂為0.1,臨界值變為1.645,而1.94超出臨界值,可以拒絕虛無假設。 z值超過1.94的面積,就是第一型錯誤機率: P( Z > 1.94) + P( Z < -1.94) = 0.052 這個面積稱為p值。若p值大於a值,則無法於a顯著水準下,拒絕虛無假設。此例中,由於p值0.052大於a值0.05,因此無法於0.05顯著水準拒絕虛無假設,但可以於0.052以上水準時拒絕虛無假設。
第二節 一個母體平均數的檢定 (7) 例子2 作法 如果當初的母體為5000人,結果會如何? 母體數5000相對於樣本數1000,並不是很大, 超過0.05水準的臨界值1.96,可拒絕虛無假設。
第二節 一個母體平均數的檢定 (8) 母體變異數未知的t檢定 用樣本變異數估計母體變異數,則 是自由度為n-1的t分佈。如果求得的T超出a顯著水準的t分佈的臨界值,就拒絕虛無假設而接受對立假設。
第二節 一個母體平均數的檢定 (9) 不放回抽樣,且樣本數佔母體數的比例不小 是自由度為n-1的t分佈。如果求得的T超出a顯著水準的t分佈的臨界值,就拒絕虛無假設。
第二節 一個母體平均數的檢定 (10) 例子3 如果例子1的母體變異數未知,只能由這1000個受試者計算樣本變異數。假設為210,則可否拒絕虛無假設? 作法 2.008超過臨界值為1.962,因此拒絕虛無假設。
第二節 一個母體平均數的檢定 (11) 作法 例子4 假如當初母體數只有5000人,結果會如何? 母體數5000相對於樣本數1000,並不是很大, 超過0.05水準臨界值1.962,可拒絕虛無假設。
第三節 兩母體平均數差異的假設檢定 (1) 獨立樣本 :母體變異數已知的Z檢定 有兩個常態分佈母體, 和 為已知。從這兩個母體中獨立隨機抽出大小為n1和n2的樣本,求其樣本平均數 和 ,則 是Z分佈 若樣本的z值超出臨界值,就拒絕虛無假設,
第三節 兩母體平均數差異的假設檢定 (2) 如果母體不是常態分佈,但樣本數n1和n2都很大,依照中央極限定理,公式(9.5)會近似標準常態分佈,因此仍然可以進行假設檢定。 如果是採不放回抽樣,且樣本數佔母體數的比例不小,則要考慮有限母體校正因子:
第三節 兩母體平均數差異的假設檢定 (3) 例子5 某研究者想瞭解喝啤酒對注意力的影響,他隨機分派各50人至實驗組和控制組中。實驗組的要喝一瓶啤酒,控制組則喝一瓶開水。然後測試他們的注意力,總分0至100分,越高表示注意力越好。已知依照過去的經驗,喝啤酒或喝白開水的人的注意力的變異數都是25。現得到實驗組的平均數為55,控制組為58。實驗組的平均數是否顯著的比控制組的平均數來得低?
第三節 兩母體平均數差異的假設檢定 (4) 作法 H0:m1- m2 = 0 H1:m1- m2 < 0 小於顯著水準為0.05的臨界值-1.645,p值為0.0014小於顯著水準0.05,因此拒絕虛無假設。
第三節 兩母體平均數差異的假設檢定 (5) 母體變異數未知:大樣本 如果從變異數未知的母體中獨立隨機抽出n1和n2的樣本,求其樣本平均數 和 , 如果樣本數n1和n2夠大(如均大於25),可用Z檢定。 其中 和 分別是這兩個樣本的變異數。
第三節 兩母體平均數差異的假設檢定 (6) 不放回抽樣,且樣本數佔母體數的比例不小
第三節 兩母體平均數差異的假設檢定 (7) 例子6 某電子公司最近新增建了一個工廠,他們想知道這個新工廠所生產的電子產品的平均壽命是否和舊廠一樣,於是從兩廠中各隨機抽取50件產品,測其壽命,結果發現新廠的樣本平均數和變異數分別為25.5和9.0,舊廠的樣本平均數和變異數分別為24.7和8.6。兩廠產品的壽命是否有顯著差異?
第三節 兩母體平均數差異的假設檢定 (8) 作法 H0:m1 - m2 = 0 H1:m1 - m2 0 無法拒絕虛無假設
第三節 兩母體平均數差異的假設檢定 (9) 母體變異數未知但相等:小樣本抽樣 如果是小樣本,必須假設兩母體是常態分佈,至少近似常態分佈。此外如果 就將樣本變異數合併以估計母體變異數:
第三節 兩母體平均數差異的假設檢定 (10) 是自由度n1+n2-2的t分佈。 T若超出t分佈的臨界值,就拒絕虛無假設。採不放回抽樣,而且樣本數佔母體數的比例不小:
第三節 兩母體平均數差異的假設檢定 (11) 例子7 在一項壓力管理訓練裡,實驗者隨機分派20位受試者至實驗組(有某種壓力管理技巧訓練)和控制組(只是些和壓力控制無關的活動),每組10人。經過四週的訓練後,測其壓力控制指數(指數越高表示控制越好)。得到實驗組的樣本平均數和變異數分別為68和26,控制組則為62和20。這個壓力管理技巧訓練有效嗎?
第三節 兩母體平均數差異的假設檢定 (12) 作法 H0:m1 - m2 = 0 H1:m1 - m2 > 0 超過臨界值2.55,或p值0.006小於顯著水準0.01,因此拒絕虛無假設。
第三節 兩母體平均數差異的假設檢定 (13) 母體變異數未知且不等:小樣本抽樣 並不是t分佈,只是近似t分佈,且自由度為
第三節 兩母體平均數差異的假設檢定 (14) 採不放回抽樣,且樣本數佔母體數的比例不小:
第三節 兩母體平均數差異的假設檢定 (15) 例子8 承例子7,如果母體變異數相同的的假設並不成立,如何檢定兩組平均數是否成立? 作法
第三節 兩母體平均數差異的假設檢定 (16) 在兩獨立樣本的平均數差異檢定方面,如果兩母體的分佈形狀類似,或都是對稱分佈,即使母體不是常態分佈,用公式(9.10)也無妨。 同理,如果兩樣本數相等,用公式(9.10)來檢定仍然是恰當的,即使兩母體變異數不相等。 如果上述條件都不成立,且樣本數又小,用無母數統計通常比用t檢定有著較高的統計檢定力
第三節 兩母體平均數差異的假設檢定 (17) 相依樣本 要比較兩個樣本平均數的差異 m1 - m2是否等於0,就像是比較這個相減後的平均數mD 是否等於0。因此 是自由度為n - 1的t分佈 如果求得的T超出a顯著水準的t分佈的臨界值,就拒絕虛無假設。
第三節 兩母體平均數差異的假設檢定 (18) 不放回抽樣,且樣本數佔母體數的比例不小:
第三節 兩母體平均數差異的假設檢定 (19) 例子9 在一個減肥課程裡,隨機抽取10位學員,記錄參加課程前後體重的變化。以參加前體重減去參加後體重就是減輕的效果。經過一個月的訓練後,這10位學員減輕效果的平均數為9.5公斤,變異數為208.06。課程有效嗎?
第三節 兩母體平均數差異的假設檢定 (20) 作法 H0:mD = 0 H1:mD 0 並未超過臨界值2.26,因此接受虛無假設。 如果誤把成對觀測值當作兩獨立樣本來檢定,通常不易拒絕虛無假設。
第四節 變異數的假設檢定 (1) 一個母體變異數 從變異數為s2的常態分佈母體中,隨機抽出大小為n的樣本,得樣本變數為S2。則 如果X2超出a顯著水準的卡方分佈的臨界值, 就拒絕虛無假設。
第四節 變異數的假設檢定 (2) 例子10 某貿易商在和某電視生產廠商的合約書裡,要求生產的27吋平面電視,規格不可誤差太大,變異數不可超過0.05吋,否則全數退貨。在交貨的當日,該貿易商隨機抽取15台電視,量其螢幕尺寸,結果發現樣本變異數為0.075。試問貿易商可以要求退貨嗎?
第四節 變異數的假設檢定 (3) 作法 H0:s2 0.05 H1:s2 > 0.05 小於臨界值29.14,因此無法拒絕虛無假設。
第四節 變異數的假設檢定 (4) 兩母體變異數比值 若從兩個獨立常態母體中分別抽出大小為n1和n2的樣本,求其樣本變異數為和。那麼 是自由度為n1 - 1和n2 - 1的F分佈。如果計算之 F超出a水準的F分佈臨界值,就拒絕虛無假設
第四節 變異數的假設檢定 (5) 在進行兩樣本平均數差異的t檢定時,須假設兩母體的變異數相等。公式(9.18)派得上用場。 若虛無假設為 ,公式(9.18)簡化為: 用F分佈檢定之。如果計算的F值超過臨界值,就拒絕虛無假設,而宣稱兩母體變異數不等。
第四節 變異數的假設檢定 (5) 例子11 研究者想瞭解傳統演講法和啟發法對學生的效果是否一樣。他將30位學童隨機分派到演講法和啟發法的班級,每班15人。經過一學期的教學,所有的學童接受期末考試。結果發現演講法和啟發法的樣本變異數分別為22.17和185.97。試問這兩種教學方法的變異數是否相等?
第四節 變異數的假設檢定 (6) 作法 超過了臨界值(0.40, 2.48), 可拒絕虛無假設,
第五節 比率的假設檢定 (1) 一母體比率 受試者是否同意為白努力事件,同意的機率為p,則樣本中同意人數Y為二項式分佈。若樣本數n很大,那麼Y會趨近常態分佈,平均數為np ,變異數為np(1-p)。Y/n的平均數為p,變異數為p(1- p)/n。 樣本比率成功p = Y/n,因此 趨近標準常態分佈。若樣本的z超出a顯著水準 的標準常態分佈的臨界值,就拒絕虛無假設。
第五節 比率的假設檢定 (2) 例子12 某縣長宣稱該縣自來水普及率至少達85%,他的競選對手懷疑這個比率,因此隨機調查500個家庭,結果發現只有400個家庭有自來水,他可否藉此宣稱該縣長說法不實?
第五節 比率的假設檢定 (3) 作法 H0:p 0.85 H1:p < 0.85 小於0.05顯著水準的臨界值-1.645,可以說該縣長的說法不實。
第五節 比率的假設檢定 (4) 如果是小樣本,二項式分佈不會趨近常態分佈,所以最好直接計算二項式的機率,以檢定之。 在單尾檢定下,可以用算得的機率直接與顯著水準a相比,如果小於a,就拒絕虛無假設。 在雙尾的檢定下,計算的機率要加倍後才與a比較,若小於a,就拒絕虛無假設。
第五節 比率的假設檢定 (5) 例子13 作法 承上題,不過只抽樣20個家庭,發現有16個家庭有自來水,可否推翻縣長的說法? 在p等於0.85的情況下,成功次數為15(含)以下的機率: 大於顯著水準0.05,所以無法拒絕虛無假設。即無法宣稱該縣長說法不實。
第五節 比率的假設檢定 (6) 兩獨立母體的比率差異 若有兩獨立樣本,如果n1和n2夠大,p1 和p2會趨近常態分佈,平均數分別為母體比率p1和p 2,變異數為p1 (1-p1)/n1和p2 (1-p2)/n2,而且 趨近Z分佈。
第五節 比率的假設檢定 (7) 若虛無假設是p1 = p 2,並令p1 = p 2 = p,則 因此 如果樣本的z超出a顯著水準的標準常態分佈的z值,就拒絕虛無假設。
第五節 比率的假設檢定 (8) 例子14 某民意調查機構想瞭解大眾對興建核電廠的支持比率,隨機抽樣男女各500人,結果發現男性受訪者有220人贊成,女性受訪者有260人贊成。男女的支持度是否有異?
第五節 比率的假設檢定 (9) 作法 H0:p1 = p 2 H1:p1 p 2 超過臨界值1.96,拒絕虛無假設。