第 9 章 假設檢定 Part B (9.5-9.8)
第9章 假設檢定 Part B 9.5 母體比例 9.6 假設檢定與決策 9.7 計算型 II 錯誤的機率 9.5 母體比例 9.6 假設檢定與決策 9.7 計算型 II 錯誤的機率 9.8 在檢定母體平均數時決定樣本大小 第9章假設檢定 Part B (9.5-9.8) 第329頁
9.5 母體比例 以 p 代表母體比例,而以 p0 代表母體比例的特定假設值,有關母體比例的假設檢定有下列三種形式。 單尾檢定 (左尾檢定) 9.5 母體比例 以 p 代表母體比例,而以 p0 代表母體比例的特定假設值,有關母體比例的假設檢定有下列三種形式。 單尾檢定 (左尾檢定) 單尾檢定 (右尾檢定) 雙尾檢定 第9章假設檢定 Part B (9.5-9.8) 第357頁
母體比例的檢定 檢定統計量 其中: 假設 np ≥ 5 且n(1 – p) ≥ 5 第9章假設檢定 Part B (9.5-9.8) 第358頁
若z ≤ -z 或 z ≥ z ,則拒絕 H0 母體比例的檢定 拒絕法則: p 值法 若 p 值 ≤ α,則拒絕 H0 拒絕法則:臨界值法 H0: pp 若z ≥ z ,則拒絕 H0 H0: pp 若z ≤ -z ,則拒絕 H0 H0: pp 若z ≤ -z 或 z ≥ z ,則拒絕 H0 第9章假設檢定 Part B (9.5-9.8) 第359頁
母體比例的檢定(實例) 過去數年,Pine Creek 高爾夫球場只有 20% 的女球友。為了提高女性打球的比例,Pine Creek 推出了一種優惠方案。優惠方案推行一個月之後,球場經理想經由統計研究來瞭解女球友的比例是否增加。由於研究的目的是確認女性球友比例是否增加? 第9章假設檢定 Part B (9.5-9.8) 第357頁
因此,右尾檢定 Ha:p > 0.20 是合適的。虛無和對立假設可敘述如下。 H0: p ≤ 0.20
母體比例的檢定(實例) 假設檢定程序的下一個步驟是選擇樣本及計算合適的檢定統計量的值。Pine Creek 的問題是右尾檢定,我們則先介紹任一形式的母體比例的假設檢定量的計算方法。樣本比例 是母體比例 p 的點估計量,也是建立檢定統計量的基礎。 虛無假設的等式為真時, 的期望值會等於假設值 p0;也就是說,E( )=p0, 的標準誤是 第9章假設檢定 Part B (9.5-9.8) 第357-358頁
母體比例的檢定(實例) 如果 np ≥ 5 以及 n(1-p) ≥ 5, 的抽樣分配能夠以常態分配來近似*。在此種條件下,以下的式子 是標準常態分配。 第9章假設檢定 Part B (9.5-9.8) 第358頁
母體比例的檢定(實例) 假定隨機樣本中有 400 位球友,其中 100 位是女性。女性球友在樣本中的比例是 運用式(9.6),檢定統計量的值是 第9章假設檢定 Part B (9.5-9.8) 第358頁
母體比例的檢定(實例) 由於 Pine Creek 假設檢定是右尾檢定,p 值是 z 值大於或等於 2.50 的機率;也就是說,在標準常態分配 z 值=2.50 右方的面積。利用常態分配表可知,z 值介於 0 至 2.5 之間的面積是 0.4938。因此,Pine Creek 假設檢定的 p 值是 0.5000-0.4938=0.0062。圖 9.10 是 p 值的計算方式。 第9章假設檢定 Part B (9.5-9.8) 第358頁
母體比例的檢定(實例) 第9章假設檢定 Part B (9.5-9.8) 第359頁 9.10圖
母體比例的檢定(實例) 球場經理設定的顯著水準是 α =0.05。而 p 值是0.0062<0.05,因此有充分的統計證據支持在 0.05的顯著水準下拒絕 H0。我們可以看到,對於「Pine Creek球 場的優惠促銷方案成功地提升女性球友的比例」一事,檢定提供了統計上的支持。 我們也可以用臨界值法來決定是否拒絕虛無假設。對應於右尾面積 0.05 的標準常態分配,臨界值是 z0.05=1.645。因此,使用臨界值法的拒絕法則是:如果 z ≥ 1.645,就拒絕 H0。由於 z=2.50,所以拒絕 H0。 第9章假設檢定 Part B (9.5-9.8) 第358頁
母體比例的檢定 第9章假設檢定 Part B (9.5-9.8) 第359頁 表9.4
9.6 假設檢定與決策 在某些情況下,無論結論是拒絕 H0 或者是不拒絕 H0,決策者都可能或不得不採取某些行動。 9.6 假設檢定與決策 在某些情況下,無論結論是拒絕 H0 或者是不拒絕 H0,決策者都可能或不得不採取某些行動。 不拒絕H0 的決策可能會發生型 II 錯誤 在這種決策情況下,我們會建議在假設檢定時,要進一步地考慮發生型Ⅱ錯誤的機率。 型 I 錯誤在顯著水準上已有控制 第9章假設檢定 Part B (9.5-9.8) 第362.363頁
假設檢定與決策實例 品管經理必須決定是否接受某批供應商提供的整批電池,或者是因為品質問題將整批電池退回。 假設規格要求-電池壽命至少有 120小時。為了評估這批電池的品質,抽樣了 36 個電池進行檢驗。根據樣本得到的結果來決定是否退貨。以 μ 表示這批電池的使用壽命,有關母體平均數的虛無及對立假設如下。 H0 : μ ≥ 120 Ha : μ < 120 第9章假設檢定 Part B (9.5-9.8) 第363頁
假設檢定與決策實例 假如拒絕 H0,結論就是,對立假設為真。這個結論表示適當的處置方式是將電池退還給供應商。 雖然沒有直接得到 H0為真的結論,只是不拒絕 H0,決策者還是要視同該批電池合乎品質要求,而決定接受該批電池。 在這種決策情況下,建議要進一步地考慮發生型Ⅱ錯誤的機率。 第9章假設檢定 Part B (9.5-9.8) 第363頁
9.7 計算型Ⅱ錯誤的機率 建立虛無假設及對立假設。 以顯著水準 α 建立檢定統計量的拒絕法則。 9.7 計算型Ⅱ錯誤的機率 建立虛無假設及對立假設。 以顯著水準 α 建立檢定統計量的拒絕法則。 顯著水準是α = 0.05 利用拒絕法則,計算樣本平均數以確認檢定統計量的臨界值。 樣本數 n = 36 及 σ= 12 小時 利用臨界值法與 z0.05 = 1.645,拒絕法則是 若 z ≤ -1.645,則拒絕 H0 第9章假設檢定 Part B (9.5-9.8) 第365頁
計算型Ⅱ錯誤的機率 由步驟 3 的結果來描述各種會導致接受 H0 的樣本平均數的值,也就是定義出檢定的接受域。 從對立假設中找出任一 μ 值的 的抽樣分配,由步驟 4 得到的接受域,計算樣本平均數會落在接受域的機率。此機率即特定 μ 值下發生型 II 錯誤的機率。 假定該批電池的品質不佳,平均壽命只有 112 小時。如果 μ =112 是正確的,不拒絕 H0:μ ≥ 120 以致發生型Ⅱ錯誤的機率為何? 換句話說,電池供應商被發現給不好的產品的機率(1-β)為何? 第9章假設檢定 Part B (9.5-9.8) 第365-366頁
計算型Ⅱ錯誤的機率(實例) 圖9.11是 μ =112時 的抽樣分配。右尾的陰影面積是 >116.71 的機率。運用標準常態分配,在 =116.71 時,可得 第9章假設檢定 Part B (9.5-9.8) 第364頁
計算型Ⅱ錯誤的機率(實例) 我們可以用小於 120 的其他不同 μ 值,再重複上述的計算過程。這樣就可以得到在各個不同 μ 值時,發生型Ⅱ錯誤的機率。 例如,假定該批電池的平均壽命 μ =115 小時。因為只要 > 116.71,就不拒絕H0。所以,μ =115 時的 z 值是 查標準常態分配表,可看出 z=0.86的標準常態分配右尾面積是 0.5000-0.3051=0.1949。因此,μ=115 時,發生型Ⅱ錯誤的機率β=0.1949。 第9章假設檢定 Part B (9.5-9.8) 第364頁
計算型Ⅱ錯誤的機率(實例) 表 9.5 列出 μ < 120 時,不同 μ 值對應的型 II 錯誤的機率。請注意,在 μ 值愈接近 120 時,型 II 錯誤的機率就愈接近上限,即 0.95。 當 µ 離 120 愈遠,型 II 錯誤的機率就愈小。這種模式並不令人意外。做正確的判別機率會愈高(1-β)。 真正的母體平均數 µ 愈接近虛無假設的母體平均數值 µ=120 時,愈難判別H0與Ha為真,發生型 II 錯誤的機率就愈高。 第9章假設檢定 Part B (9.5-9.8) 第364頁
計算型Ⅱ錯誤的機率(實例) 第9章假設檢定 Part B (9.5-9.8) 第365頁 表9.5
檢定力 (power) 在虛無假設為偽時,正確地拒絕虛無假設的機率稱為假設檢定的檢定力 (power)。 對任何特定的 μ 值,檢定力是 1-β 。也就是說,正確地拒絕虛無假設的能力是 1 減去發生型 II 錯誤的機率。 表 9.5 也列出檢定力。將不同母體平均數的真正值與相對應的檢定力以圖形表示如圖 9.12,這個圖形稱為檢定力曲線 (power curve)。 請注意,檢定力的圖形範圍在虛無假設為偽的部分。某特定 μ 值下的檢定力曲線的高度,表示虛無假設為偽時,正確拒絕 H0 的機率 *。 第9章假設檢定 Part B (9.5-9.8) 第365頁
μ =112 β =0.0091 (代表電池品質不佳,平均續電力減為112小時,會被發現品質不佳的機率為1-β =0.9909) μ =115 β =0.1949 (代表電池品質不佳,平均續電力減為115小時,會被發現品質不佳的機率為1-β =0.9131) μ =118 β =0.7422 (代表電池品質不佳,平均續電力減為115小時,會被發現品質不佳的機率為1-β =0.2578)
計算型Ⅱ錯誤的機率(實例) 第9章假設檢定 Part B (9.5-9.8) 第365頁 圖9.12
檢定力曲線(Power function curve) 在固定的α 之下,當對立假設Ha存在時,經統計檢定而能拒絕Ho之機率值為1-β, 1-β代表檢定能力的大小。將這些不同Ha之下的1-β值連成曲線,即是檢定力曲線
9.8 在檢定母體平均數時決定樣本數 顯著水準決定發生型 I 錯誤的機率。 藉著控制樣本大小,檢定人員可同時控制發生型 II 錯誤的機率。 9.8 在檢定母體平均數時決定樣本數 顯著水準決定發生型 I 錯誤的機率。 藉著控制樣本大小,檢定人員可同時控制發生型 II 錯誤的機率。 第9章假設檢定 Part B (9.5-9.8) 第367頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小(實例) 回到 9.6 與 9.7 節驗收電池的例子。 驗收的標準是電池的平均壽命至少為 120 小時。如果拒絕 H0:μ ≥ 120,就拒收該批電池。假定品管經理對於可容忍的型Ⅰ及型Ⅱ錯誤的機率做了以下的敘述: 型 I 錯誤: 如果這批電池的平均壽命是 μ =120 小時,我願意承擔機率為α=0.05 的風險拒絕這批電池。 型 II 錯誤: 如果這批電池的平均壽命比要求的規格少了 5 小時,也就是 μ =115小時,我願意承擔 β =0.10的風險接受這批電池。 第9章假設檢定 Part B (9.5-9.8) 第369頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 在這個例子中,α = 0.05, β = 0.10。查標準常態機率分配表,z0.05 = 1.645, z0.10 = 1.28,從誤差機率的相關敘述可知μ0 = 120, μa = 115。母體標準差已知是12。 根據式 (9.9) ,我們可求得建議的樣本大小是 第9章假設檢定 Part B (9.5-9.8) 第370頁
有關 α, β,以及樣本數 n 的關係 三個數值中只要有兩個已知,就可以求出第三個數值。 給定顯著水準 α 以後,增加樣本數會降低 β 。 給定樣本數以後,α 增加則 β 減少,α 減少則 β 增加。 第9章假設檢定 Part B (9.5-9.8) 第370頁
在檢定母體平均數時決定樣本數 我們以母體平均數的左尾檢定來說明如何決定樣本數。 H0 : μ ≥ μ0 Ha : μ < μ0 第9章假設檢定 Part B (9.5-9.8) 第367-368頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 圖9.13的上半部是 H0為真,即 μ = μ0時的 的抽樣分配。由於是左尾檢定,檢定統計量的臨界值表示為-zα。圖形上有標示為 c 的垂直線,其中的 c 是 的對應值。 請注意,當 ≤ c 時,如果拒絕 H0,型Ⅰ錯誤的機率為 α。 若以 zα 表示標準常態分配時右尾面積為 α 的z值,則可利用下列公式求出 c。 第9章假設檢定 Part B (9.5-9.8) 第368頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 第9章假設檢定 Part B (9.5-9.8) 第368頁 圖9.13
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 我們可從以下公式計算 c 值 第9章假設檢定 Part B (9.5-9.8) 第368頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 解出等式中的 n 就可以決定樣本數 而且 第9章假設檢定 Part B (9.5-9.8) 第369頁
特定的型 I ( α) 錯誤及型 II ( β) 錯誤的水準下決定樣本大小 其中 z = 標準常態分配尾部面積為α時的 z 值 z = 標準常態分配尾部面積為β時的 z 值 = 母體標準差 0 = 虛無假設中母體平均數的值 a = 發生型Ⅱ錯誤時母體平均數的真實值 注意:若是雙尾檢定, z 則改為 z /2。 第9章假設檢定 Part B (9.5-9.8) 第369頁
練習 55 考慮下列的假設檢定。 H0 : μ = 20 Ha : μ ≠ 20 母體標準差是10,α=0.05。如果母體平均數的實際值是22,研究人員若想使發生型Ⅱ錯誤的機率控制在0.05,你建議的樣本大小為何? 325
End of Chapter 9, Part B