第 9 章 假設檢定 Part A (9.1-9.4)
統計實例 1827 年 John Morrell 公司成立於英國 ,是美國歷史最久的肉品製造商。 最近的一項市場研究調查了消費者對 該公司的牛肉製品及另外兩種競爭品牌的偏好程度。在三種產品的比較檢驗中,被選中的消費者針對口味、外觀、香味,以及整體偏好進行評比。 這項研究的問題之一是,是否有 50% 以上的消費者偏好 Morrell 牛肉製品,以 p 表示偏好Morrell 牛肉製品的母體比例,研究問題的假設如下: Ho: p ≤ 0.50 Ha: p > 0.50 本章將介紹如何形成假設,以及進行諸如Morrell 公司所做的檢定。經由樣本資料的分析,我們可以決定是否支持或拒絕假設。 2 第9章假設檢定 Part A (9.1-9.4) 第328頁
第 9 章 假設檢定 Part A 9.1 建立虛無假設與對立假設 9.2 型 I 錯誤和型 II 錯誤 9.3 母體平均數:σ 已知 9.1 建立虛無假設與對立假設 9.2 型 I 錯誤和型 II 錯誤 9.3 母體平均數:σ 已知 9.4 母體平均數:σ 未知 3 第9章假設檢定 Part A (9.1-9.4) 第329 - 350頁
虛無假設與對立假設 假設檢定主要內容在說明如何利用假設檢定,以決定要不要拒絕某項針對母體參數所建立的假設。 在假設檢定中,我們首先針對母體參數做一個暫時性的假設,此假設稱為虛無假設 (null hypothesis),以 H0 表示。 然後再建立另外一個假設,稱為對立假設(alternative hypothesis),以 Ha 表示,它與虛無假設的敘述剛好相反。 假設檢定的過程即在利用樣本資料檢驗 H0 和 Ha 兩個對立的敘述。 4 第9章假設檢定 Part A (9.1-9.4) 第329 - 330頁
9.1 建立虛無假設與對立假設 檢定研究的假設 檢定一項宣稱的有效性 決策時的檢定 虛無假設與獨立假設的各種形式 5 9.1 建立虛無假設與對立假設 檢定研究的假設 檢定一項宣稱的有效性 決策時的檢定 虛無假設與獨立假設的各種形式 5 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 檢定研究的假設 研究的假設應表達為對立假設。 假若樣本資料顯示出應拒絕虛無假設, 即可下結論說:此研究性的假設為真。 6 第9章假設檢定 Part A (9.1-9.4) 第330頁
建立虛無假設與對立假設 檢定研究的假設 某種款式的汽車平均每加侖汽油可行駛 24 哩,現有一製造研究小組發明一種新的化油器系統來增加每加侖汽油可行駛的哩程數。為了評估這種系統的好壞,該小組製造了幾個化油器,並安裝在汽車上進行哩程測試。該小組想要找到足夠的證據顯示新的化油器的確可以使哩程數超過 24 哩,即 μ> 24。一般而言,研究的假設常被定為對立假設,因此這個研究的虛無假設和對立假設即為 H0 : μ ≤ 24 Ha : μ > 24 7 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 如果樣本結果顯示不能拒絕 H0,則研究人員就不能認定新的化油系統可以增加哩程數;但如果樣本資料顯示可以拒絕 H0,則研究人員即可推論 Ha:μ > 24 為真。有了這個結論,研究人員就有統計的支持,可認為新化油器的確可以增加哩程數,然後就可開始生產新的化油器系統。 8 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 檢定研究的假設 在諸如此類的研究中,虛無假設和對立假設的建立原則是,如果拒絕 H0,就是支持研究的假設,必須採取某些新的行動,因此研究的假設應表達為對立假設。 9 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 檢定一項宣稱的有效性 我們通常會對廠商的宣稱給予善意的回應,並將其敘述視為虛無假設。 假若樣本資料顯示出應拒絕虛無假設,即可下結論說:此宣稱為偽。我們通常會先對廠商的宣稱稱為偽。 10 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 檢定一項宣稱的有效性 某飲料製造商宣稱,他們的 2 公升容器中平均至少裝有 67.6 盎司的飲料。現抽出若干 2 公升裝的飲料,以檢定此一宣稱。在此類的假設檢定中,我們通常先假設廠商的宣稱為真,除非有證據顯示其為假。因此,這個例子的虛無假設與對立假設是 Ho : μ ≥ 67. 6 Ha : μ < 67. 6 如果樣本結果顯示不能拒絕 H0,則廠商的宣稱就得以成立;但若樣本結果顯示 H0可以被拒絕,即 Ha:μ < 67.6 為真,則可知廠商的宣稱是不正確的,2 公升飲料瓶的平均裝瓶重量 小於 67.6 盎司,消費者可以進一步提出抗議。 11 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 檢定一項宣稱的有效性 在檢定某宣稱的有效性時,通常是在假設該宣稱為真的情況下,將此宣稱列為虛無假設,與此宣稱相反的狀況則為對立假設。因此,拒絕 H0 表示有統計上的證據讓我們質疑該宣稱的正確性。換言之,每當虛無假設被拒絕時,就該採取某些修正行動。 12 第9章假設檢定 Part A (9.1-9.4) 第329頁
建立虛無假設與對立假設 決策時的檢定 在檢定研究的假設或檢定宣稱的有效性時,如果拒絕 H0 才會有進一步的行動。但在許多實例中,不論 H0 被拒絕或不被拒絕都會採取行動。通常是發生在決策者必須在兩種可能的行動方案間做選擇的時候。 13 第9章假設檢定 Part A (9.1-9.4) 第330頁
建立虛無假設與對立假設 決策時的檢定 例如,在某批零件中,品管人員抽出部分為樣本,並藉以決定是否接受整批零件或因零件未符合規格而退回給供應商。假設零件規格長度平均為2 英寸,如果平均長度大於或小於 2 英寸,這些零件將在組裝時產生品質問題,因此虛無假設與對立假設如下。 H0 : μ = 2 Ha : μ ≠ 2 14 第9章假設檢定 Part A (9.1-9.4) 第330頁
建立虛無假設與對立假設 決策時的檢定 如果樣本結果顯示不能拒絕 H0,則品管人員沒有理由懷疑該批零件不符合規格,因此將接受整批零件。 因此,在本例中,我們可以看到不論是拒絕 H0 或不拒絕 H0,都會有所行動。 15 第9章假設檢定 Part A (9.1-9.4) 第330頁
虛無假設與對立假設的各種形式 母體參數的假設檢定共有三種可能形式:其中兩種在虛無假設中運用了不等式,另一種則使用等式。 就母體平均數的假設檢定而言,令 μ 代表虛無假設與對立假設所考慮的某一特定數值,一般而言,對於母體平均數 μ 的假設檢定有下列三種形式。 單尾檢定 (左尾檢定) 單尾檢定 (右尾檢定) 雙尾檢定 16 第9章假設檢定 Part A (9.1-9.4) 第330頁
9.2 型Ⅰ和型Ⅱ錯誤 因為假設檢定是以樣本資料為基礎,所以必須容許錯誤的可能性。 型 I 錯誤是 H0 為真,卻拒絕 H0。 9.2 型Ⅰ和型Ⅱ錯誤 因為假設檢定是以樣本資料為基礎,所以必須容許錯誤的可能性。 型 I 錯誤是 H0 為真,卻拒絕 H0。 顯著水準是在虛無假設中的等式關係為真時,犯下型 I 錯誤的機率。 17 第9章假設檢定 Part A (9.1-9.4) 第331頁
型Ⅰ和型Ⅱ錯誤 型 I 錯誤 當虛無假設中的等式關係為真時,犯型 I 錯誤的機率,稱為顯著水準 (level of significance)。 我們以希臘字母 α (alpha) 表示顯著水準,常用的 α 值是 0.05 及 0.01。 如果犯型 I 錯誤,必須付出極高的成本,則研究人員偏好較小的 α 值。只控制型 I 錯誤機率的假設檢定通常稱為顯著性檢定 (significance tests)。 18 第9章假設檢定 Part A (9.1-9.4) 第331 - 332頁
型Ⅰ和型Ⅱ錯誤 型 II 錯誤 型 II 錯誤是當 H0 為偽,卻不拒絕 H0。 統計學家通常建議我們用「不拒絕 H0」(do not reject H0),而不用「接受 H0」(accept H0) 的陳述。 19 第9章假設檢定 Part A (9.1-9.4) 第332頁
型Ⅰ和型Ⅱ錯誤 事實 H0 為真 Ha 為真 結論 不接受 H0 正確的結論 型 II 錯誤 拒絕 H0 型 I 錯誤 正確的結論 20 第9章假設檢定 Part A (9.1-9.4) 第331頁 表9.1
9.3 母體平均數:σ 已知 母體平均數的單尾檢定 (one-tailed tests) 有以下兩種形式: 左尾檢定 右尾檢定 21 9.3 母體平均數:σ 已知 母體平均數的單尾檢定 (one-tailed tests) 有以下兩種形式: 左尾檢定 右尾檢定 21 第9章假設檢定 Part A (9.1-9.4) 第334頁
母體平均數:σ 已知 母體平均數假設檢定的檢定統計量:σ 己知 22 第9章假設檢定 Part A (9.1-9.4) 第335頁 圖9.1
母體平均數:σ 已知 左尾檢定的關鍵問題是:z 值必須多小,才能拒絕虛無假設?有兩個方法可以提供解答。 第一個方法使用檢定統計量 z 值來計算稱為 p 值(p-value) 的機率。P 值可衡量樣本支持(或不支持)虛無假設的程度,在已知的顯著水準下,可用以判定是否拒絕虛無假設。 第二種方法則需要先決定一個檢定統計量的值,稱為臨界值(critical value) 。 23 第9章假設檢定 Part A (9.1-9.4) 第336頁
單尾檢定的 p 值法 p值是機率,以檢定統計量計算而得,用以衡量樣本資料支持 (或不支持) 虛無假設的程度。由於 p 值是機率,其值介於 0 與 1 之間。 p 值愈小,愈不支持虛無假設。較小的 p 值表示,虛無假設為真時,得到此種樣本是較不尋常的。 若 p 值 ≤ α,則拒絕 H0。 24 第9章假設檢定 Part A (9.1-9.4) 第336 - 337頁
單尾檢定的臨界值法 在 σ 已知時,檢定統計量 z 的抽樣分配是標準常態分配。 假設檢定量的值建立在拒絕域稱為稱為檢定的臨界值拒絕法則為: 左尾檢定:拒絕 H0 若 z ≤ - z α 右尾檢定:拒絕 H0 若 z ≥ z α 25 第9章假設檢定 Part A (9.1-9.4) 第338頁
假設檢定的步驟 步驟 1. 建立虛無與對立假設。 步驟 2. 確認顯著水準。 步驟 3. 蒐集樣本資料、計算檢定統計量的值。 p 值法 步驟 5. 若 p 值 ≤ α ,則拒絕 H0。 26 第9章假設檢定 Part A (9.1-9.4) 第338頁
假設檢定的步驟 臨界值法 步驟 4. 運用顯著水準決定臨界值與拒絕法則。 步驟 5. 運用檢定統計量的值與拒絕法則判定是否 拒絕 H0。 步驟 5. 運用檢定統計量的值與拒絕法則判定是否 拒絕 H0。 27 第9章假設檢定 Part A (9.1-9.4) 第338頁
母體平均數:σ 已知 (實例) 美國聯邦貿易委員會 (FTC) 定期檢驗製造商的宣稱或保證。例如,Hilltop 咖啡在其大罐裝咖啡上標示每罐內容物有 3 磅,FTC 瞭解 Hilltop 咖啡的製程不可能讓每罐咖啡恰好重 3 磅。但是,只要母體的平均重量至少 3 磅,消費者權益即受到保障。因此,FTC 將 Hilltop 在咖啡罐上的標籤所提供的訊息視為 Hilltop 的宣稱,即母體的平均裝填重量為每罐至少 3 磅。我們將說明 FTC 如何進行左尾檢定,以檢驗 Hilltop 的宣稱。 28 第9章假設檢定 Part A (9.1-9.4) 第334頁
母體平均數:σ 已知 (實例) 步驟 1. 建立適當的虛無和對立假設。 步驟 1. 建立適當的虛無和對立假設。 如果咖啡的母體平均裝罐重量大於 3 磅,則 Hilltop 的宣稱是正確的,所以這是虛無假設;但如果母體平均的裝罐重量小於 3 磅,則 Hilltop 的宣稱就不正確,這是對立假設。以 μ 代表母體的平均重量,則虛無與對立假設可表示為 H0 : μ ≥ 3 Ha : μ < 3 29 第9章假設檢定 Part A (9.1-9.4) 第342頁
母體平均數:σ 已知 (實例) 步驟 2. 確認顯著水準 α 步驟 3. 蒐集樣本資料、計算統計檢定量的值 步驟 2. 確認顯著水準 α FTC的主管選擇以 0.01 為檢定的顯著水準。α=0.01表示FTC的主管願意接受 0.01 的機率在虛無假設的等號(μ= 3)成立時,拒絕虛無假設。 步驟 3. 蒐集樣本資料、計算統計檢定量的值 檢定統計量 樣本資料 30 第9章假設檢定 Part A (9.1-9.4) 第342頁
母體平均數:σ 已知 (實例) p 值法 步驟 4. 運用檢定統計量的值求得 p 值 步驟 5. 若 p-值 ≤ α,則拒絕 H0 運用標準常態分配表可以發現,介於平均數及 z=-2.67 之間的面積是0.4962。因此,p 值是 0.5000-0.4962=0.0038。 步驟 5. 若 p-值 ≤ α,則拒絕 H0 p 值是 0.0038,因此拒絕虛無假設。 31 第9章假設檢定 Part A (9.1-9.4) 第342頁
母體平均數:σ 已知 (實例) 32 第9章假設檢定 Part A (9.1-9.4) 第337頁 圖9.2
母體平均數:σ 已知 (實例) 臨界值法 步驟 4. 運用顯著水準決定臨界值與拒絕法則。 步驟 4. 運用顯著水準決定臨界值與拒絕法則。 運用標準常態分配表可以看到,對應於左尾面積 α =0.01 的 z=-2.33 (見圖 9.3)。 33 第9章假設檢定 Part A (9.1-9.4) 第338頁 圖9.3
母體平均數:σ 已知 (實例) 步驟 5. 運用檢定統計量的值與拒絕法則判定是否拒絕 H0。 檢定統計量若小於等於 -2.33,對應的 p 值將小於等於 0.01,我們就拒絕 H0。所以,Hilltop 咖啡研究中,顯著水準為 0.01 時的拒絕法則是 若 z <-2.33,則拒絕 H0 Hilltop 咖啡的例子中, =2.92,檢定統計量 z=-2.67,因為 z=-2.67 , -2.33,我們可以拒絕 H0,得到的結論是 Hilltop 咖啡有偷斤減兩的問題。 34 第9章假設檢定 Part A (9.1-9.4) 第338頁
雙尾假設檢定 假設檢定中,母體平均數的雙尾檢定 (two-tailed test) 之一般形式如下: 35 第9章假設檢定 Part A (9.1-9.4) 第339頁
雙尾假設檢定的 p 值法 雙尾檢定的 p 值計算過程簡化為以下三個步驟 拒絕法則是: 若 p 值 ≤ α,則拒絕H0 計算檢定統計量 z 的值。 如果檢定統計量的值在右尾 (z > 0) ,求出標準常態曲線下方,在 z 值以右的面積。如果檢定統計量的值在左尾 (z < 0),求出標準常態曲線下方,在 z 值以左的面積。 將步驟 2 得到的面積 (即機率) 乘以 2,即為 p 值。 拒絕法則是: 若 p 值 ≤ α,則拒絕H0 36 第9章假設檢定 Part A (9.1-9.4) 第341頁
雙尾假設檢定的臨界值法 利用比較檢定統計量 z 與臨界值,以進行雙尾檢 定。 查標準常態分配表可知檢定統計量的臨界值是 -zα/2 與 zα/2。(位於分配表兩尾臨界值以外,由 α/2 所對應的 z 值) 拒絕法則是: 若 z < -zα/2 或 z > zα/2,則拒絕 H0 37 第9章假設檢定 Part A (9.1-9.4) 第342頁
雙尾假設檢定(實例) 美國高爾夫協會 (USGA) 為高爾夫球具擬定製造規格,所有球具、裝備皆需符合規格,才能在 USGA 舉辦的賽事中使用,MaxFlight 公司運用高科技製程生產高爾夫球,高爾夫球的平均移動距離是 295 碼。有時因製程調整不當,平均移動距離與 295 碼有所出入。 如果低於 295 碼,將與廣告所宣稱的不符,MaxFlight 擔心會失去訂單,不利銷售。 如果超過 295 碼,MaxFlight 的高爾夫球將被拒於 USGA 的賽事以外。 38 第9章假設檢定 Part A (9.1-9.4) 第339頁
雙尾假設檢定(實例) MaxFlight 的品質管制計畫會定期抽取 50 個高爾夫球為樣本以監控製程。對每組樣本而言,假設檢定的目的在於決定是否要調整製程。我們要建立虛無假設與對立假設,首先假定製程正常,即高爾夫球的平均移動距離是 295 碼。此即為虛無假設,對立假設則是平均距離不等於 295 碼。 39 第9章假設檢定 Part A (9.1-9.4) 第339頁
雙尾假設檢定(實例) 40 第9章假設檢定 Part A (9.1-9.4) 第340頁 圖9.4
雙尾假設檢定(實例) 步驟 1. 假設值 μ 0=295,MaxFlight 假設檢定的虛無假設與對立假設分別是: H0 : μ = 295 Ha : μ ≠ 295 步驟 2. 品管小組選擇 α =0.05為檢定的顯著水準。 41 第9章假設檢定 Part A (9.1-9.4) 第343頁
雙尾假設檢定(實例) 步驟 3. 統計檢定量 樣本資料:σ = 12 ,樣本大小 n =50, = 297.6 碼,因此統計檢定量是 42 第9章假設檢定 Part A (9.1-9.4) 第340頁
雙尾假設檢定- p 值法(實例) p 值法 步驟 4. 步驟 5. 雙尾檢定的 p 值是 P(z ≤ -1.53) + P(z ≥ 1.53)= 2(0.0630) = 0.1260 步驟 5. 比較 p 值與顯著水準,以判斷是否拒絕虛無假設,顯著水準 α = 0.05,因為 p 值=0.1260 > 0.05,所以不拒絕 H0。由於不拒絕虛無假設,MaxFlight無須對製程進行調整。 43 第9章假設檢定 Part A (9.1-9.4) 第340頁
雙尾假設檢定- p 值法(實例) 44 第9章假設檢定 Part A (9.1-9.4) 第341頁 圖9.5
雙尾假設檢定-臨界值法(實例) 臨界值法 步驟 4. 顯著水準 α =0.05,位於兩尾的臨界值以外的面積各為 α /2=0.05/2=0.025。 查標準常態分配表可知,檢定統計量的臨界值是 -z0.025=-1.96 與 z0.025=1.96。 45 第9章假設檢定 Part A (9.1-9.4) 第341頁
雙尾假設檢定-臨界值法(實例) 46 第9章假設檢定 Part A (9.1-9.4) 第341頁 圖9.6
雙尾假設檢定-臨界值法(實例) 步驟 5. 因此,運用臨界值法雙尾檢定的拒絕法則是 若 z ≤ -1.96 或 z ≥1.96,則拒絕H0 由於 MaxFlight 問題的假設檢定量為 z=1.53,表示在 0.05 的顯著水準下,統計上的證據不支持拒絕虛無假設。 47 第9章假設檢定 Part A (9.1-9.4) 第342頁
區間估計與假設檢定的關係 48 第9章假設檢定 Part A (9.1-9.4) 第342頁 表9.2
母體平均數的雙尾檢定-信賴區間檢定 自母體取簡單隨機樣本,以樣本平均數 建立母體平均數 μ 的信賴區間 自母體取簡單隨機樣本,以樣本平均數 建立母體平均數 μ 的信賴區間 如果信賴區間包含假設值 μ0,不拒絕 H0;否則,拒絕 H0。 49 第9章假設檢定 Part A (9.1-9.4) 第343頁
母體平均數的雙尾檢定-信賴區間檢定 再以 MaxFlight 的假設檢定為例,雙尾檢定的假設如下 在 α =0.05 的顯著水準下,檢定上述假設。我們抽出 50 顆高爾夫球為樣本,樣本平均數 =297.6 碼。已知母體標準差 σ =12。z0.025=1.96,以上述數值可得到母體平均數的 95% 信賴區間估計值是 或 294.3 到 300.9 50 第9章假設檢定 Part A (9.1-9.4) 第343頁
母體平均數的雙尾檢定-信賴區間檢定 上述區間讓品管經理可以得到如下的結論:我們有 95% 的信心,所有高爾夫球的母體平均距離介於 294.3 到 300.9 碼。 由於母體平均數的假設值是 μ0=295,落在信賴區間以內,所以,假設檢定的結論是不拒絕虛無假設 H0:μ =295 51 第9章假設檢定 Part A (9.1-9.4) 第344頁
9.4 母體平均數:σ未知 母體平均數假設檢定的檢定統計量: σ未知 檢定統計量的機率分配是自由度為 n - 1 的 t 分配。 52 9.4 母體平均數:σ未知 母體平均數假設檢定的檢定統計量: σ未知 檢定統計量的機率分配是自由度為 n - 1 的 t 分配。 52 第9章假設檢定 Part A (9.1-9.4) 第348頁
母體平均數單尾檢定:σ未知 拒絕法則: p 值法 若 p 值 ≤ α ,則拒絕 H0 拒絕法則: 臨界值法 若t ≤ -tα,則拒絕 H0 若t ≤ - tα/2 or t ≥ tα/2,則拒絕 H0 53 第9章假設檢定 Part A (9.1-9.4) 第350頁
p 值法與 t 分配 大部分教科書所附的 t 分配表,皆無法詳細提供 所有確切的 p 值。 雖然機率表並未提供確切的 p 值,但是我們仍可 界定 p 值的範圍區間。 運用 Minitab 與 Excel 等電腦軟體可輕易得到檢定 統計量 t 所對應的確切 p 值。 54 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數單尾檢定:σ未知(實例) 某商務旅行雜誌想根據商務旅客的平均評比,將機場進行分級。評分自 0 至 10 分,若平均評比高於 7 分,則列為優良服務機場。該雜誌在每個機場取得 60 位旅客的評分。 倫敦 Heathrow 機場得到的樣本平均評比是 =7.25,樣本標準差則是 s =1.052。樣本資料是否支持 Heathrow 機場被列為優良服務機場呢? 55 第9章假設檢定 Part A (9.1-9.4) 第348頁
母體平均數單尾檢定:σ未知(實例) 我們要進行的假設檢定是,如果拒絕 H0,結論則是 Heathrow 機場的平均評比大於 7。因此,我們需要的是右尾檢定,Ha:μ >7。此右尾檢定的虛無及對立假設是 H0 : μ ≤ 7 Ha : μ > 7 我們以 α =0.05為此檢定的顯著水準。 56 第9章假設檢定 Part A (9.1-9.4) 第348頁
母體平均數單尾檢定:σ未知(實例) 運用式 (9.4), =7.25, s=1.052, n=60,檢定統計量的值是 抽樣分配是自由度為 n-1 = 60-1=59 的 t 分配。由於是右尾檢定,p 值是 t 分配曲線下,t =1.84 右方的面積。 57 第9章假設檢定 Part A (9.1-9.4) 第348頁
母體平均數單尾檢定:σ未知(實例) p -值法 t =1.84對應的 p 值。舉例而言,附錄 B 的表2,自由度為 59 的 t 分配有以下的機率值。 我們可看到 t=1.84 介於 1.671 與 2.001 之間,雖然機率表並未提供確切的 p 值,但是上表的「右尾面積」顯示 p 值應小於 0.05,大於 0.025。顯著水準 α =0.05 時,此訊息足以讓我們決定拒絕虛無假設,且將 Heathrow 機場列為優良服務機場。 58 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數單尾檢定:σ未知(實例) 運用 Minitab 與 Excel 等電腦軟體可輕易得到檢定統計量 t =1.84 時,對應的確切 p 值。例如,圖 9.8 的 Minitab 報表顯示,樣本平均數 =7.25,樣本標準差 s =1.052 (四捨五入),檢定統計量 t= 1.84,確切的 p 值為 0.035。p 值=0.035<0.05,因此拒絕虛無假設,得到的結論是 Heathrow 機場應被列為優良服務機場。附錄 9.1 會逐步說明得到圖 9.8 的報表所需的步驟。 59 第9章假設檢定 Part A (9.1-9.4) 第349頁 圖9.8
母體平均數單尾檢定:σ未知(實例) 臨界值法 α =0.05,自由度為 59 的 t 分配,t0.05=1.671 是檢定的臨界值。因此,拒絕法則是 若 t ≥ 1.671,則拒絕H0 檢定統計量 t=1.84 ≥ 1.671,H0被拒絕,而且得到的結論是 Heathrow 機場應被列為優良服務機場。 60 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數雙尾檢定:σ未知(實例) Holiday 玩具公司製造玩具,並有 1,000 多家零售點。為了規劃冬季的生產水準,在知道零售點的需求前,必須先決定每種產品的產量。以本年度最重要的新玩具而言,Holiday 公司的行銷主管預期每個零售點的平均需求是 40 件。在根據這些估計訂定最終生產計畫前,該公司決定調查 25 個零售商以便取得更多關於新產品需求量的訊息。Holiday 公司提供零售商新產品的樣式外觀、成本,以及建議零售價。然後再要求零售商提出預計的訂購量。 61 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數雙尾檢定:σ未知(實例) 以 μ 表示母體平均訂購量,我們要以樣本資料進行以下雙尾假設檢定: H0 : μ = 40 Ha : μ 40 如果不能拒絕 H0,Holiday 將根據行銷主管的估計,即每個零售點的平均訂購量 μ=40 單位來制定生產計畫。然而,若是拒絕 H0,Holiday 公司會立即重新評估該產品的生產計畫。如果零售點的平均訂購量大於或小於 40 件,Holiday 都會重新評估生產計畫,因此,應該採取雙尾檢定。由於沒有歷史資料可供參考 (該產品是新產品),必須以樣本資料的 與 s 估計母體平均數 μ 與母體標準差。 62 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數雙尾檢定:σ未知(實例) 25 個零售點的樣本,得到平均數 =37.4及標準差 s =11.79。 進一步運用 t 分配之前,分析人員繪製樣本資料的直方圖,以檢視母體分配的形狀。樣本資料的直方圖看不出明顯的偏態與極端的異常值,因此,分析人員判定以自由度 n-1=24 的 t 分配是適宜的。 運用式(9.4), =37.4, μ0=40, s=11.79,以及 n=25,檢定統計量的值是 63 第9章假設檢定 Part A (9.1-9.4) 第349頁
母體平均數雙尾檢定:σ未知(實例) 由於本題是雙尾檢定,p 值是 t 分配曲線下方,t=-1.10 左方面積的兩倍。 查閱附錄 B 的表 2,自由度 24 的 t 分配有以下的機率值。 64 第9章假設檢定 Part A (9.1-9.4) 第350頁
母體平均數雙尾檢定:σ未知(實例) t 分配表只列出正的 t 值,由於 t 分配是對稱的,我們可找出 t =1.10以右的面積,並將之乘以 2,即為 p 值。 t=1.10,介於 0.858 與 1.318 之間,由上表的右尾面積可看出 t=1.10 右方的面積介於 0.20 與 0.10。將此值乘以 2可知,p 值必然介於 0.40 到 0.20。 顯著水準 α =0.05,我們可看出 p 值大於 α。因此,不能拒絕 H0,所以並沒有充分的證據支持 Holiday 公司修改生產計畫。 運用 Minitab 或 Excel,我們可得確切的 p 值為 0.282。 圖 9.9 顯示 t 分配下方對應確切 p 值的面積。 65 第9章假設檢定 Part A (9.1-9.4) 第350頁
母體平均數雙尾檢定:σ未知(實例) 66 第9章假設檢定 Part A (9.1-9.4) 第頁 圖9.9
母體平均數雙尾檢定:σ未知(實例) 也可比較檢定統計量與臨界值以得到雙尾假設檢定的結論。α =0.05,自由度 24 的 t 分配, -t0.025=-2.064 及 t0.025=2.064 是雙尾檢定的臨界值。使用檢定統計量的拒絕法則是 若 t ≤-2.064或 t ≥ 2.064,則拒絕H0 由於檢定統計量 t=-1.10,無法拒絕 H0 。此結果表示,Holiday 應該繼續以原來的預測值,即 μ =40 來進行生產規劃 67 第9章假設檢定 Part A (9.1-9.4) 第350頁
母體平均數:σ未知 68 第9章假設檢定 Part A (9.1-9.4) 第350頁 表9.3
End of Chapter 9, Part A