第 10 章 單組樣本的假設檢定
目標 定義假設與假設檢定。 描述假設檢定的 5 個步驟。 區別單尾檢定與雙尾檢定間的不同。 進行母體平均數的假設檢定。 進行母體比例的假設檢定。 定義型 I 與型 II 誤差。
何謂假設? 假設是一個關於母體參數的陳述,之後則使用資料與計算機率驗證這個陳述是否合理。 母體參數的假設例子為: 對於系統分析師的平均月收入為 $3,625。 Bovine’s Chop House 約有 20% 的顧客會在一個月內來用餐兩次。
何謂假設檢定? 假設檢定(hypothesis testing):基於樣本證據與機率理論來判斷假設是否合理而要接受,或是假設不合理而要拒絕的過程。
假設檢定的五個步驟
步驟 1:建立虛無假設與對立假設 虛無假設(null hypothesis)H0 :關於母體參數值的假設性敘述。 對立假設(alternate hypothesis)H1 :當樣本資料提供足夠證明虛無假設不為真時,接受的對立敘述就是對立假設。
母體平均數的假設檢定有三種情形 1. 2. 3. 記得虛無假設始終包含等式
定義 型 I 誤差(type I error): 當虛無假設 H0 為真時卻被拒絕, 用 表示。 型 II 誤差(type II error): 當虛無假設不正確時卻被接受, 用 表示。
步驟 2:選擇顯著水準
單尾檢定 當對立假設 H1 ,表示一個方向時,即為單尾檢定,例如: H1:行駛在 I-95 公路上的卡車時數每小時小於 60 英里。(µ < 60) H1:對於加油的顧客,付現的人數少於 20 %。(µ < 20)
在 0.05 顯著水準與右尾檢定下的 z 統計量抽樣分配
雙尾檢定 如果對立假設並沒有指出一個方向時,我們使用雙尾檢定。 例如: H1:Georgetown 城沃爾瑪百貨每位顧客的平均消費金額不等於 $25。(µ ≠ $25) H1:每加侖汽車售價不等於 $1.54。(µ ≠ $1.54)
雙尾檢定的不拒絕域與拒絕域,顯著水準為 0.05
步驟 3:決定檢定統計量 檢定統計量(test statistic):一個由樣本資訊所計算出來的統計值,用來決定是否要拒絕這個虛無假設。
母體平均數檢定,其中母體標準差已知 在大樣本與母體標準差已知的情形下,母體平均數的檢定統計量為:
步驟 4:制訂決策法則 臨界值(critical value):介於虛無假設拒絕域與接受域間的分隔點。
範例 位在紐約州西部的 Jamestown 鋼鐵公司,主要製造及組裝書桌或其他辦公室設備。在 Fredonia分廠中,每週生產的 A325 型號書桌數量服從常態分配,其平均數為 200 張、標準差為 16 張書桌。最近由於市場需求增加,該工廠引進新的生產方式並雇用了新的員工。公司副總裁想要調查 A325 型號書桌在引進新的生產方式後,產量是否有改變。換句話說,在 0.01 的顯著水準下,Fredonia 分廠的平均書桌產量是否為 200張?
範例 continued H0: μ = 200;H1: μ≠ 200 步驟 1:建立虛無假設與對立假設。 步驟 2:選擇顯著水準。 如題目所述,使用 0.01 的顯著水準。 步驟 3:選擇樣本統計量。 母體服從常態分配,且母體標準差σ已知,使用 z分配做為檢定統計量。
範例 continued 步驟 4:決定決策法則。 決策法則的制定,是先從附錄 B.1 中找出 z 的臨界值。由於這個範例是雙尾檢定,因此在兩尾內的機率是 0.01 的一半,即 0.005。在左右兩尾之間的面積 0.99 即為不拒絕 H0 的機率。因為附錄 B.1 基於曲線下右半邊的面積,也就是 0.5;再由0.5-0.005 = 0.495,得出在 0 至臨界值間的面積是 0.495;查表得出最接近 0.495的機率值是 0.4951,而其相對應的 z 值為 2.58。
範例 continued 顯著水準為 0.01 的決策法則
範例 continued 決定決策法則。 若 z > 2.58或 z < -2.58,則拒絕 H0 步驟 5:做決策。
範例 continued 計算結果是 1.55 未落在拒絕域內,因此不拒絕 H0。結論是母體平均數與 200 張書桌沒有差異,因此根據樣本證據顯示:Fredonia 分廠的每週產量與原先的平均產量 200 張書桌沒有顯著的不同,而母體平均週產量與去年週產量間的差距 3.5 單位,可能導因於抽樣誤差。
假設檢定的 p- 值法 此方法在於計算樣本統計量的值至少與實際觀測值一樣大的機率(假設虛無假設為真),其檢定程序是將機率值,稱為 p 值,與顯著水準進行比較。
假設檢定的 p- 值法 如果 p-值比顯著水準小,則拒絕 H0;如果 p- 值比顯著水準大,則不拒絕H0。
P- 值計算 單尾檢定: p- 值= P{z ≥ 檢定統計量} 雙尾檢定: p- 值= P{z ≥ 檢定統計量的絕對值} = 2(0.5-0.4251) = 0.1498。 因為 0.1498 > 0 .05,所以不拒絕 H0。
p值假設檢定 - Example H1: > 200 拒絕 H0 若f Z > Z 上個問題,利用p值檢定: 其中 Z = 1.55 and Z =2.33 拒絕H0 若 p-value < 0.0606 不小於 0.01 結論: 不能拒絕 H0
p值小於 之意義? =0.10,具有一些證據證明 H0 不真。 = 0.05,具有較強證據證明H0 不真。
母體平均數檢定:大樣本與母體標準差已知 因為母體標準差σ已知,且樣本個數 n大於 30,計算公式如下所示:
母體平均數檢定:大樣本與母體標準差未知 因為母體標準差未知,因此使用樣本標準差來估計σ。同樣的,若樣本個數 n 大於 30,可以使用 s 來代替σ,計算公式如下所示:
母體平均數檢定:小樣本與母體平均數未知 必須使用 t 分配取代標準常態分配。 其檢定統計量為:
範例 在 0.01 的顯著水準下,可以說處理理賠案件的平均成本低於 $60 嗎? McFarland保險公司處理一件理賠案件需要花費 $60。與其他保險公司比較,McFarland 保險公司處理理賠案件的成本比其他公司高,因此該公司進行了降低成本的計畫。為了評估降低成本計畫的成效,McFarland 保險公司隨機抽選最近的 26 件理賠案件,其樣本資料如下所示: 在 0.01 的顯著水準下,可以說處理理賠案件的平均成本低於 $60 嗎?
範例 continued 步驟 1:建立虛無假設與對立假設。 H0: µ ≥ 60;H1: µ < 60 步驟 2:選擇顯著水準。 其為 0.01
範例 continued 步驟 3: 計算檢定統計量。 檢定統計量是 t 分 配。 因為樣本數小於 30。 我們可以合理地假設每件理賠案件的平均成本服從常態分配。
範例 continued 步驟 4:陳述決策法則。 附錄 B.2 表格最左邊的那一行標示為 df(自由度),即樣本內觀測資料數量減去樣本的組數,寫成 n-1。此範例的樣本數量是 26,組數是 1 組,所以自由度是26-1 = 25,在表格中找到自由度是 25 的那一列。此範例為單尾檢定,因此在表格中找到標示單尾部分,找出顯著水準 0.01 的那一行,再從左邊找到自由度為 25 的那一列,交叉點是 2.485,也就是所計算之檢定統計量值。此外,又因本例為單尾檢定且拒絕域在左邊,所以臨界值為負數(-2.485)。而決策法則是如果t值小於-2.485,就必須拒絕H0。
範例 continued 步驟 5:做決策。 26 個樣本的平均成本是 $56.42,樣本標準差是 $10.04。把這些值代入公式 [10-2] 中,計算出 t 值: 因為-1.818 落在臨界值- 2.485 的右邊,所以在 0.01 顯著水準下,不能拒絕虛無假設。這表示降低成本計畫,並沒有將平均處理成本降至 $60 以下。也就是樣本平均數 $56.42與母體平均數 $60 之間的差距 $3.58,可能源自抽樣誤差。
t-Distribution Table (portion)
範例 continued t 分配的拒絕域,顯著水準為 0.01
範例 一個小型平衡錘的平均長度是 43 公釐。生產主管認為調整後的機器所生產之平衡錘的長度已經改變,他要求工程部門進行調查。工程部門選取了 12 個平衡錘的樣本進行測量。其測量結果如下表所示: 可以說平衡錘的平均長度已經改變了嗎?請使用 0.02 顯著水準。
範例 continued 先建立虛無假設與對立假設。 H0:μ = 43 H1:μ≠ 43 本例為雙尾檢定,且其自由度是 n-1 = 12-1 = 11。根據以上資料,從附錄B.2中的雙尾檢定,使用 0.02 顯著水準找出 t 值是2.718。 決策法則是:如果檢定統計量 t 落在-2.718的左邊或是 2.718 的右邊,則拒絕虛無假設。我們將上述資訊整理成圖10-7。
範例 continued t 分配雙尾檢定的拒絕域,其中α= 0.02
範例 continued 使用公式 [10-2] 計算 t 值:
Population Standard Deviation- Example 2 continued
母體比例的檢定 比例的定義是成功次數與觀測資料總數量的比例。
母體比例的檢定 計算樣本比例 p 的公式為
假設檢定,單一比例 π: 為母體比例 p :為樣本比例
範例 在前一次的印地安那州長選舉顯示,如果候選人要當選,那麼至少要在北區贏得 80% 的選票。現任州長想要了解繼續連任的機會有多大,他計畫在本州北區隨機抽選 2,000 位合格選民進行調查。 使用假設檢定的步驟,了解現任州長連任機會。
範例 continued 州長選舉的情形符合二項分配的條件,但這個範例可以使用常態分配去近似二項分配,因為nπ與 n(1-π) 皆超過 5。 n = 2,000,π= 0.8(π是在本州北區的得票率,也就是 80%),所以 nπ = 2,000 0.8 = 1,600與 n(1-π) = 2,000 (1-0.8) = 400 都大於 5,可以進行母體比例的檢定。
範例 continued 步驟 1:建立虛無假設與對立假設。 H0: π≥ 0.8;H1: π< 0.8 步驟 2:選擇顯著水準。 其為 0.05
範例 continued 步驟 3:選擇檢定統計量。 使用 z 統計量,
範例 continued 步驟 4:建立決策法則。 顯著水準是 0.05,這機率是左尾拒絕域的面積。因此,z 值介於 0與臨界值之間的機率是0.5-0.05 = 0.45。再參考附錄 B.1 中面積接近0.45所相對應的 z 值是 1.65。所以在左尾的臨界值是-1.65。因此決策法則是:如果透過樣本計算出來的檢定統計量小於-1.65時,必須拒絕虛無假設,並接受對立假設;反之,則不得拒絕虛無假設 H0。
範例 continued 步驟 5:做決策。 抽選 2,000 位合格選民進行調查,其中指出有1,550 位選民打算投給現任州長。樣本比例是1,550/2,000 = 0.775。
範例 continued z 值-2.8落在拒絕域中,因此在顯著水準0.05 下,拒絕虛無假設。 這表示在樣本比例 77.5% 與假設母體比例 80% 間,2.5%的差距在統計上是顯著的,因此差距可能不是抽樣誤差所引起的。換句話說,樣本證據無法支持現任州長會繼續連任的說法。
範例 continued p-值為計算 z 值小於-2.8的機率。從附錄 B.1 找出介於 0 至- 2.8 範圍內 z 值的機率是 0.4974,由此可知 p- 值是0.5-0.4974 = 0.0026。此 p- 值小於顯著水準 0.05,這表示州長要連任的機率非常小。
範例 continued 顯著水準 0.05 與單尾檢定的拒絕域