第 10 章單組樣本的假設檢定.

第 10 章單組樣本的假設檢定

目標定義假設與假設檢定。描述假設檢定的 5 個步驟。區別單尾檢定與雙尾檢定間的不同。進行母體平均數的假設檢定。
進行母體比例的假設檢定。定義型 I 與型 II 誤差。

何謂假設？假設是一個關於母體參數的陳述，之後則使用資料與計算機率驗證這個陳述是否合理。母體參數的假設例子為：
對於系統分析師的平均月收入為 $3,625。 Bovine’s Chop House 約有 20% 的顧客會在一個月內來用餐兩次。

何謂假設檢定？假設檢定(hypothesis testing)：基於樣本證據與機率理論來判斷假設是否合理而要接受，或是假設不合理而要拒絕的過程。

假設檢定的五個步驟

步驟 1：建立虛無假設與對立假設虛無假設（null hypothesis）H0 ：關於母體參數值的假設性敘述。
對立假設（alternate hypothesis）H1 ：當樣本資料提供足夠證明虛無假設不為真時，接受的對立敘述就是對立假設。

母體平均數的假設檢定有三種情形 1. 2. 3. 記得虛無假設始終包含等式

定義型 I 誤差（type I error）：當虛無假設 H0 為真時卻被拒絕，用表示。
型 II 誤差（type II error）：當虛無假設不正確時卻被接受，用表示。

步驟 2：選擇顯著水準

單尾檢定當對立假設 H1 ，表示一個方向時，即為單尾檢定，例如：
H1：行駛在 I-95 公路上的卡車時數每小時小於 60 英里。（µ < 60） H1：對於加油的顧客，付現的人數少於 20 %。（µ < 20）

在 0.05 顯著水準與右尾檢定下的 z 統計量抽樣分配

雙尾檢定如果對立假設並沒有指出一個方向時，我們使用雙尾檢定。例如：
H1：Georgetown 城沃爾瑪百貨每位顧客的平均消費金額不等於 $25。（µ ≠ $25） H1：每加侖汽車售價不等於 $1.54。（µ ≠ $1.54）

雙尾檢定的不拒絕域與拒絕域，顯著水準為 0.05

步驟 3：決定檢定統計量檢定統計量（test statistic）：一個由樣本資訊所計算出來的統計值，用來決定是否要拒絕這個虛無假設。

母體平均數檢定，其中母體標準差已知在大樣本與母體標準差已知的情形下，母體平均數的檢定統計量為：

步驟 4：制訂決策法則臨界值（critical value）：介於虛無假設拒絕域與接受域間的分隔點。

範例位在紐約州西部的 Jamestown 鋼鐵公司，主要製造及組裝書桌或其他辦公室設備。在 Fredonia分廠中，每週生產的 A325 型號書桌數量服從常態分配，其平均數為 200 張、標準差為 16 張書桌。最近由於市場需求增加，該工廠引進新的生產方式並雇用了新的員工。公司副總裁想要調查 A325 型號書桌在引進新的生產方式後，產量是否有改變。換句話說，在 0.01 的顯著水準下，Fredonia 分廠的平均書桌產量是否為 200張？

範例 continued H0: μ = 200；H1: μ≠ 200 步驟 1：建立虛無假設與對立假設。步驟 2：選擇顯著水準。
如題目所述，使用 0.01 的顯著水準。步驟 3：選擇樣本統計量。母體服從常態分配，且母體標準差σ已知，使用 z分配做為檢定統計量。

範例 continued 步驟 4：決定決策法則。
決策法則的制定，是先從附錄 B.1 中找出 z 的臨界值。由於這個範例是雙尾檢定，因此在兩尾內的機率是 0.01 的一半，即 0.005。在左右兩尾之間的面積 0.99 即為不拒絕 H0 的機率。因為附錄 B.1 基於曲線下右半邊的面積，也就是 0.5；再由0.5－0.005 = 0.495，得出在 0 至臨界值間的面積是 0.495；查表得出最接近 0.495的機率值是，而其相對應的 z 值為 2.58。

範例 continued 顯著水準為 0.01 的決策法則

範例 continued 決定決策法則。若 z > 2.58或 z < －2.58，則拒絕 H0 步驟 5：做決策。

範例 continued 計算結果是 1.55 未落在拒絕域內，因此不拒絕 H0。結論是母體平均數與 200 張書桌沒有差異，因此根據樣本證據顯示：Fredonia 分廠的每週產量與原先的平均產量 200 張書桌沒有顯著的不同，而母體平均週產量與去年週產量間的差距 3.5 單位，可能導因於抽樣誤差。

假設檢定的 p- 值法此方法在於計算樣本統計量的值至少與實際觀測值一樣大的機率（假設虛無假設為真），其檢定程序是將機率值，稱為 p 值，與顯著水準進行比較。

假設檢定的 p- 值法如果 p-值比顯著水準小，則拒絕 H0；如果 p- 值比顯著水準大，則不拒絕H0。

P- 值計算單尾檢定： p- 值= P{z ≥ 檢定統計量} 雙尾檢定： p- 值= P{z ≥ 檢定統計量的絕對值}
= 2( ) = 。因為 > 0 .05，所以不拒絕 H0。

p值假設檢定 - Example H1:  > 200 拒絕 H0 若f Z > Z 上個問題，利用p值檢定：
其中 Z = 1.55 and Z =2.33 拒絕H0 若 p-value <  不小於 0.01 結論: 不能拒絕 H0

p值小於 之意義? =0.10，具有一些證據證明 H0 不真。 = 0.05，具有較強證據證明H0 不真。

母體平均數檢定：大樣本與母體標準差已知因為母體標準差σ已知，且樣本個數 n大於 30，計算公式如下所示：

母體平均數檢定：大樣本與母體標準差未知因為母體標準差未知，因此使用樣本標準差來估計σ。同樣的，若樣本個數 n 大於 30，可以使用 s 來代替σ，計算公式如下所示：

母體平均數檢定：小樣本與母體平均數未知必須使用 t 分配取代標準常態分配。其檢定統計量為：

範例在 0.01 的顯著水準下，可以說處理理賠案件的平均成本低於 $60 嗎？
McFarland保險公司處理一件理賠案件需要花費 $60。與其他保險公司比較，McFarland 保險公司處理理賠案件的成本比其他公司高，因此該公司進行了降低成本的計畫。為了評估降低成本計畫的成效，McFarland 保險公司隨機抽選最近的 26 件理賠案件，其樣本資料如下所示：在 0.01 的顯著水準下，可以說處理理賠案件的平均成本低於 $60 嗎？

範例 continued 步驟 1：建立虛無假設與對立假設。 H0: µ ≥ 60；H1: µ < 60 步驟 2：選擇顯著水準。
其為 0.01

範例 continued 步驟 3：計算檢定統計量。檢定統計量是 t 分配。因為樣本數小於 30。
我們可以合理地假設每件理賠案件的平均成本服從常態分配。

範例 continued 步驟 4：陳述決策法則。
附錄 B.2 表格最左邊的那一行標示為 df（自由度），即樣本內觀測資料數量減去樣本的組數，寫成 n－1。此範例的樣本數量是 26，組數是 1 組，所以自由度是26－1 = 25，在表格中找到自由度是 25 的那一列。此範例為單尾檢定，因此在表格中找到標示單尾部分，找出顯著水準 0.01 的那一行，再從左邊找到自由度為 25 的那一列，交叉點是 2.485，也就是所計算之檢定統計量值。此外，又因本例為單尾檢定且拒絕域在左邊，所以臨界值為負數（－2.485）。而決策法則是如果t值小於－2.485，就必須拒絕H0。

範例 continued 步驟 5：做決策。 26 個樣本的平均成本是 $56.42，樣本標準差是 $10.04。把這些值代入公式 [10-2] 中，計算出 t 值：因為－1.818 落在臨界值－的右邊，所以在 0.01 顯著水準下，不能拒絕虛無假設。這表示降低成本計畫，並沒有將平均處理成本降至 $60 以下。也就是樣本平均數 $56.42與母體平均數 $60 之間的差距 $3.58，可能源自抽樣誤差。

t-Distribution Table (portion)

範例 continued t 分配的拒絕域，顯著水準為 0.01

範例一個小型平衡錘的平均長度是 43 公釐。生產主管認為調整後的機器所生產之平衡錘的長度已經改變，他要求工程部門進行調查。工程部門選取了 12 個平衡錘的樣本進行測量。其測量結果如下表所示：可以說平衡錘的平均長度已經改變了嗎？請使用 0.02 顯著水準。

範例 continued 先建立虛無假設與對立假設。 H0：μ = 43 H1：μ≠ 43
本例為雙尾檢定，且其自由度是 n－1 = 12－1 = 11。根據以上資料，從附錄B.2中的雙尾檢定，使用 0.02 顯著水準找出 t 值是2.718。決策法則是：如果檢定統計量 t 落在－2.718的左邊或是的右邊，則拒絕虛無假設。我們將上述資訊整理成圖10-7。

範例 continued t 分配雙尾檢定的拒絕域，其中α= 0.02

範例 continued 使用公式 [10-2] 計算 t 值：

Population Standard Deviation- Example 2 continued

母體比例的檢定比例的定義是成功次數與觀測資料總數量的比例。

母體比例的檢定計算樣本比例 p 的公式為

假設檢定，單一比例 π：為母體比例 p ：為樣本比例

範例在前一次的印地安那州長選舉顯示，如果候選人要當選，那麼至少要在北區贏得 80% 的選票。現任州長想要了解繼續連任的機會有多大，他計畫在本州北區隨機抽選 2,000 位合格選民進行調查。使用假設檢定的步驟，了解現任州長連任機會。

範例 continued 州長選舉的情形符合二項分配的條件，但這個範例可以使用常態分配去近似二項分配，因為nπ與 n(1－π) 皆超過 5。 n = 2,000，π= 0.8（π是在本州北區的得票率，也就是 80%），所以 nπ = 2,000  0.8 = 1,600與 n(1－π) = 2,000  (1－0.8) = 400 都大於 5，可以進行母體比例的檢定。

範例 continued 步驟 1：建立虛無假設與對立假設。 H0: π≥ 0.8；H1: π< 0.8 步驟 2：選擇顯著水準。
其為 0.05

範例 continued 步驟 3：選擇檢定統計量。使用 z 統計量，

範例 continued 步驟 4：建立決策法則。
顯著水準是 0.05，這機率是左尾拒絕域的面積。因此，z 值介於 0與臨界值之間的機率是0.5－0.05 = 0.45。再參考附錄 B.1 中面積接近0.45所相對應的 z 值是 1.65。所以在左尾的臨界值是－1.65。因此決策法則是：如果透過樣本計算出來的檢定統計量小於－1.65時，必須拒絕虛無假設，並接受對立假設；反之，則不得拒絕虛無假設 H0。

範例 continued 步驟 5：做決策。抽選 2,000 位合格選民進行調查，其中指出有1,550 位選民打算投給現任州長。樣本比例是1,550/2,000 = 0.775。

範例 continued z 值－2.8落在拒絕域中，因此在顯著水準0.05 下，拒絕虛無假設。這表示在樣本比例 77.5% 與假設母體比例 80% 間，2.5%的差距在統計上是顯著的，因此差距可能不是抽樣誤差所引起的。換句話說，樣本證據無法支持現任州長會繼續連任的說法。

範例 continued p-值為計算 z 值小於－2.8的機率。從附錄 B.1 找出介於 0 至－ 2.8 範圍內 z 值的機率是，由此可知 p- 值是0.5－ = 。此 p- 值小於顯著水準 0.05，這表示州長要連任的機率非常小。

範例 continued 顯著水準 0.05 與單尾檢定的拒絕域

第 10 章單組樣本的假設檢定.

Similar presentations

Presentation on theme: "第 10 章單組樣本的假設檢定."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第 10 章 單組樣本的假設檢定.

Similar presentations

Presentation on theme: "第 10 章 單組樣本的假設檢定."— Presentation transcript:

Similar presentations

About project

反馈

第 10 章單組樣本的假設檢定.

Presentation on theme: "第 10 章單組樣本的假設檢定."— Presentation transcript: