Download presentation
Presentation is loading. Please wait.
1
第 10 章 假設檢定的介紹與單一母體的介紹
2
統計推論 假設檢定是統計推論的第二個通用程序。它也有很廣泛的應用。 為了解其概念,我們將從非統計假設檢定開始。
假設檢定是統計推論的第二個通用程序。它也有很廣泛的應用。 為了解其概念,我們將從非統計假設檢定開始。 第10章 假設檢定的介紹與單一母體的推論 第252頁
3
第10章 假設檢定的介紹與單一母體的推論 第252-253頁
假設檢定的非統計應用 刑事審判是假設檢定的非統計例子。 審判中陪審團必須在兩個假設中做決定。虛無假設(null hypothesis)為 H0: 被告是無罪的 對立假設(alternative hypothesis) 或研究假設(research hypothesis)為 H1: 被告是有罪的 陪審團並不知道哪一個假設是正確的。他們必須要依據原告和被告兩方提出的證據做決策。 第10章 假設檢定的介紹與單一母體的推論 第 頁
4
假設檢定的非統計應用 在統計的術語,宣判被告有罪等同於 拒絕虛無假設且支持對立假設 (rejecting the null hypothesis in favor of the alternative) 也就是,陪審團認為有足夠的證據做出被告有罪的結論(有足夠的證據支持對立假設)。 第10章 假設檢定的介紹與單一母體的推論 第253頁
5
假設檢定的非統計應用 宣判被告無罪表示 不拒絕虛無假設而不支持對立假設 (not rejecting the null hypothesis in favor of the alternative) 注意陪審團並不是說被告是無罪的,只能說沒有足夠證據支持對立假設。這是為什麼我們從不說我們支持虛無假設。 第10章 假設檢定的介紹與單一母體的推論 第253頁
6
假設檢定的非統計應用 有兩種可能的錯誤。 型 I 錯誤(Type I error) 發生於當我們拒絕了一個真實的虛無假設。在刑事審判中,犯型 I 錯誤是當一個無罪的人被陪審團錯誤地宣判有罪。 型 II 錯誤(Type II error) 被定義成不拒絕一個錯誤的虛無假設。型 II 錯誤的發生是當一個有罪的被告被宣判無罪釋放。 第10章 假設檢定的介紹與單一母體的推論 第253頁
7
假設檢定的非統計應用 犯型 I 錯誤的機率被表示成 ( 希臘字母 alpha) ,它也被稱為顯著水準(significance level)。犯型 II 錯誤的機率被表示成 ( 希臘字母beta)。 兩種錯誤的機率 和 是反向相關的,意思是試圖降低其中一個將會造成另外一個的增加。 第10章 假設檢定的介紹與單一母體的推論 第253頁
8
假設檢定的非統計應用 在我們的刑事審判制度,型 I 錯誤被視為是比較嚴重的。我們試著避免宣判無罪的人有罪。我們寧願宣告有罪的人無罪。 制度的安排是將犯型 I 錯誤的機率 α 設得很小,藉此將舉證的重擔放在原告( 控方必須證明被告有罪,辯方無需證明任何事情),且陪審團只有在「證據超過合理的懷疑」時才得以宣判被告有罪。 第10章 假設檢定的介紹與單一母體的推論 第253頁
9
假設檢定的非統計應用 假設檢定的重要觀念如下所述: 有兩個假設,為虛無假設與對立假設。 檢定的程序以假設虛無假設為真開始。
過程的目的是要決定是否有足夠的證據去推論對立假設是真的。 有兩種可能的決策: 結論認為有足夠的證據去支持對立假設。 結論認為無足夠的證據去支持對立假設。 第10章 假設檢定的介紹與單一母體的推論 第254頁
10
假設檢定的非統計應用 任何檢定皆有兩種可能的錯誤。 型 I 錯誤:拒絕一個真的虛無假設 型 II 錯誤:無法拒絕一個錯誤的虛無假設
P ( 型 I 錯誤) = P ( 型 II 錯誤) = 第10章 假設檢定的介紹與單一母體的推論 第254頁
11
假設檢定的概念 有兩個假設。一個被稱為虛無假設,另一個被稱為對立或研究假設。通用的符號表示法: H0: — 「虛無假設」 H1: — 「對立」或「研究假設」 虛無假設(H0)是說明參數是等於對立假設中指定的值(H1)。 發音為 H “nought” 第10章 假設檢定的介紹與單一母體的推論 第254頁
12
假設檢定的概念 再次回想範例9.1 (估計電腦前置期間的平均需求量),作業經理不想估計平均需求量,取而代之的是想要知道平均數是否不同於 350。我們可以重新表述需求為虛無假設: H0: µ = 350 所以我們的研究假設為: H1: µ ≠ 350 這是我們有興趣去確認的部分... 第10章 假設檢定的介紹與單一母體的推論 第254頁
13
假設檢定的概念 檢定的程序以假設虛無假設為真開始。 因此,在我們有更近一步的統計證據之前,我們將假設: H0: = 350 (假設為真)
第10章 假設檢定的介紹與單一母體的推論 第254頁
14
假設檢定的概念 過程的目的是要決定是否有足夠的證據去推論對立假設是真的。 也就是說,是否有足夠的統計資料,以確定這一假設是正確的? H1: µ ≠ 350 這是我們有興趣去確認的部分... 第10章 假設檢定的介紹與單一母體的推論 第254頁
15
假設檢定的概念 有兩種可能的決策: 注意:我們不說我們接受虛無假設。 結論認為有足夠的證據去支持對立假設。
(換句話說:拒絕虛無假設並且支持對立假設 的) 結論認為無足夠的證據去支持對立假設。 (換句話說:不拒絕虛無假設去支持對立) 注意:我們不說我們接受虛無假設。 第10章 假設檢定的介紹與單一母體的推論 第254頁
16
假設檢定的概念 完成檢定與假設的敘述之後,下一個步驟是自母體中隨機抽取樣本並計算檢定統計量(test statistic)(此範例為樣本平均數)。 假如檢定統計量的值與虛無假設所述不一致,我們拒絕虛無假設並且推論對立假設是真的。 第10章 假設檢定的介紹與單一母體的推論 第256頁
17
假設檢定的概念 例如,若我們試圖決定平均數是否大於350,一個很大的 值( 譬如,600) 將提供足夠的證據。 假如 的值接近350 ( 譬如,355),我們將說它並沒有提供我們太多推論平均數是大於350 的證據。 第10章 假設檢定的介紹與單一母體的推論 第256頁
18
假設檢定的概念 任何檢定皆有兩種可能的錯誤。 型 I 錯誤的發生是當我們拒絕一個真的虛無假設。 型 II 錯誤的發生是當我們無法拒絕一個錯誤的虛無假設。 犯型 I 與型 II 錯誤的機率是: P ( 型 I 錯誤) = P ( 型 II 錯誤) = α 被稱為顯著水準(significance level)。 第10章 假設檢定的介紹與單一母體的推論 第 頁
19
第10章 假設檢定的介紹與單一母體的推論 第253頁 表10.1
錯誤的型態 型 I 錯誤(Type I error) 發生於當我們拒絕了一個真實的虛無假設。 型 II 錯誤(Type II error) 發生於當我們不拒絕一個錯誤的虛無假設(例,沒有拒絕 H0,當它是錯誤的)。 第10章 假設檢定的介紹與單一母體的推論 第253頁 表10.1
20
範例10.1 百貨公司的新收費系統 某百貨公司的經理想要對公司的信用卡顧客發展一套新的收費系統。 在全面的財務分析之後,她判定只有在平均每月帳上金額高於$170 時,新系統才會符合成本效益。隨機抽出400 個每月帳戶為樣本,帳戶金額的樣本平均數為$178。 該經理知道帳戶金額近似於常態分配,標準差為$65。該經理可否從上述資料做出新系統將會符合成本效益的結論? 第10章 假設檢定的介紹與單一母體的推論 第257頁
21
範例10.1 百貨公司的新收費系統 辨認方法 這個範例處理百貨公司信用卡帳戶的母體。為了下結論說新系統將會符合成本效益,經理必須證明所有顧客的平均帳戶金額是大於$170。 我們設定對立假設來表達這個狀況: H1: µ > 170 (這是我們要確定的) 虛無假設可以被表達成: H0: µ ≤ 170 (對我們感興趣的參數指定一個單一的數值) 第10章 假設檢定的介紹與單一母體的推論 第257頁
22
範例10.1 百貨公司的新收費系統 辨認方法 所以可寫成: H0: µ ≤ 170 (假設此項為真) H1: µ > 170 已知: n = 400 = 178 σ = 65 接下來該如何推論? 第10章 假設檢定的介紹與單一母體的推論 第257頁
23
範例10.1 百貨公司的新收費系統 計算 為了檢定我們的假設,我們可以使用兩種不同方法: 第一個被稱為拒絕域法(rejection region method) ,當手動計算時,通常使用此方法。 第二種是 p-值法(p-value approach),一般而言它最好結合電腦和統計軟體來使用。 我們將依次介紹兩種方法。 第10章 假設檢定的介紹與單一母體的推論 第257頁
24
第10章 假設檢定的介紹與單一母體的推論 第258頁 圖10.1
範例10.1 拒絕域 計算 當樣本平均數的值相對於170 是很大時,拒絕虛無假設而支持對立假設似乎很合理。 α = P(型 I 錯誤) α= P (給定H0是真的情況下拒絕H0) = P (給定H0是真的情況下 ) 第10章 假設檢定的介紹與單一母體的推論 第258頁 圖10.1
25
範例10.1 百貨公司的新收費系統 計算左邊算式的 ,並與 µ = 170做比較。 計算 我們需要一個顯著水準(α) 來計算此項
範例10.1 百貨公司的新收費系統 計算 計算左邊算式的 ,並與 µ = 170做比較。 我們需要一個顯著水準(α) 來計算此項 第10章 假設檢定的介紹與單一母體的推論 第258頁
26
範例10.1 百貨公司的新收費系統 計算 假設該總經理選擇 α 為5%,接下來可得Zα = Z.05 = 1.645。我們現在能夠計算 的值: 由於樣本平均數(178)大於我們計算出的值(175.34),我們拒絕虛無假設並支持對立假設 ,μ >170,也就是裝設新系統符合成本效益。 第10章 假設檢定的介紹與單一母體的推論 第259頁
27
第10章 假設檢定的介紹與單一母體的推論 第261頁 圖10.2
範例 的抽樣分配 H0: ≤ 170 H1: > 170 拒絕 H0 並且支持 H1為真 第10章 假設檢定的介紹與單一母體的推論 第261頁 圖10.2
28
標準化檢定統計量 一個比較簡單的方法是使用標準化檢定統計量(standardized test statistic): 並且將其結果與Z 相比較: (拒絕域: z > Z ) 因為 z = 2.46 大於1.645(Z.05),所以拒絕 H0 並支持 H1。 第10章 假設檢定的介紹與單一母體的推論 第260頁
29
第11章 假設檢定的介紹與單一母體的推論 第261頁 圖10.3
範例11.1 Z 的抽樣分配 H0: = 170 H1: > 170 Z.05=1.645 z = 2.46 拒絕 H0 並且支持H1為真 第11章 假設檢定的介紹與單一母體的推論 第261頁 圖10.3
30
p-值 一個檢定的p-值(p-value of a test) 是在給定虛無假設為真的條件下,觀測到一個檢定統計量至少像計算所得數值一樣極端的機率。 在範例10.1 中,觀測到一個樣本平均數至少像已經觀察到的樣本一樣極端的機率(如:178),給定的虛無假設(H0: µ = 170)是否為真? p-值 第10章 假設檢定的介紹與單一母體的推論 第262頁
31
第10章 假設檢定的介紹與單一母體的推論 第262頁 圖10.4
p-值 p-值 = P(Z > 2.46) p-值 =.0069 z =2.46 第10章 假設檢定的介紹與單一母體的推論 第262頁 圖10.4
32
第10章 假設檢定的介紹與單一母體的推論 第263-264頁
描述 p-值 p-值越小,越多測量證據存在以支持對立假設: 假如 p-值小於.01,有壓倒性的(overwhelming) 證據支持對立假設是對的。 假如 p-值介於.01 和.05 之間,有強烈的(strong) 證據支持對立假設是對的。 假如 p-值介於.05 和.10 之間,有微弱的(weak) 證據支持對立假設是對的。 假如 p-值超過.10 時,沒有證據支持推論對立假設是對的。 因為 p-值為 .0069,所以有壓倒性的證據支持H1: > 170。 第10章 假設檢定的介紹與單一母體的推論 第 頁
33
第10章 假設檢定的介紹與單一母體的推論 第265頁 圖10.6
描述 p-值 p =.0069 第10章 假設檢定的介紹與單一母體的推論 第265頁 圖10.6
34
描述 p-值 比較 p-值及顯著水準的選擇值: 假如 p-值小於,我們判斷 p-值夠小去拒絕虛無假設。 假如 p-值大於,我們不拒絕虛無假設。 當p-值 = < = .05, 我們拒絕 H0 且支持H1。 第10章 假設檢定的介紹與單一母體的推論 第265頁
35
詮釋一個檢定的結果 假如我們拒絕虛無假設,我們下結論說有足夠的統計證據去推論對立假設是真的。 假如我們不拒絕虛無假設,我們下結論說沒有足夠的統計證據去推論對立假設是真的。 切記:對立假設是結論的焦點。它呈現了我們想要調查與探討的內容。 第10章 假設檢定的介紹與單一母體的推論 第266頁
36
第10章 假設檢定的介紹與單一母體的推論 第266-267頁
範例10.2 SSA 信封計畫 聯邦快遞(FedEx) 寄發票給顧客要求 30 天之內付費。 帳單上會列出付款地址,且期望顧客使用他們自己的信封寄回他們的付款。 目前,付清帳單所需時間的平均數與標準差分別是24 天與 6 天。 財務長(CFO) 相信附上一個回郵 (stamped self-addressed, SSA)信封會縮短付款時間。 第10章 假設檢定的介紹與單一母體的推論 第 頁
37
範例10.2 SSA 信封計畫 她計算減短2 天的付款時間以改善現金流量,將能支付信封與郵票的成本。 若更進一步地減短付費時間,將會產生利潤。 為了測試她的想法,她隨機選取220 位顧客且隨著發票附上一個回郵信封寄出。 收到付款所需的天數被記錄下來。這位財務長是否能夠下結論說這項計畫是有利潤的? 第10章 假設檢定的介紹與單一母體的推論 第267頁
38
範例10.2 SSA 信封計畫 辨識方法 這項研究的目的是對平均付款時間推導結論。因此,要被檢定的參數是母體平均數 。 我們想知道是否存在足夠的統計證據以顯示母體平均數是少於22 天。因此,對立假設為 H1: μ < 22 虛無假設為 H0: μ = 22 第10章 假設檢定的介紹與單一母體的推論 第267頁
39
範例10.2 SSA 信封計畫 辨識方法 檢定統計量為 只有當樣本平均數與其導出的檢定統計量的數值夠小的時候,我們會拒絕虛無假設且支持對立假設。 結果,我們設定的拒絕域位置會在抽樣分配的左尾。 我們設定10% 的顯著水準。 第10章 假設檢定的介紹與單一母體的推論 第267頁
40
範例10.2 SSA 信封計畫 計算 拒絕域為: 由Xm11-00資料,我們計算出 和 P-值 = P(Z < −.91) = .5 − = .1814 第10章 假設檢定的介紹與單一母體的推論 第268頁
41
範例10.2 SSA 信封計畫 結論:沒有充分的證據去推論平均付款時間小於22 天。 沒有足夠的證據去推論這項計畫將會是有利益的。 詮釋
第10章 假設檢定的介紹與單一母體的推論 第268頁
42
第10章 假設檢定的介紹與單一母體的推論 第258頁 圖10.1
單尾與雙尾檢定 在範例10.1與範例10.2中,執行的統計檢定被稱為單尾檢定(one-tail test),因為拒絕域只位於抽樣分配的單尾。 更正確地說,範例10.1 是右尾檢定的範例之一。 第10章 假設檢定的介紹與單一母體的推論 第258頁 圖10.1
43
雙尾檢定 雙尾檢定被用於當我們想要檢定參數不等於某些值的研究假設。 第10章 假設檢定的介紹與單一母體的推論
44
範例10.3 AT&T 和其競爭者的比較 近年來,數家公司已成立並投入與 AT&T 長途電話的競爭。 這些公司全都廣告它們的費率比 AT&T 的低,也因此它們的帳單將會比較便宜。 AT&T 辯稱,平均而言,AT&T 對顧客的收費與其他公司並沒有差別。 假設一個替AT&T 工作的統計實作者認定該公司的居家客戶每月長途電話帳單的平均數與標準差分別是 $17.09 和 $3.87。 第10章 假設檢定的介紹與單一母體的推論 第269頁
45
範例10.3 AT&T 和其競爭者的比較 他接著隨機抽取了100 位顧客為樣本,並使用一個首要競爭者的費率重新計算這些顧客上個月的帳單。 假設這個母體的標準差與AT&T 的相同,我們能否下結論說在5% 的顯著水準下,AT&T 帳單平均數與首要競爭者之間存在著差異? 第10章 假設檢定的介紹與單一母體的推論 第269頁
46
第11章 假設檢定的介紹與單一母體的推論 第269-270頁
範例10.3 AT&T 和其競爭者的比較 辨識方法 被檢定的參數是AT&T客戶帳單之母體平均數,是以首要競爭者的費率為計算基準。 在這個問題中,我們想要知道平均每月長途電話帳單是否不同於$17.09。所以,對立假設為: H1: µ ≠ 虛無假設必然為: H0: µ = 17.09 第11章 假設檢定的介紹與單一母體的推論 第 頁
47
範例10.3 AT&T 和其競爭者的比較 辨識方法 拒絕域被設定,所以當檢定統計量很大或很小的時候,我們能夠拒絕虛無假設 也就是,我們必須設定一個雙尾拒絕域(two-tail rejection region)。因為在拒絕域的總面積必須是,我們將這個機率除以 2。 統計量很“小” 統計量很“大” 第10章 假設檢定的介紹與單一母體的推論 第270頁
48
範例10.3 AT&T 和其競爭者的比較 辨識方法 在5%的顯著水準之下(α = .05),可知 α/2 = .025。因此,Z.025 = 1.96 的拒絕域為 z < –1.96 -或- z > 1.96 z –Z.025 +Z.025 第10章 假設檢定的介紹與單一母體的推論 第270頁
49
範例10.3 AT&T 和其競爭者的比較 計算 從資料(Xm11-02),我們可計算出 檢定統計量的值是: 我們發現: 因為 z = 1.19 既不大於1.96 也不小於 − 1.96,我們不能拒絕虛無假設且支持H1,即「沒有充足的證據去推論 AT&T 的帳單與競爭者的有差異」。 第10章 假設檢定的介紹與單一母體的推論 第270頁
50
範例10.3 雙尾檢定的 p-值 計算 一般而言,雙尾檢定的 p-值被計算如下 p-值 = 2P(Z > |z|) 其中 z 是檢定統計量的數值,而|z| 是它的絕對值。 在範例11.2中,我們可得知 p-值 = P(Z < 1.19) + P(Z > 1.19) = = .2340 第10章 假設檢定的介紹與單一母體的推論 第270頁
51
雙尾檢定與單尾檢定總整理 單尾檢定 (左尾) 雙尾檢定 (右尾) 第10章 假設檢定的介紹與單一母體的推論
52
發展對統計觀念的了解 1 如同信賴區間估計量,假設檢定是依據樣本統計量的抽樣分配。 假設檢定的結果是一個關於樣本統計量的機率陳述。 我們假設母體平均數是虛無假設所設定的值。 第10章 假設檢定的介紹與單一母體的推論 第272頁
53
發展對統計觀念的了解 1 我們接著將計算檢定統計量,和測量當虛無假設為真時觀察到一個如此大(或小)數值的可能性。 假如這個機率很小,我們下結論說「虛無假設為真」的假設不能被證實且我們拒絕它。 第10章 假設檢定的介紹與單一母體的推論 第272頁
54
發展對統計觀念的了解 2 當我們( 或電腦) 計算檢定統計量的值 我們測量樣本統計量和參數設定值之間的差異,相當於幾個標準誤
當我們( 或電腦) 計算檢定統計量的值 我們測量樣本統計量和參數設定值之間的差異,相當於幾個標準誤 第10章 假設檢定的介紹與單一母體的推論 第272頁
55
發展對統計觀念的了解 2 在範例10.3 中,我們發現檢定統計量的值是 z = 1.19。意指樣本平均數比 的參數設定值大1.19 個標準誤。 標準常態機率表告訴我們這個值並非不可能。因此,我們不拒絕虛無假設。 測量樣本統計量和參數設定值之間相差幾個標準誤的觀念將在本書中繼續使用。 第10章 假設檢定的介紹與單一母體的推論 第272頁
56
後續學習 統計實作人員經常採用的統計方法 定義 計算 詮釋 測量最困難的部分(在現實生活中或是期末考時)是辨認正確的方法。
統計實作人員經常採用的統計方法 定義 計算 詮釋 測量最困難的部分(在現實生活中或是期末考時)是辨認正確的方法。 第10章 假設檢定的介紹與單一母體的推論 第275頁 11.56
57
後續學習 許多因素可用來辨認正確的方法,但是其中兩個因素特別的重要: 1. 資料的類型 區間、順序和名目 2. 問題的目的
許多因素可用來辨認正確的方法,但是其中兩個因素特別的重要: 1. 資料的類型 區間、順序和名目 2. 問題的目的 第10章 假設檢定的介紹與單一母體的推論 第275頁
58
問題的目的 描述一個母體 比較兩個母體 比較兩個或更多母體 分析兩個變數的關係 分析兩個或更多變數的關係
第10章 假設檢定的介紹與單一母體的推論 第276頁
59
第10章 假設檢定的介紹與單一母體的推論 第277頁 表11.3頁
表10.3 統計推論的導覽:介紹每一種方法的章節 第10章 假設檢定的介紹與單一母體的推論 第277頁 表11.3頁
60
公式推導 各種因素決定我們感興趣的參數(例:母體平均數 )。 每一個參數有其「最佳」估計量(統計)(如樣本平均數 。 統計學有抽樣分配
每一個參數有其「最佳」估計量(統計)(如樣本平均數 。 統計學有抽樣分配 這個公式表示抽樣分配通常是檢定統計量的公式。 使用一點代數,我們就能從抽樣分配導出的信賴區間估計量。 第10章 假設檢定的介紹與單一母體的推論 第277頁
61
對單一母體的推論 我們將發展估計與檢定三個母體參數的方法: 母體平均數 μ 母體變異數 2 母體比例 p 母體 樣本 推論 統計量 參數
第10章 假設檢定的介紹與單一母體的推論
62
在母體標準差未知下進行單一母體平均數的推論
先前,我們著重於當母體標準差已知或給定時,估計與檢定母體平均數: 但是我們如何知道實際的母體變異數? 我們以學生 t 統計取代,給定: 第10章 假設檢定的介紹與單一母體的推論 第278頁
63
在母體標準差未知下進行單一母體平均數的推論
當母體標準差未知且母體是常態時,我們使用其點估計 s t-統計量取代了 z-統計量,其自由度 v 為 n – 1 。 第10章 假設檢定的介紹與單一母體的推論 第278頁
64
當σ 未知時,μ 的檢定統計量 當母體標準差未知且母體是常態時,相關假設檢定的檢定統計量是: 它是自由度為 v = n – 1的學生t 分配,μ 的信賴區間估計量: 第10章 假設檢定的介紹與單一母體的推論 第278頁
65
Keller: Stats for Mgmt & Econ, 8th Ed
範例10.4 報紙回收計畫 2017年3月19日星期日 在未來可能很多國家必須更努力於拯救環境, 人們的行動包括減少使用能源和加強回收。 目前(2007年),大部分由回收材料所製造的產品比起那些由地球原始材料所製造的產品明顯地比較昂貴。 第10章 假設檢定的介紹與單一母體的推論 第279頁 Copyright © 2008 Brooks/Cole, a division of Thomson Learning, Inc.
66
範例10.4 報紙回收計畫 報紙例外。 回收報紙可能是有利可圖的。 從各家庭回收報紙是一項主要的費用。最近,數家公司加入蒐集家庭過期報紙並再利用的行業。 一位財務分析師為這類的公司計算,如果平均每星期從每戶家庭蒐集的報紙超過2.0磅,則公司將可以賺取利潤。 第10章 假設檢定的介紹與單一母體的推論 第279頁
67
範例10.4 報紙回收計畫 一項研究決定回收場的可行性,從一個大型的社區中抽取一個148戶家庭的隨機樣本,每星期每一戶家庭回收丟棄的報紙重量被記錄。Xm12-01* 這些資料是否提供充分的證據讓這位分析師下結論回收計畫是有利可圖的? 第10章 假設檢定的介紹與單一母體的推論 第279頁
68
範例10.4 報紙回收計畫 辨識方法 問題的目的是描述(describe)每一戶家庭每週廢報紙量的母體。資料的尺度是區間的,表示母體平均數 是需要被檢定的參數。 我們想知道是否有足夠的證據決定平均數大於2.0磅,因此: 因此,虛無假設中的數值是 H1: µ > 2.0 H0: µ = 2.0 第10章 假設檢定的介紹與單一母體的推論 第 頁
69
範例10.4 報紙回收計畫 檢定統計量是: 因為對立假設是: H1: > 2.0 拒絕域則為: 辨識方法
範例10.4 報紙回收計畫 辨識方法 檢定統計量是: 因為對立假設是: H1: > 2.0 拒絕域則為: 第10章 假設檢定的介紹與單一母體的推論 第280頁
70
範例10.4 報紙回收計畫 詮釋 檢定統計量的值是 t = 2.23 而且它的 p-值是.0136。 沒有充分的證據去推論被丟棄報紙的平均重量是大於 2.0的。 但是注意是有一些證據存在的;p-值是 。然而,因為我們想要犯型 I 錯誤的機率小一點,我們堅持要求 1%的顯著水準。 因此,我們不能下結論說回收場將會有利可圖。 第10章 假設檢定的介紹與單一母體的推論 第281頁
71
範例10.5 審核報稅的稅收 在2010 年( 最新年份的報告),在美國提出的報稅共有142,823,000件。 美國國稅局(Internal Revenue Service, IRS) 審查其中的1.107% 或1,581,000 件以確定他們是否正確地報稅。 為了判定審計人員的執行績效如何,從這些報稅中選出一個隨機樣本,並且記錄其補稅額。Xm12-02 以95% 的信心估計從1,581,000 件審查報稅檔案的平均補稅額。 第10章 假設檢定的介紹與單一母體的推論 第281頁
72
範例10.5 審核報稅的稅收 辨識方法 問題的目的是描述附加所得稅的母體。 資料的尺度是區間的。 此問題要求我們估計的參數是附加所得稅的母體。 信賴區間的估計量是 第10章 假設檢定的介紹與單一母體的推論 第281頁
73
範例12.2 審核報稅的稅收 詮釋 我們估計所徵收的平均補稅額是介於$8,887 與$10,168 之間。 我們可以使用這項估計值去決定是否 IRS 審核了應該被審核的個人。 第10章 假設檢定的介紹與單一母體的推論 第283頁
74
檢查必要的條件 學生 t 分配是穩健的(robust),指的是假如母體不是常態, t-檢定的信賴區間估計值仍然是合適的,只要母體「不是極端地非常態」。 為了檢查這個必要的條件,我們繪製直方圖來決定它們是否嚴重地偏離鐘形分配。假如直方圖極端地(假定在一個指數分配的情況下),其可能被視為「極端地非常態」,則t-統計量在這範例中不是合理的。 第10章 假設檢定的介紹與單一母體的推論 第283頁
75
圖10.10 範例10.4的直方圖 第10章 假設檢定的介紹與單一母體的推論 第284頁 圖10.10
76
圖12.3 範例12.2的直方圖 第10章 假設檢定的介紹與單一母體的推論 第284頁 圖10.11
77
發展對統計觀念的了解 1 本節介紹了自由度(degrees of freedom) 這個專有名詞。因為我們將會陸續在本書中看到這個名詞,所以有必要對其意義提供一個簡短的討論。學生t 分配立基於使用樣本變異數去估計未知的母體變異數。樣本變異數定義為 為了計算s2,我們必須先決定 。 第10章 假設檢定的介紹與單一母體的推論 第284頁
78
發展對統計觀念的了解 1 回顧之前的概念,抽樣分配是源自於對相同的母體進行重複抽樣而導出。為了計算 s2 而重複抽樣,對樣本中的前 n - 1 個觀測值,我們可以選取任何數值。但是,對第n 個數值我們不能選取,因為樣本平均數必須先被計算。為了說明這個觀念,假設 n = 3 而且我們求出 = 10。我們可以沒有限制地假設x1 和x2 為任何數值。但是,x3 的值必須能夠使 = 10。 第10章 假設檢定的介紹與單一母體的推論 第284頁
79
發展對統計觀念的了解 1 例如,假如 x1 = 6 且 x2 = 8,則 x3 就必須等於16。所以,在我們選擇樣本時只有2 個自由度。我們說我們損失掉1 個自由度,因為我們必須先計算 。 注意到 s2 計算式的分母是等於自由度。這並不是一個巧合,而且還會在本書中重複看到。 第10章 假設檢定的介紹與單一母體的推論 第285頁
80
發展對統計觀念的了解 2 與 z-統計量相同,t-統計量以相當於幾個標準誤的方式,衡量樣本平均數與假設值之間的差異。 然而,當母體標準差是未知時,我們以 估計標準誤。 第10章 假設檢定的介紹與單一母體的推論 第285頁
81
發展對統計觀念的了解 3 當我們在8.4節中介紹學生 t 分配,我們指出它比標準常態分配來的分散。 這個狀況是合乎邏輯的。 在z-統計量的唯一變數是樣本平均數,其隨著樣本的不同而改變。 第10章 假設檢定的介紹與單一母體的推論 第285頁
82
發展對統計觀念的了解 3 t-統計量則有兩個變數,樣本平均數 和樣本標準差 s,兩者皆會隨著不同的樣本而改變。 因為比較大的不確定性,t-統計量將會呈現較大的變異性。 第10章 假設檢定的介紹與單一母體的推論 第285頁
83
單一母體變異數的推論 假如我們對推論母體的變異性感興趣,我們必須調查的參數是母體的變異數 σ2 。 樣本變異數s2 是 σ2的一個不偏的、一致的估計量。此外, 統計量 被稱為卡方統計量(chi-squared statistic,2-statistic),它會服從自由度為 v = n -1 的卡方分配。 第10章 假設檢定的介紹與單一母體的推論 第 頁
84
檢定與估計一個母體變異數 用於 σ2 假設檢定的檢定統計量是: 它會服從自由度為 v= n -1 的卡方分配。
第10章 假設檢定的介紹與單一母體的推論 第288頁
85
檢定與估計一個母體變異數 我們可以做下列機率敘述: 代入 可以推導出一個母體變異數的信賴區間估計量σ2: 信賴下限 信賴上限
第10章 假設檢定的介紹與單一母體的推論 第 頁
86
範例 容器填充機的一致性,第一部分Xm12-03 容器填充機被用於填充各種的液體,包括牛奶、飲料與油漆等。 理想的情況是,各個瓶中的液體量應該只有些微的不同,因為較大的變異會導致有些容器裝填不足(欺騙顧客)而有些裝填過量(導致成本上的浪費)的情況。 一家開發新型機器公司的總裁誇耀他們的機器能夠非常一致地填充 1 公升(1,000 立方公分)的容器,使得裝填的變異數小於 1 立方公分。 第10章 假設檢定的介紹與單一母體的推論 第289頁
87
範例10.6 容器填充機的一致性,第一部分 為了檢定這項宣稱的真實性,選取 25 個填滿 1 公升容器的隨機樣本,並且記錄結果。 這些資料是否容許該總裁在 5% 的顯著水準下做此宣稱? 第10章 假設檢定的介紹與單一母體的推論 第 頁
88
範例10.6 容器填充機的一致性,第一部分 辨識方法 問題的目的是描述這部機器裝填 1 公升容器容量的母體。 資料是區間尺度,而我們對裝填量的變異性感興趣。 感興趣的參數是母體變異數 σ2。 第10章 假設檢定的介紹與單一母體的推論 第290頁
89
範例10.6 容器填充機的一致性,第一部分 辨識方法 因為我們想決定是否存在充分的證據支持這項宣稱,對立假設為 虛無假設為 以及我們將使用的檢定統計量是 H1: 2 < 1 H0: 2 = 1 第10章 假設檢定的介紹與單一母體的推論 第290頁
90
範例10.6 容器填充機的一致性,第一部分 計算 使用計算機,我們求出 與 因此, 第10章 假設檢定的介紹與單一母體的推論 第290頁
91
範例10.6 容器填充機的一致性,第一部分 計算 檢定統計量的值是 拒絕域是 因為15.20 不小於13.85,我們不能拒絕虛無假設而支持對立假設。 第10章 假設檢定的介紹與單一母體的推論 第 頁
92
範例10.6 容器填充機的一致性,第一部分 詮釋 沒有足夠的證據去推論這項宣稱為真。 如同我們先前討論過的,這個結果並未說明變異數是等於 1;它只敘述我們無法證明變異數是小於 1。 第10章 假設檢定的介紹與單一母體的推論 第291頁
93
範例10.7 容器填充機的一致性,第二部分 以99%的信心估計範例10.6中裝填量的變異數。 Xm12-03
範例10.7 容器填充機的一致性,第二部分 以99%的信心估計範例10.6中裝填量的變異數。 Xm12-03 第10章 假設檢定的介紹與單一母體的推論 第291頁
94
範例10.7 容器填充機的一致性,第二部分 詮釋 在範例10.6中,我們看到沒有充分的證據去推論母體變異數是小於 1的。在此我們看到 σ2 被估計落在.3336與1.5375之間。 此區間的一部分是在 1 之上,這告訴我們該變異數可能大於 1,確認了我們在範例10.6中所達成的結論。 第12章 假設檢定的介紹與單一母體的推論 第292頁
95
範例10.7 容器填充機的一致性,第二部分 詮釋 我們可能可以使用這個估計值來預測瓶子填充過量與填充不足的百分比。這可能容許我們在具競爭性的機種中做選擇。 第10章 假設檢定的介紹與單一母體的推論 第292頁
96
檢查必要的條件 就像在10.4 節中所介紹的t-檢定與 的估計量,卡方檢定與2 的估計量在理論上需要抽樣的母體為常態。但是在實務上,只要母體不是極端地非常態,這種方法是有效的。我們可以藉由畫直方圖的方式來測量非常態性的程度。圖10.13描繪 Excel 版本的直方圖。如你所見,填充量顯示出些許的不對稱性。但是,此變數並沒有呈現極端的非常態。我們結論說所需的常態性並沒有被嚴重地違反。 第10章 假設檢定的介紹與單一母體的推論 第292頁
97
檢查必要的條件 第10章 假設檢定的介紹與單一母體的推論 第292頁 圖10.13
98
單一母體比例的推論 當資料是名目時,我們計數每一個數值發生的次數。因此,在描述一個名目資料的母體時,感興趣的參數是母體的比例 p。 這個參數被用來計算二項實驗的機率。 回想這個統計量的用法: 是樣本比例 x 是樣本大小 n 中成功的次數。 第10章 假設檢定的介紹與單一母體的推論 第294頁
99
單一母體比例的推論 np 與 n(1–p) 大於 5 的條件下, 的抽樣分配近似於常態 平均數: = p 標準誤: 因此,抽樣分配為:
第10章 假設檢定的介紹與單一母體的推論 第295頁
100
單一母體比例的推論 p 的檢定統計量為: p 的信賴區問估計量。結果是 (當np 與 n(1–p) 大於5時)
第10章 假設檢定的介紹與單一母體的推論 第295頁
101
範例10.8 選舉日投票處出口民意調查 總統或某大州參議員的競選,電視網會積極地競爭,看哪一家能夠搶先預測出競選的贏家。這可以透過投票處出口民意調查(exit polls) 來執行。 根據選民的一個隨機樣本,當他們離開投票處時,詢問他們的票投給了誰,再藉由詢問所獲得的資料,計算出選民支持候選人的樣本比例。 第10章 假設檢定的介紹與單一母體的推論 第296頁
102
範例10.8 選舉日投票處出口民意調查 美國總統選舉中,在一個州當中得到最多選票的候選人獲得該州代表投票選總統的投票權。 實際上,這意味共和黨或是民主黨的候選人其中之ㄧ會贏。 假設一個州當中,出口處民意調查的結果被記錄為 1 =民主黨編碼與 2 =共和黨編碼 。Xm12-05* 第10章 假設檢定的介紹與單一母體的推論 第296頁 12.102
103
範例10.8 選舉日投票處出口民意調查 投票結束於晚間 8點。 由這些資料,電視網是否能夠下結論說共和黨的候選人將會勝選? 電視網是否應該在晚間 8點1分宣佈共和黨的候選人將會勝選? 第10章 假設檢定的介紹與單一母體的推論 第296頁
104
範例10.8 選舉日投票處出口民意調查 辨識方法 問題的目的是描述一個州的投票母體 · 資料是名目的,因為這些數值是「民主黨」與「共和黨」。因此要檢定的參數是整個州之內投票給共和黨候選人的比例。因為我們想決定是否電視網可以在晚間8:01 宣佈共和黨的候選人是勝選者,對立假設為 H1: p > .5 虛無假設為 H0: p = .5 第10章 假設檢定的介紹與單一母體的推論 第296頁
105
範例10.8 選舉日投票處出口民意調查 辨識方法 檢定統計量為 第10章 假設檢定的介紹與單一母體的推論 第297頁
106
範例10.8 選舉日投票處出口民意調查 計算 這是一個「標準的」問題,它需要一個5%的顯著水準。因此,拒絕域為 從檔案中,我們計算「成功」的個數,其為投給共和黨候選人的票數,並得到 x = 407。樣本大小為765。因此,樣本比例為 第10章 假設檢定的介紹與單一母體的推論 第297頁
107
範例10.8 選舉日投票處出口民意調查 計算 檢定統計量的數值為 由於檢定統計量是(近似地) 服從常態分配,我們可以決定p-值。它是 在5% 的顯著水準下,有充分的證據推論共和黨候選人勝選。 第10章 假設檢定的介紹與單一母體的推論 第297頁
108
範例10.8 選舉日投票處出口民意調查 詮釋 使用5%的顯著水準,我們拒絕虛無假設並且下結論說有充分的證據去推論共和黨贏得選舉。 然而,這是否為正確的選擇? 第10章 假設檢定的介紹與單一母體的推論 第297頁
109
範例10.8 選舉日投票處出口民意調查 詮釋 在此考慮的關鍵問題是型 I 與型 II 錯誤的成本。 如果我們下結論說共和黨將會贏,事實上共和黨輸了,則發生型 I 錯誤。 第10章 假設檢定的介紹與單一母體的推論 第297頁
110
範例10.8 選舉日投票處出口民意調查 詮釋 這類錯誤的意思是電視網在晚間 8點1分宣佈共和黨候選人已經贏得選舉,稍晚必須承認這是一項錯誤。 如果只有一家特定的電視網犯此一錯誤,將造成觀眾對他們的誠信產生懷疑並可能影響觀眾的人數。 第10章 假設檢定的介紹與單一母體的推論 第297頁
111
範例10.8 選舉日投票處出口民意調查 詮釋 這確實是發生在 2000 年 11 月美國總統選舉當晚的情況。 在晚間 8點投票結束後不久,所有的電視網皆宣佈民主黨候選人高爾將會在佛羅里達州獲勝。 數小時之後,各家電視網承認錯誤並宣佈共和黨布希已經獲勝。 第10章 假設檢定的介紹與單一母體的推論 第297頁
112
範例10.8 選舉日投票處出口民意調查 詮釋 幾小時之後他們再次承認錯誤,並宣佈此一選舉的結果太接近而無法分出勝負。 幸運地,所有的電視網犯了相同的錯誤。 但是,如果有一家電視網沒有犯此一錯誤,它將保有更好的記錄,在未來可能被使用於新聞節目的廣告中,並可能吸引更多的觀眾。 在此考慮的關鍵問題是型 I 與型 II 錯誤的成本,其使用1%的顯著水準較好。 第10章 假設檢定的介紹與單一母體的推論 第298頁
113
選擇估計比例的樣本大小 當我們在9.3節中介紹估計一個平均數的樣本大小選擇方法時,我們指出樣本大小依賴信賴水準及統計實作人員能夠容忍的估計誤差範圍。 當要估計的參數是一個比例時,此一估計誤差範圍是 第10章 假設檢定的介紹與單一母體的推論 第298頁
114
選擇估計比例的樣本大小 為了求 n 的解,我們產生必要的樣本大小以估計 p ,其中B 是估計的誤差範圍 遺憾的是,這個數值通常是未知的 。
第10章 假設檢定的介紹與單一母體的推論 第 頁
115
選擇估計比例的樣本大小 兩種方法—— 每一個案例我們可以為 選擇一個值,然後解 n 的方程式。 方法1:如果我們甚至連 的近似值都沒有的時候, 這是「最差的情況」所以我們以 取代之。 方法2:我們對 的值有些概念。這是比較好的情況,並且我們代入估計值 。 第10章 假設檢定的介紹與單一母體的推論 第 頁
116
選擇估計比例的樣本大小 方法1:沒有 的值,使用50%: 方法2:對 的值有些概念: 所以,在開始之前,若我們已經有母體比例的合理估計值,我們可以只抽樣少數人。 第10章 假設檢定的介紹與單一母體的推論 第 頁
Similar presentations