第 10 章假設檢定的介紹與單一母體的介紹.

第 10 章假設檢定的介紹與單一母體的介紹

統計推論假設檢定是統計推論的第二個通用程序。它也有很廣泛的應用。為了解其概念，我們將從非統計假設檢定開始。
假設檢定是統計推論的第二個通用程序。它也有很廣泛的應用。為了解其概念，我們將從非統計假設檢定開始。第10章假設檢定的介紹與單一母體的推論第252頁

第10章假設檢定的介紹與單一母體的推論第252-253頁
假設檢定的非統計應用刑事審判是假設檢定的非統計例子。審判中陪審團必須在兩個假設中做決定。虛無假設(null hypothesis)為 H0: 被告是無罪的對立假設(alternative hypothesis) 或研究假設(research hypothesis)為 H1: 被告是有罪的陪審團並不知道哪一個假設是正確的。他們必須要依據原告和被告兩方提出的證據做決策。第10章假設檢定的介紹與單一母體的推論第頁

假設檢定的非統計應用在統計的術語，宣判被告有罪等同於拒絕虛無假設且支持對立假設 (rejecting the null hypothesis in favor of the alternative) 也就是，陪審團認為有足夠的證據做出被告有罪的結論(有足夠的證據支持對立假設)。第10章假設檢定的介紹與單一母體的推論第253頁

假設檢定的非統計應用宣判被告無罪表示不拒絕虛無假設而不支持對立假設 (not rejecting the null hypothesis in favor of the alternative) 注意陪審團並不是說被告是無罪的，只能說沒有足夠證據支持對立假設。這是為什麼我們從不說我們支持虛無假設。第10章假設檢定的介紹與單一母體的推論第253頁

假設檢定的非統計應用有兩種可能的錯誤。型 I 錯誤(Type I error) 發生於當我們拒絕了一個真實的虛無假設。在刑事審判中，犯型 I 錯誤是當一個無罪的人被陪審團錯誤地宣判有罪。型 II 錯誤(Type II error) 被定義成不拒絕一個錯誤的虛無假設。型 II 錯誤的發生是當一個有罪的被告被宣判無罪釋放。第10章假設檢定的介紹與單一母體的推論第253頁

假設檢定的非統計應用犯型 I 錯誤的機率被表示成  ( 希臘字母 alpha) ，它也被稱為顯著水準(significance level)。犯型 II 錯誤的機率被表示成  ( 希臘字母beta)。兩種錯誤的機率  和  是反向相關的，意思是試圖降低其中一個將會造成另外一個的增加。第10章假設檢定的介紹與單一母體的推論第253頁

假設檢定的非統計應用在我們的刑事審判制度，型 I 錯誤被視為是比較嚴重的。我們試著避免宣判無罪的人有罪。我們寧願宣告有罪的人無罪。制度的安排是將犯型 I 錯誤的機率 α 設得很小，藉此將舉證的重擔放在原告( 控方必須證明被告有罪，辯方無需證明任何事情)，且陪審團只有在「證據超過合理的懷疑」時才得以宣判被告有罪。第10章假設檢定的介紹與單一母體的推論第253頁

假設檢定的非統計應用假設檢定的重要觀念如下所述：有兩個假設，為虛無假設與對立假設。檢定的程序以假設虛無假設為真開始。
過程的目的是要決定是否有足夠的證據去推論對立假設是真的。有兩種可能的決策：結論認為有足夠的證據去支持對立假設。結論認為無足夠的證據去支持對立假設。第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的非統計應用任何檢定皆有兩種可能的錯誤。型 I 錯誤：拒絕一個真的虛無假設型 II 錯誤：無法拒絕一個錯誤的虛無假設
P ( 型 I 錯誤) ＝  P ( 型 II 錯誤) ＝ 第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念有兩個假設。一個被稱為虛無假設，另一個被稱為對立或研究假設。通用的符號表示法： H0: — 「虛無假設」 H1: — 「對立」或「研究假設」虛無假設(H0)是說明參數是等於對立假設中指定的值(H1)。發音為 H “nought” 第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念再次回想範例9.1 (估計電腦前置期間的平均需求量)，作業經理不想估計平均需求量，取而代之的是想要知道平均數是否不同於 350。我們可以重新表述需求為虛無假設： H0: µ = 350 所以我們的研究假設為： H1: µ ≠ 350 這是我們有興趣去確認的部分... 第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念檢定的程序以假設虛無假設為真開始。因此，在我們有更近一步的統計證據之前，我們將假設： H0:  = 350 (假設為真)
第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念過程的目的是要決定是否有足夠的證據去推論對立假設是真的。也就是說，是否有足夠的統計資料，以確定這一假設是正確的？ H1: µ ≠ 350 這是我們有興趣去確認的部分... 第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念有兩種可能的決策：注意：我們不說我們接受虛無假設。結論認為有足夠的證據去支持對立假設。
（換句話說：拒絕虛無假設並且支持對立假設的）結論認為無足夠的證據去支持對立假設。（換句話說：不拒絕虛無假設去支持對立）注意：我們不說我們接受虛無假設。第10章假設檢定的介紹與單一母體的推論第254頁

假設檢定的概念完成檢定與假設的敘述之後，下一個步驟是自母體中隨機抽取樣本並計算檢定統計量(test statistic)(此範例為樣本平均數)。假如檢定統計量的值與虛無假設所述不一致，我們拒絕虛無假設並且推論對立假設是真的。第10章假設檢定的介紹與單一母體的推論第256頁

假設檢定的概念例如，若我們試圖決定平均數是否大於350，一個很大的值( 譬如，600) 將提供足夠的證據。假如的值接近350 ( 譬如，355)，我們將說它並沒有提供我們太多推論平均數是大於350 的證據。第10章假設檢定的介紹與單一母體的推論第256頁

假設檢定的概念任何檢定皆有兩種可能的錯誤。型 I 錯誤的發生是當我們拒絕一個真的虛無假設。型 II 錯誤的發生是當我們無法拒絕一個錯誤的虛無假設。犯型 I 與型 II 錯誤的機率是： P ( 型 I 錯誤) ＝  P ( 型 II 錯誤) ＝  α 被稱為顯著水準(significance level)。第10章假設檢定的介紹與單一母體的推論第頁

第10章假設檢定的介紹與單一母體的推論第253頁表10.1
錯誤的型態型 I 錯誤(Type I error) 發生於當我們拒絕了一個真實的虛無假設。型 II 錯誤(Type II error) 發生於當我們不拒絕一個錯誤的虛無假設(例，沒有拒絕 H0，當它是錯誤的)。第10章假設檢定的介紹與單一母體的推論第253頁表10.1

範例10.1　百貨公司的新收費系統某百貨公司的經理想要對公司的信用卡顧客發展一套新的收費系統。在全面的財務分析之後，她判定只有在平均每月帳上金額高於$170 時，新系統才會符合成本效益。隨機抽出400 個每月帳戶為樣本，帳戶金額的樣本平均數為$178。該經理知道帳戶金額近似於常態分配，標準差為$65。該經理可否從上述資料做出新系統將會符合成本效益的結論？第10章假設檢定的介紹與單一母體的推論第257頁

範例10.1　百貨公司的新收費系統辨認方法這個範例處理百貨公司信用卡帳戶的母體。為了下結論說新系統將會符合成本效益，經理必須證明所有顧客的平均帳戶金額是大於$170。我們設定對立假設來表達這個狀況： H1: µ > 170 (這是我們要確定的) 虛無假設可以被表達成： H0: µ ≤ 170 (對我們感興趣的參數指定一個單一的數值) 第10章假設檢定的介紹與單一母體的推論第257頁

範例10.1　百貨公司的新收費系統辨認方法所以可寫成： H0: µ ≤ 170 （假設此項為真） H1: µ > 170 已知： n = 400 = 178 σ = 65 接下來該如何推論？第10章假設檢定的介紹與單一母體的推論第257頁

範例10.1　百貨公司的新收費系統計算為了檢定我們的假設，我們可以使用兩種不同方法：第一個被稱為拒絕域法(rejection region method) ，當手動計算時，通常使用此方法。第二種是 p-值法(p-value approach)，一般而言它最好結合電腦和統計軟體來使用。我們將依次介紹兩種方法。第10章假設檢定的介紹與單一母體的推論第257頁

第10章假設檢定的介紹與單一母體的推論第258頁圖10.1
範例10.1　拒絕域計算當樣本平均數的值相對於170 是很大時，拒絕虛無假設而支持對立假設似乎很合理。 α = P(型 I 錯誤) α= P (給定H0是真的情況下拒絕H0) = P (給定H0是真的情況下 ) 第10章假設檢定的介紹與單一母體的推論第258頁圖10.1

範例10.1 百貨公司的新收費系統計算左邊算式的，並與 µ = 170做比較。計算我們需要一個顯著水準（α）來計算此項
範例10.1　百貨公司的新收費系統計算計算左邊算式的，並與 µ = 170做比較。我們需要一個顯著水準（α）來計算此項第10章假設檢定的介紹與單一母體的推論第258頁

範例10.1　百貨公司的新收費系統計算假設該總經理選擇 α 為5%，接下來可得Zα = Z.05 = 1.645。我們現在能夠計算的值：由於樣本平均數(178)大於我們計算出的值(175.34)，我們拒絕虛無假設並支持對立假設，μ >170，也就是裝設新系統符合成本效益。第10章假設檢定的介紹與單一母體的推論第259頁

範例的抽樣分配 H0:  ≤ 170 H1:  > 170 拒絕 H0 並且支持 H1為真第10章假設檢定的介紹與單一母體的推論第261頁圖10.2

標準化檢定統計量一個比較簡單的方法是使用標準化檢定統計量(standardized test statistic)：並且將其結果與Z 相比較: (拒絕域： z > Z ) 因為 z = 2.46 大於1.645(Z.05)，所以拒絕 H0 並支持 H1。第10章假設檢定的介紹與單一母體的推論第260頁

範例11.1 Z 的抽樣分配 H0:  = 170 H1:  > 170 Z.05=1.645 z = 2.46 拒絕 H0 並且支持H1為真第11章假設檢定的介紹與單一母體的推論第261頁圖10.3

p-值一個檢定的p-值(p-value of a test) 是在給定虛無假設為真的條件下，觀測到一個檢定統計量至少像計算所得數值一樣極端的機率。在範例10.1 中，觀測到一個樣本平均數至少像已經觀察到的樣本一樣極端的機率(如：178)，給定的虛無假設(H0: µ = 170)是否為真？ p-值第10章假設檢定的介紹與單一母體的推論第262頁

p-值 p-值 = P(Z > 2.46) p-值 =.0069 z =2.46 第10章假設檢定的介紹與單一母體的推論第262頁圖10.4

描述 p-值 p-值越小，越多測量證據存在以支持對立假設：假如 p-值小於.01，有壓倒性的(overwhelming) 證據支持對立假設是對的。假如 p-值介於.01 和.05 之間，有強烈的(strong) 證據支持對立假設是對的。假如 p-值介於.05 和.10 之間，有微弱的(weak) 證據支持對立假設是對的。假如 p-值超過.10 時，沒有證據支持推論對立假設是對的。因為 p-值為 .0069，所以有壓倒性的證據支持H1:  > 170。第10章假設檢定的介紹與單一母體的推論第頁

描述 p-值 p =.0069 第10章假設檢定的介紹與單一母體的推論第265頁圖10.6

描述 p-值比較 p-值及顯著水準的選擇值：假如 p-值小於，我們判斷 p-值夠小去拒絕虛無假設。假如 p-值大於，我們不拒絕虛無假設。當p-值 = <  = .05，我們拒絕 H0 且支持H1。第10章假設檢定的介紹與單一母體的推論第265頁

詮釋一個檢定的結果假如我們拒絕虛無假設，我們下結論說有足夠的統計證據去推論對立假設是真的。假如我們不拒絕虛無假設，我們下結論說沒有足夠的統計證據去推論對立假設是真的。切記：對立假設是結論的焦點。它呈現了我們想要調查與探討的內容。第10章假設檢定的介紹與單一母體的推論第266頁

範例10.2　SSA 信封計畫　聯邦快遞(FedEx) 寄發票給顧客要求 30 天之內付費。帳單上會列出付款地址，且期望顧客使用他們自己的信封寄回他們的付款。目前，付清帳單所需時間的平均數與標準差分別是24 天與 6 天。財務長(CFO) 相信附上一個回郵 (stamped self-addressed, SSA)信封會縮短付款時間。第10章假設檢定的介紹與單一母體的推論第頁

範例10.2　SSA 信封計畫她計算減短2 天的付款時間以改善現金流量，將能支付信封與郵票的成本。若更進一步地減短付費時間，將會產生利潤。為了測試她的想法，她隨機選取220 位顧客且隨著發票附上一個回郵信封寄出。收到付款所需的天數被記錄下來。這位財務長是否能夠下結論說這項計畫是有利潤的？第10章假設檢定的介紹與單一母體的推論第267頁

範例10.2　SSA 信封計畫辨識方法這項研究的目的是對平均付款時間推導結論。因此，要被檢定的參數是母體平均數 。我們想知道是否存在足夠的統計證據以顯示母體平均數是少於22 天。因此，對立假設為 H1: μ < 22 虛無假設為 H0: μ = 22 第10章假設檢定的介紹與單一母體的推論第267頁

範例10.2　SSA 信封計畫辨識方法檢定統計量為只有當樣本平均數與其導出的檢定統計量的數值夠小的時候，我們會拒絕虛無假設且支持對立假設。結果，我們設定的拒絕域位置會在抽樣分配的左尾。我們設定10% 的顯著水準。第10章假設檢定的介紹與單一母體的推論第267頁

範例10.2　SSA 信封計畫計算拒絕域為：由Xm11-00資料，我們計算出和 P-值 = P(Z < −.91) = .5 − = .1814 第10章假設檢定的介紹與單一母體的推論第268頁

範例10.2 SSA 信封計畫結論：沒有充分的證據去推論平均付款時間小於22 天。沒有足夠的證據去推論這項計畫將會是有利益的。詮釋

單尾與雙尾檢定在範例10.1與範例10.2中，執行的統計檢定被稱為單尾檢定(one-tail test)，因為拒絕域只位於抽樣分配的單尾。更正確地說，範例10.1 是右尾檢定的範例之一。第10章假設檢定的介紹與單一母體的推論第258頁圖10.1

雙尾檢定雙尾檢定被用於當我們想要檢定參數不等於某些值的研究假設。第10章假設檢定的介紹與單一母體的推論

範例10.3　 AT&T 和其競爭者的比較近年來，數家公司已成立並投入與 AT&T 長途電話的競爭。這些公司全都廣告它們的費率比 AT&T 的低，也因此它們的帳單將會比較便宜。 AT&T 辯稱，平均而言，AT&T 對顧客的收費與其他公司並沒有差別。假設一個替AT&T 工作的統計實作者認定該公司的居家客戶每月長途電話帳單的平均數與標準差分別是 $17.09 和 $3.87。第10章假設檢定的介紹與單一母體的推論第269頁

範例10.3　 AT&T 和其競爭者的比較他接著隨機抽取了100 位顧客為樣本，並使用一個首要競爭者的費率重新計算這些顧客上個月的帳單。假設這個母體的標準差與AT&T 的相同，我們能否下結論說在5% 的顯著水準下，AT&T 帳單平均數與首要競爭者之間存在著差異？第10章假設檢定的介紹與單一母體的推論第269頁

範例10.3　 AT&T 和其競爭者的比較辨識方法被檢定的參數是AT&T客戶帳單之母體平均數，是以首要競爭者的費率為計算基準。在這個問題中，我們想要知道平均每月長途電話帳單是否不同於$17.09。所以，對立假設為： H1: µ ≠ 虛無假設必然為： H0: µ = 17.09 第11章假設檢定的介紹與單一母體的推論第頁

範例10.3　 AT&T 和其競爭者的比較辨識方法拒絕域被設定，所以當檢定統計量很大或很小的時候，我們能夠拒絕虛無假設也就是，我們必須設定一個雙尾拒絕域(two-tail rejection region)。因為在拒絕域的總面積必須是，我們將這個機率除以 2。統計量很“小” 統計量很“大” 第10章假設檢定的介紹與單一母體的推論第270頁

範例10.3　 AT&T 和其競爭者的比較辨識方法在5%的顯著水準之下（α = .05），可知 α/2 = .025。因此，Z.025 = 1.96 的拒絕域為 z < –1.96 -或- z > 1.96 z –Z.025 +Z.025 第10章假設檢定的介紹與單一母體的推論第270頁

範例10.3　 AT&T 和其競爭者的比較計算從資料(Xm11-02)，我們可計算出檢定統計量的值是：我們發現：因為 z = 1.19 既不大於1.96 也不小於 − 1.96，我們不能拒絕虛無假設且支持H1，即「沒有充足的證據去推論 AT&T 的帳單與競爭者的有差異」。第10章假設檢定的介紹與單一母體的推論第270頁

範例10.3 　雙尾檢定的 p-值計算一般而言，雙尾檢定的 p-值被計算如下 p-值 = 2P(Z > |z|) 其中 z 是檢定統計量的數值，而|z| 是它的絕對值。在範例11.2中，我們可得知 p-值 = P(Z < 1.19) + P(Z > 1.19) = = .2340 第10章假設檢定的介紹與單一母體的推論第270頁

雙尾檢定與單尾檢定總整理單尾檢定（左尾）雙尾檢定（右尾）第10章假設檢定的介紹與單一母體的推論

發展對統計觀念的了解 1 如同信賴區間估計量，假設檢定是依據樣本統計量的抽樣分配。假設檢定的結果是一個關於樣本統計量的機率陳述。我們假設母體平均數是虛無假設所設定的值。第10章假設檢定的介紹與單一母體的推論第272頁

發展對統計觀念的了解 1 我們接著將計算檢定統計量，和測量當虛無假設為真時觀察到一個如此大（或小）數值的可能性。假如這個機率很小，我們下結論說「虛無假設為真」的假設不能被證實且我們拒絕它。第10章假設檢定的介紹與單一母體的推論第272頁

發展對統計觀念的了解 2 當我們( 或電腦) 計算檢定統計量的值我們測量樣本統計量和參數設定值之間的差異，相當於幾個標準誤
當我們( 或電腦) 計算檢定統計量的值我們測量樣本統計量和參數設定值之間的差異，相當於幾個標準誤第10章假設檢定的介紹與單一母體的推論第272頁

發展對統計觀念的了解 2 在範例10.3 中，我們發現檢定統計量的值是 z ＝ 1.19。意指樣本平均數比  的參數設定值大1.19 個標準誤。標準常態機率表告訴我們這個值並非不可能。因此，我們不拒絕虛無假設。測量樣本統計量和參數設定值之間相差幾個標準誤的觀念將在本書中繼續使用。第10章假設檢定的介紹與單一母體的推論第272頁

後續學習統計實作人員經常採用的統計方法定義計算詮釋測量最困難的部分(在現實生活中或是期末考時)是辨認正確的方法。
統計實作人員經常採用的統計方法定義計算詮釋測量最困難的部分(在現實生活中或是期末考時)是辨認正確的方法。第10章假設檢定的介紹與單一母體的推論第275頁 11.56

後續學習許多因素可用來辨認正確的方法，但是其中兩個因素特別的重要： 1. 資料的類型區間、順序和名目 2. 問題的目的
許多因素可用來辨認正確的方法，但是其中兩個因素特別的重要： 1. 資料的類型區間、順序和名目 2. 問題的目的第10章假設檢定的介紹與單一母體的推論第275頁

問題的目的描述一個母體比較兩個母體比較兩個或更多母體分析兩個變數的關係分析兩個或更多變數的關係

第10章假設檢定的介紹與單一母體的推論第277頁表11.3頁
表10.3　統計推論的導覽：介紹每一種方法的章節第10章假設檢定的介紹與單一母體的推論第277頁表11.3頁

公式推導各種因素決定我們感興趣的參數(例：母體平均數 )。每一個參數有其「最佳」估計量(統計)(如樣本平均數。統計學有抽樣分配
每一個參數有其「最佳」估計量(統計)(如樣本平均數　。統計學有抽樣分配這個公式表示抽樣分配通常是檢定統計量的公式。使用一點代數，我們就能從抽樣分配導出的信賴區間估計量。第10章假設檢定的介紹與單一母體的推論第277頁

對單一母體的推論我們將發展估計與檢定三個母體參數的方法：母體平均數 μ 母體變異數 2 母體比例 p 母體樣本推論統計量參數
第10章假設檢定的介紹與單一母體的推論

在母體標準差未知下進行單一母體平均數的推論
先前，我們著重於當母體標準差已知或給定時，估計與檢定母體平均數：但是我們如何知道實際的母體變異數? 我們以學生 t 統計取代，給定：第10章假設檢定的介紹與單一母體的推論第278頁

在母體標準差未知下進行單一母體平均數的推論
當母體標準差未知且母體是常態時，我們使用其點估計 s t-統計量取代了 z-統計量，其自由度 v 為 n – 1 。第10章假設檢定的介紹與單一母體的推論第278頁

當σ 未知時，μ 的檢定統計量當母體標準差未知且母體是常態時，相關假設檢定的檢定統計量是：它是自由度為 v = n – 1的學生t 分配，μ 的信賴區間估計量：第10章假設檢定的介紹與單一母體的推論第278頁

Keller: Stats for Mgmt & Econ, 8th Ed
範例10.4　報紙回收計畫 2017年3月19日星期日在未來可能很多國家必須更努力於拯救環境，人們的行動包括減少使用能源和加強回收。目前(2007年)，大部分由回收材料所製造的產品比起那些由地球原始材料所製造的產品明顯地比較昂貴。第10章假設檢定的介紹與單一母體的推論第279頁 Copyright © 2008 Brooks/Cole, a division of Thomson Learning, Inc.

範例10.4　報紙回收計畫報紙例外。回收報紙可能是有利可圖的。從各家庭回收報紙是一項主要的費用。最近，數家公司加入蒐集家庭過期報紙並再利用的行業。一位財務分析師為這類的公司計算，如果平均每星期從每戶家庭蒐集的報紙超過2.0磅，則公司將可以賺取利潤。第10章假設檢定的介紹與單一母體的推論第279頁

範例10.4　報紙回收計畫一項研究決定回收場的可行性，從一個大型的社區中抽取一個148戶家庭的隨機樣本，每星期每一戶家庭回收丟棄的報紙重量被記錄。Xm12-01* 這些資料是否提供充分的證據讓這位分析師下結論回收計畫是有利可圖的？第10章假設檢定的介紹與單一母體的推論第279頁

範例10.4　報紙回收計畫辨識方法問題的目的是描述(describe)每一戶家庭每週廢報紙量的母體。資料的尺度是區間的，表示母體平均數是需要被檢定的參數。我們想知道是否有足夠的證據決定平均數大於2.0磅，因此：因此，虛無假設中的數值是 H1: µ > 2.0 H0: µ = 2.0 第10章假設檢定的介紹與單一母體的推論第頁

範例10.4 報紙回收計畫檢定統計量是：因為對立假設是： H1:  > 2.0 拒絕域則為：辨識方法
範例10.4　報紙回收計畫辨識方法檢定統計量是：因為對立假設是： H1:  > 2.0 拒絕域則為：第10章假設檢定的介紹與單一母體的推論第280頁

範例10.4　報紙回收計畫詮釋檢定統計量的值是 t = 2.23 而且它的 p-值是.0136。沒有充分的證據去推論被丟棄報紙的平均重量是大於 2.0的。但是注意是有一些證據存在的；p-值是。然而，因為我們想要犯型 I 錯誤的機率小一點，我們堅持要求 1%的顯著水準。因此，我們不能下結論說回收場將會有利可圖。第10章假設檢定的介紹與單一母體的推論第281頁

範例10.5　審核報稅的稅收在2010 年( 最新年份的報告)，在美國提出的報稅共有142,823,000件。美國國稅局(Internal Revenue Service, IRS) 審查其中的1.107% 或1,581,000 件以確定他們是否正確地報稅。為了判定審計人員的執行績效如何，從這些報稅中選出一個隨機樣本，並且記錄其補稅額。Xm12-02 以95% 的信心估計從1,581,000 件審查報稅檔案的平均補稅額。第10章假設檢定的介紹與單一母體的推論第281頁

範例10.5　審核報稅的稅收辨識方法問題的目的是描述附加所得稅的母體。資料的尺度是區間的。此問題要求我們估計的參數是附加所得稅的母體。信賴區間的估計量是第10章假設檢定的介紹與單一母體的推論第281頁

範例12.2　審核報稅的稅收詮釋我們估計所徵收的平均補稅額是介於$8,887 與$10,168 之間。我們可以使用這項估計值去決定是否 IRS 審核了應該被審核的個人。第10章假設檢定的介紹與單一母體的推論第283頁

檢查必要的條件學生 t 分配是穩健的(robust)，指的是假如母體不是常態， t-檢定的信賴區間估計值仍然是合適的，只要母體「不是極端地非常態」。為了檢查這個必要的條件，我們繪製直方圖來決定它們是否嚴重地偏離鐘形分配。假如直方圖極端地(假定在一個指數分配的情況下)，其可能被視為「極端地非常態」，則t-統計量在這範例中不是合理的。第10章假設檢定的介紹與單一母體的推論第283頁

圖10.10　範例10.4的直方圖第10章假設檢定的介紹與單一母體的推論第284頁圖10.10

圖12.3　範例12.2的直方圖第10章假設檢定的介紹與單一母體的推論第284頁圖10.11

發展對統計觀念的了解 1 本節介紹了自由度(degrees of freedom) 這個專有名詞。因為我們將會陸續在本書中看到這個名詞，所以有必要對其意義提供一個簡短的討論。學生t 分配立基於使用樣本變異數去估計未知的母體變異數。樣本變異數定義為為了計算s2，我們必須先決定。第10章假設檢定的介紹與單一母體的推論第284頁

發展對統計觀念的了解 1 回顧之前的概念，抽樣分配是源自於對相同的母體進行重複抽樣而導出。為了計算 s2 而重複抽樣，對樣本中的前 n － 1 個觀測值，我們可以選取任何數值。但是，對第n 個數值我們不能選取，因為樣本平均數必須先被計算。為了說明這個觀念，假設 n ＝ 3 而且我們求出＝ 10。我們可以沒有限制地假設x1 和x2 為任何數值。但是，x3 的值必須能夠使＝ 10。第10章假設檢定的介紹與單一母體的推論第284頁

發展對統計觀念的了解 1 例如，假如 x1 ＝ 6 且 x2 ＝ 8，則 x3 就必須等於16。所以，在我們選擇樣本時只有2 個自由度。我們說我們損失掉1 個自由度，因為我們必須先計算。注意到 s2 計算式的分母是等於自由度。這並不是一個巧合，而且還會在本書中重複看到。第10章假設檢定的介紹與單一母體的推論第285頁

發展對統計觀念的了解 2 與 z-統計量相同，t-統計量以相當於幾個標準誤的方式，衡量樣本平均數與假設值之間的差異。然而，當母體標準差是未知時，我們以估計標準誤。第10章假設檢定的介紹與單一母體的推論第285頁

發展對統計觀念的了解 3 當我們在8.4節中介紹學生 t 分配，我們指出它比標準常態分配來的分散。這個狀況是合乎邏輯的。在z-統計量的唯一變數是樣本平均數，其隨著樣本的不同而改變。第10章假設檢定的介紹與單一母體的推論第285頁

發展對統計觀念的了解 3 t-統計量則有兩個變數，樣本平均數和樣本標準差 s，兩者皆會隨著不同的樣本而改變。因為比較大的不確定性，t-統計量將會呈現較大的變異性。第10章假設檢定的介紹與單一母體的推論第285頁

單一母體變異數的推論假如我們對推論母體的變異性感興趣，我們必須調查的參數是母體的變異數 σ2 。樣本變異數s2 是 σ2的一個不偏的、一致的估計量。此外，統計量被稱為卡方統計量(chi-squared statistic,2-statistic)，它會服從自由度為 v ＝ n －1 的卡方分配。第10章假設檢定的介紹與單一母體的推論第頁

檢定與估計一個母體變異數用於 σ2 假設檢定的檢定統計量是：它會服從自由度為 v＝ n －1 的卡方分配。

檢定與估計一個母體變異數我們可以做下列機率敘述：代入可以推導出一個母體變異數的信賴區間估計量σ2：信賴下限信賴上限
第10章假設檢定的介紹與單一母體的推論第頁

範例容器填充機的一致性，第一部分Xm12-03 容器填充機被用於填充各種的液體，包括牛奶、飲料與油漆等。理想的情況是，各個瓶中的液體量應該只有些微的不同，因為較大的變異會導致有些容器裝填不足(欺騙顧客)而有些裝填過量(導致成本上的浪費)的情況。一家開發新型機器公司的總裁誇耀他們的機器能夠非常一致地填充 1 公升(1,000 立方公分)的容器，使得裝填的變異數小於 1 立方公分。第10章假設檢定的介紹與單一母體的推論第289頁

範例10.6　容器填充機的一致性，第一部分為了檢定這項宣稱的真實性，選取 25 個填滿 1 公升容器的隨機樣本，並且記錄結果。這些資料是否容許該總裁在 5% 的顯著水準下做此宣稱？第10章假設檢定的介紹與單一母體的推論第頁

範例10.6　容器填充機的一致性，第一部分辨識方法問題的目的是描述這部機器裝填 1 公升容器容量的母體。資料是區間尺度，而我們對裝填量的變異性感興趣。感興趣的參數是母體變異數 σ2。第10章假設檢定的介紹與單一母體的推論第290頁

範例10.6　容器填充機的一致性，第一部分辨識方法因為我們想決定是否存在充分的證據支持這項宣稱，對立假設為虛無假設為以及我們將使用的檢定統計量是 H1: 2 < 1 H0: 2 = 1 第10章假設檢定的介紹與單一母體的推論第290頁

範例10.6　容器填充機的一致性，第一部分計算使用計算機，我們求出與因此，第10章假設檢定的介紹與單一母體的推論第290頁

範例10.6　容器填充機的一致性，第一部分計算檢定統計量的值是拒絕域是因為15.20 不小於13.85，我們不能拒絕虛無假設而支持對立假設。第10章假設檢定的介紹與單一母體的推論第頁

範例10.6　容器填充機的一致性，第一部分詮釋沒有足夠的證據去推論這項宣稱為真。如同我們先前討論過的，這個結果並未說明變異數是等於 1；它只敘述我們無法證明變異數是小於 1。第10章假設檢定的介紹與單一母體的推論第291頁

範例10.7 容器填充機的一致性，第二部分以99%的信心估計範例10.6中裝填量的變異數。 Xm12-03
範例10.7　容器填充機的一致性，第二部分以99%的信心估計範例10.6中裝填量的變異數。 Xm12-03 第10章假設檢定的介紹與單一母體的推論第291頁

範例10.7　容器填充機的一致性，第二部分詮釋在範例10.6中，我們看到沒有充分的證據去推論母體變異數是小於 1的。在此我們看到 σ2 被估計落在.3336與1.5375之間。此區間的一部分是在 1 之上，這告訴我們該變異數可能大於 1，確認了我們在範例10.6中所達成的結論。第12章假設檢定的介紹與單一母體的推論第292頁

範例10.7　容器填充機的一致性，第二部分詮釋我們可能可以使用這個估計值來預測瓶子填充過量與填充不足的百分比。這可能容許我們在具競爭性的機種中做選擇。第10章假設檢定的介紹與單一母體的推論第292頁

檢查必要的條件就像在10.4 節中所介紹的t-檢定與 的估計量，卡方檢定與2 的估計量在理論上需要抽樣的母體為常態。但是在實務上，只要母體不是極端地非常態，這種方法是有效的。我們可以藉由畫直方圖的方式來測量非常態性的程度。圖10.13描繪 Excel 版本的直方圖。如你所見，填充量顯示出些許的不對稱性。但是，此變數並沒有呈現極端的非常態。我們結論說所需的常態性並沒有被嚴重地違反。第10章假設檢定的介紹與單一母體的推論第292頁

檢查必要的條件第10章假設檢定的介紹與單一母體的推論第292頁圖10.13

單一母體比例的推論當資料是名目時，我們計數每一個數值發生的次數。因此，在描述一個名目資料的母體時，感興趣的參數是母體的比例 p。這個參數被用來計算二項實驗的機率。回想這個統計量的用法：是樣本比例 x 是樣本大小 n 中成功的次數。第10章假設檢定的介紹與單一母體的推論第294頁

單一母體比例的推論 np 與 n(1–p) 大於 5 的條件下，的抽樣分配近似於常態平均數： = p 標準誤：因此，抽樣分配為：

單一母體比例的推論 p 的檢定統計量為： p 的信賴區問估計量。結果是 (當np 與 n(1–p) 大於5時)

範例10.8　選舉日投票處出口民意調查總統或某大州參議員的競選，電視網會積極地競爭，看哪一家能夠搶先預測出競選的贏家。這可以透過投票處出口民意調查(exit polls) 來執行。根據選民的一個隨機樣本，當他們離開投票處時，詢問他們的票投給了誰，再藉由詢問所獲得的資料，計算出選民支持候選人的樣本比例。第10章假設檢定的介紹與單一母體的推論第296頁

範例10.8　選舉日投票處出口民意調查美國總統選舉中，在一個州當中得到最多選票的候選人獲得該州代表投票選總統的投票權。實際上，這意味共和黨或是民主黨的候選人其中之ㄧ會贏。假設一個州當中，出口處民意調查的結果被記錄為 1 =民主黨編碼與 2 =共和黨編碼。Xm12-05* 第10章假設檢定的介紹與單一母體的推論第296頁 12.102

範例10.8　選舉日投票處出口民意調查投票結束於晚間 8點。由這些資料，電視網是否能夠下結論說共和黨的候選人將會勝選？電視網是否應該在晚間 8點1分宣佈共和黨的候選人將會勝選？第10章假設檢定的介紹與單一母體的推論第296頁

範例10.8　選舉日投票處出口民意調查辨識方法問題的目的是描述一個州的投票母體 · 資料是名目的，因為這些數值是「民主黨」與「共和黨」。因此要檢定的參數是整個州之內投票給共和黨候選人的比例。因為我們想決定是否電視網可以在晚間8:01 宣佈共和黨的候選人是勝選者，對立假設為 H1: p > .5 虛無假設為 H0: p = .5 第10章假設檢定的介紹與單一母體的推論第296頁

範例10.8　選舉日投票處出口民意調查辨識方法檢定統計量為第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查計算這是一個「標準的」問題，它需要一個5%的顯著水準。因此，拒絕域為從檔案中，我們計算「成功」的個數，其為投給共和黨候選人的票數，並得到 x ＝ 407。樣本大小為765。因此，樣本比例為第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查計算檢定統計量的數值為由於檢定統計量是(近似地) 服從常態分配，我們可以決定p-值。它是在5% 的顯著水準下，有充分的證據推論共和黨候選人勝選。第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查詮釋使用5%的顯著水準，我們拒絕虛無假設並且下結論說有充分的證據去推論共和黨贏得選舉。然而，這是否為正確的選擇？第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查詮釋在此考慮的關鍵問題是型 I 與型 II 錯誤的成本。如果我們下結論說共和黨將會贏，事實上共和黨輸了，則發生型 I 錯誤。第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查詮釋這類錯誤的意思是電視網在晚間 8點1分宣佈共和黨候選人已經贏得選舉，稍晚必須承認這是一項錯誤。如果只有一家特定的電視網犯此一錯誤，將造成觀眾對他們的誠信產生懷疑並可能影響觀眾的人數。第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查詮釋這確實是發生在 2000 年 11 月美國總統選舉當晚的情況。在晚間 8點投票結束後不久，所有的電視網皆宣佈民主黨候選人高爾將會在佛羅里達州獲勝。數小時之後，各家電視網承認錯誤並宣佈共和黨布希已經獲勝。第10章假設檢定的介紹與單一母體的推論第297頁

範例10.8　選舉日投票處出口民意調查詮釋幾小時之後他們再次承認錯誤，並宣佈此一選舉的結果太接近而無法分出勝負。幸運地，所有的電視網犯了相同的錯誤。但是，如果有一家電視網沒有犯此一錯誤，它將保有更好的記錄，在未來可能被使用於新聞節目的廣告中，並可能吸引更多的觀眾。在此考慮的關鍵問題是型 I 與型 II 錯誤的成本，其使用1%的顯著水準較好。第10章假設檢定的介紹與單一母體的推論第298頁

選擇估計比例的樣本大小當我們在9.3節中介紹估計一個平均數的樣本大小選擇方法時，我們指出樣本大小依賴信賴水準及統計實作人員能夠容忍的估計誤差範圍。當要估計的參數是一個比例時，此一估計誤差範圍是第10章假設檢定的介紹與單一母體的推論第298頁

選擇估計比例的樣本大小為了求 n 的解，我們產生必要的樣本大小以估計 p ，其中B 是估計的誤差範圍遺憾的是，這個數值通常是未知的。
第10章假設檢定的介紹與單一母體的推論第頁

選擇估計比例的樣本大小兩種方法—— 每一個案例我們可以為選擇一個值，然後解 n 的方程式。方法1：如果我們甚至連的近似值都沒有的時候，這是「最差的情況」所以我們以取代之。方法2：我們對的值有些概念。這是比較好的情況，並且我們代入估計值。第10章假設檢定的介紹與單一母體的推論第頁

選擇估計比例的樣本大小方法1：沒有的值，使用50%：方法2：對的值有些概念：所以，在開始之前，若我們已經有母體比例的合理估計值，我們可以只抽樣少數人。第10章假設檢定的介紹與單一母體的推論第頁

第 10 章假設檢定的介紹與單一母體的介紹.

Similar presentations

Presentation on theme: "第 10 章假設檢定的介紹與單一母體的介紹."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第 10 章 假設檢定的介紹與單一母體的介紹.

Similar presentations

Presentation on theme: "第 10 章 假設檢定的介紹與單一母體的介紹."— Presentation transcript:

Similar presentations

About project

反馈

第 10 章假設檢定的介紹與單一母體的介紹.

Presentation on theme: "第 10 章假設檢定的介紹與單一母體的介紹."— Presentation transcript: