第十章 兩母體之假設檢定 Inferences Based on Two-Samples: Tests of Hypothesis Chapter 10 10 - 1
學習目標 延伸假設檢定之基本觀念到兩母體假設檢定 兩獨立母體假設檢定之型態介紹 兩相依母體假設檢定之型態介紹 無母數檢定 10 - 2
章節介紹 兩獨立母體之比較 兩母體成功比例差之Z檢定-大樣本 兩母體變異數比例之F檢定 兩相依(配對)母體之比較 兩獨立母體平均數差之Z檢定 具有共同變異數之兩母體平均數差之T檢定 兩母體成功比例差之Z檢定-大樣本 兩母體變異數比例之F檢定 兩相依(配對)母體之比較 配對樣本 Z 檢定 配對樣本 T 檢定 10 - 3
無母數檢定 魏克森等級合( Wilcoxon rank-sum)檢定 魏克森符號等級( Wilcoxon Sign-rank)檢定 (continued) 無母數檢定 魏克森等級合( Wilcoxon rank-sum)檢定 魏克森符號等級( Wilcoxon Sign-rank)檢定 10 - 4
兩母體檢定:說明 在前面章節中,我們曾經討論了兩母體的區間估計,包括兩母體平均數差的區間估計,兩母體比例差的區間估計,及兩母體變異數比的區間估計。現在我們改以假設檢定的方法來討論它們。兩母體平均數差異的假設檢定分為兩母體獨立與不獨立兩種。其中又分大樣本與小樣本兩種情形。 10 - 5
估計母體的各項未知參數 母體參數 樣本統計 Mean x Proportion p p Variance s (parameters) (statistic) Mean x ^ Proportion p p Variance 2 2 s Differences - x - x 1 2 1 2 10 - 6
估計的過程 母體Population 結論 隨機樣本 Decision Random Sample 母體之平均數m=50 母體平均數, , 未知 Mean x = 50 Sample 10 - 7 9
信賴區間 (confidence intervals) 1. 大樣本(n 30), 平均數 m (若s未知,以s 代替) (1-a)100%信賴區間 `x - za/2 ---- < m < `x + za/2 ---- 2. 大樣本(np5; nq5), 百分比 p , [ q=(1-p) ] p - za/2 pq/n < p < p + za/2 pq/n 估計誤差 s s n n 信賴水準 ^ ^ ^ ^ ^ ^ 10 - 8
平均數m信賴區間 3. 小樣本(n < 30), 母體常態, 變異數不知 (1-a)100%信賴區間(confidence interval) `x - ta/2 ---- < m < `x + ta/2 ---- 4. 若比較兩個平均數或兩個百分比公式雷同 s s n n 10 - 9
假設檢定 (testing hypothesis) 我想各位年平均存錢超過 50萬 (研究假設) 猜錯了! 差太多! 母體 隨機抽樣 樣本平均 x = 20萬 10 - 10
何謂假設 (Hypothesis)? 我認為各位每年儲蓄平均超過50萬! 對於母體的某一特性的信念論述 母體的特性可能為平均數、百分比、變異數 僅建立兩種假設 虛無的特定假設(Ho) 研究假設(Ha)或稱對立假設 我認為各位每年儲蓄平均超過50萬! 10 - 11 ?1984-1994 T/Maker Co.
建立Ho及Ha的步驟 如何認定Ho,Ha對錯? 例題 步驟 各位平均年儲蓄超過50萬? (右尾檢定) 1. 將問題以統計方式敘述 1. {平均超過50萬} 2. Ha: > 50 3. {平均沒超過50萬} 4. Ho: 50 步驟 1. 將問題以統計方式敘述 2. 確定研究假設, Ha Ha以不等式表達 , <, or > 稱之雙尾或單尾檢定 3. 確定虛無假設, Ho Ho內一定有 ‘=’ =, , 如何認定Ho,Ha對錯? 10 - 12
基本觀念 Ho之平均數的樣本分配 H0中的‘=’基準 根據所得樣本平均數為20; 符合虛無假設所述 Ho: m=5 `X 20 10 - 13 H0中的‘=’基準
左尾檢定: 左尾拒絕區 Ho: `X的樣本分配 顯著水準, a Ho: m=m0 Ha: m<m0 `X m0 拒絕區 10 - 14 Rejection region does NOT include critical value. `X m0 拒絕區 10 - 14
檢定統計量(test statistic) 若計算下列檢定統計值後看是否落在拒絕區 1. 平均數 大樣本: Z = (`X-m) / (s/n) - 用Z–表 小樣本: t = (`X-m) / (s/n) - 用 t –表 2. 百分比 大樣本: Z = (p-p0) / (p0q0 /n) -用Z–表 3. 其它(卡方表、F–表) ^ 10 - 15
兩獨立樣本Z檢定 (當兩母體變異數已知) 兩母體平均數差 之檢定─Z檢定 1.若母體皆為常態分配且變異數皆已知,則不論樣本大小皆以常態分配處理。 2.若不知母體分配為何,且皆為大樣本時也以常態分配處理。 10 - 16
兩獨立樣本Z檢定 (當兩母體變異數已知) 假設條件 隨機且獨立抽取自常態分配母體之樣本 母體變異數已知 檢定統計量 10 - 17
兩獨立樣本Z檢定 (當兩母體變異數已知) 需無假設H0與對立假設H1之設定 H0: m 1 = m 2 H1: m 1 ¹ m 2 Two Tail OR H0: m 1 £ m 2 H1: m 1 > m 2 H0: m 1 - m 2 £ 0 H1: m 1 - m 2 > 0 Right Tail OR H0: m 1 ³ m 2 H0: m 1 - m 2 ³ 0 H1: m 1 - m 2 < 0 Left Tail OR H1: m 1 < m 2 10 - 18
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1 設義美餅乾製造商有二台機器同時生產每塊標準重量5公克之餅乾,若已知兩機器之母體標準差分別為0.21及0.35,現自二台機器所生產的餅乾中各抽驗100塊,其平均重量如下,試於母體分配為常態的前提下,檢定二台機器之產品重量是否一致?(=0.01) 機器 平均重量 母體標準差(已知) 1 5.08 0.21 2 4.91 0.35 10 - 19
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1題解 1.設立虛無假設與對立假設為: 10 - 20
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1題解 1.設立虛無假設與對立假設為: 2.檢定統計量Z為 10 - 21
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1題解 1.設立虛無假設與對立假設為: 2.檢定統計量Z為 3.檢定統計量Z的觀測值為 10 - 22
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1題解 4.決策: 檢定統計量Z的觀測值z=4.17大於 ,故拒絕虛無假設。 10 - 23
兩獨立樣本Z檢定(當兩母 體變異數已知):例題1題解 4.決策: 檢定統計量Z的觀測值z=4.17大於 ,故拒絕虛無假設。 5.結論: 由上面檢定結果可以拒絕虛無假設,故可下結論:「兩台機器生產的餅乾平均重量並不相等。」 10 - 24
兩獨立樣本Z檢定 (大樣本) 兩母體平均數差 之檢定─Z檢定 1.若母體皆為常態分配且變異數皆已知,則不論樣本大小皆以常態分配處理。 2.若不知母體分配為何,且皆為大樣本時也以常態分配處理。 10 - 25
兩獨立樣本Z檢定 (大樣本) 假設條件 隨機且獨立抽取之樣本 母體變異數已知或未知 兩樣本之樣本數至少30以上 檢定統計量 10 - 26
兩獨立樣本Z檢定(大樣本): 例題2 設義美餅乾製造商有二台機器同時生產每塊標準重量5公克之餅乾,現自二台機器所生產的餅乾中各抽驗100塊,其平均重量及樣本標準差如下 ,試檢定二台機器之產品重量是否一致? 機器 平均重量 樣本標準差 1 5.08 0.21 2 4.91 0.35 10 - 27
兩獨立樣本Z檢定(當兩母 體變異數已知):例題2題解 1.設立虛無假設與對立假設為: 10 - 28
兩獨立樣本Z檢定(當兩母 體變異數已知):例題2題解 1.設立虛無假設與對立假設為: 2.檢定統計量Z為 10 - 29
兩獨立樣本Z檢定(當兩母 體變異數已知):例題2題解 1.設立虛無假設與對立假設為: 2.檢定統計量Z為 3.檢定統計量Z的觀測值為 10 - 30
兩獨立樣本Z檢定(當兩母 體變異數已知):例題2題解 4.決策: 檢定統計量Z的觀測值z=4.17大於 ,故拒絕虛無假設。 5.結論: 由上面檢定結果可以拒絕虛無假設,故可下結論:「兩台機器生產的餅乾平均重量並不相等。」 10 - 31
兩獨立樣本Z檢定 (MS EXCEL之應用) 10 - 32
兩獨立樣本Z檢定 (MS EXCEL之應用) 10 - 33
兩獨立樣本Z檢定 (MS EXCEL之應用) 10 - 34
聯合變異數t 檢定 (Variances Unknown) 假設條件 兩母體為常態分配 隨機且獨立抽取之樣本,皆為小樣本 母體變異數未知但假設相等 若母體非常態分配,則需大樣本才可 10 - 35
聯合變異數t 檢定 需無假設H0與對立假設H1之設定 H0: m 1 = m 2 H1: m 1 ¹ m 2 Two Tail OR H0: m 1 £ m 2 H1: m 1 > m 2 H0: m 1 - m 2 £ 0 H1: m 1 - m 2 > 0 Right Tail OR H0: m 1 ³ m 2 H0: m 1 - m 2 ³ 0 H1: m 1 - m 2 < 0 Left Tail OR H1: m 1 < m 2 10 - 36
聯合變異數t 檢定 (continued) 聯合變異數之計算公式 10 - 37
Hypothesized difference (continued) 計算樣本統計量觀察值 Hypothesized difference 10 - 38
聯合變異數t 檢定: 例題3 假設你是一位股票分析師,你如果想要了解不同產業間( NYSE & NASDAQ )的股價是否有所差異? 因此,蒐集了以下資料做一比較: NYSE NASDAQ Number 21 25 Sample mean 3.27 2.53 Sample std dev 1.30 1.16 假設兩母體變異數相等, 請問在a = 0.05下其平均 值是否有顯著差異? 10 - 39 © 1984-1994 T/Maker Co.
例題3題解:傳統拒絕域法 H0: m1 - m2 = 0 i.e. (m1 = m2) 10 - 40
例題3題解:傳統拒絕域法 .025 .025 t H0: m1 - m2 = 0 i.e. (m1 = m2) a = 0.05 df = 21 + 25 - 2 = 44 臨界值: Reject H Reject H .025 .025 -2.0154 2.0154 t 10 - 41 2.03
計算檢定統計量之觀察值 10 - 42
例題3題解:傳統拒絕域法 .025 .025 t 檢定統計量觀察值: H0: m1 - m2 = 0 i.e. (m1 = m2) a = 0.05 df = 21 + 25 - 2 = 44 臨界值: 檢定統計量觀察值: Reject H Reject H .025 .025 -2.0154 2.0154 t 10 - 43 2.03
例題3題解:傳統拒絕域法 .025 .025 t 檢定統計量觀察值: 決策: Reject at a = 0.05 H0: m1 - m2 = 0 i.e. (m1 = m2) H1: m1 - m2 ¹ 0 i.e. (m1 ¹ m2) a = 0.05 df = 21 + 25 - 2 = 44 臨界值: 檢定統計量觀察值: 決策: Reject H Reject H Reject at a = 0.05 .025 .025 -2.0154 2.0154 t 10 - 44 2.03
例題3題解:傳統拒絕域法 .025 .025 t 檢定統計量觀察值: 決策: 結論: Reject at a = 0.05 H0: m1 - m2 = 0 i.e. (m1 = m2) H1: m1 - m2 ¹ 0 i.e. (m1 ¹ m2) a = 0.05 df = 21 + 25 - 2 = 44 臨界值: 檢定統計量觀察值: 決策: 結論: Reject H Reject H Reject at a = 0.05 .025 .025 在顯著水準a = 0.05下,有足夠證據證明兩者平均數有顯著差異。 -2.0154 2.0154 t 10 - 45 2.03
例題3題解: p -Value法 Z Reject Reject a 2 =.025 -2.0154 2.0154 Z -2.0154 2.0154 2.03 10 - 46 Test Statistic 2.03 is in the Reject Region
例題3題解: p -Value法 Z p Value 2 is between .01 and .025 Reject Reject a 2 =.025 Z -2.0154 2.0154 2.03 10 - 47 Test Statistic 2.03 is in the Reject Region
(p-Value介於0 .02 到 0.05之間) < (a = 0.05). 所以,拒絕需無假設。 is between .01 and .025 Reject Reject a 2 =.025 Z -2.0154 2.0154 2.03 10 - 48 Test Statistic 2.03 is in the Reject Region
聯合變異數t 檢定之Excel應用 兩個母體平均數差點定--T檢定(當兩母體變異數未知,但知其相等) 10 - 49
聯合變異數t 檢定之Excel應用 10 - 50
兩獨立樣本Z檢定 (MS EXCEL之應用) 10 - 51
10 - 52