兩獨立母體成功比例差- Z檢定(大樣本):說明 當我們想要檢定兩條生產線產品瑕疵率的差異,兩個銷售部門目標達成率的差異,兩個公司市場佔有率的差異,二個黨派的支持率的差異時,我們可利用兩母體比例差 的假設檢定方法。我們以樣本比例差來檢定母體比例差 。 10 - 1
比較百分比之假設寫法 大樣本用Z-表檢定 10 - 2 9
兩獨立母體成功比例差- Z檢定(大樣本):程序 的抽樣分配情形,在樣本數n夠大時(n>30),分別為 , 因此 10 - 3
兩獨立母體成功比例差- Z檢定(大樣本):程序 所以,我們以下面的Z統計量來檢定兩母體比例差 p1-p2: p1,p2未知, 以估計p1, 估計p2。 10 - 4
兩獨立母體成功比例差- Z檢定(大樣本):程序 但當假設中包含p1-p2=0(即p1=p2)時,則以聯合樣本比例估計量 來估計p會比較精確。 可得 。 10 - 5
兩獨立母體成功比例差- Z檢定(大樣本):例題4 某營建材料廠商擁有A、B兩套機器設備生產建材,今自A機器中抽取隨機樣本200個,B機器中抽取100個,發現缺點率各為11%、5%,試依0.05顯著水準以檢定下列之假設 (1)此兩部機器性能是否不同? (2)B機器之性能是否優越於A機器? 10 - 6
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 10 - 7
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 檢定統計量為: 10 - 8
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 檢定統計量為: 檢定統計量觀察值為: 10 - 9
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 拒絕域為: 10 - 10
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 拒絕域為: 決策:Fail to reject H0 10 - 11
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(1) 拒絕域為: 決策:Fail to reject H0 結論:在顯著水準0.05情況下,沒有足夠證據證 明A、B兩機器不良品機率有顯著差異。 10 - 12
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 10 - 13
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 檢定統計量為: 10 - 14
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 檢定統計量為: 檢定統計量觀察值為: 10 - 15
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 拒絕域為: 10 - 16
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 拒絕域為: 決策:Reject H0 10 - 17
兩獨立母體成功比例差- Z檢定(大樣本):例題4題解(2) 拒絕域為: 決策:Reject H0 結論:在顯著水準0.05情況下,有足夠證據證 明B機器之不良率明顯低於A機器。 10 - 18
兩母體變異數比例之F檢定 直到目前為止,我們的討論集中於母體平均數與母體比例的假設檢定,而對於母體變異數(population variance)則尚未觸及。實際上,在現實的世界中,有時變異數的重要性甚至超過平均數,例如若沙拉油的「平均容量」確實是3公升,但是,是否每罐的容量剛好都是3公升。若少於3公升,那麼消費者的權益會受損,而且生產廠商的商譽也會受損;若容量大於3公升,則公司的利潤會受影響。 10 - 19
兩母體變異數比例之F檢定 在此種情況下,容量的變異數應該要控制在一定的水準以下。亦即當有溢裝或少裝時,公司應立即調整沙拉油的裝填機器的每罐裝填的容量,以降低每罐容量的變異程度。若要檢定沙拉油每罐容量的變異的大小,則須利用變異數的假設檢定。此外,機器或零件的規格變異性、藥品重量的變異性等,都可用變異數的假設檢定來做統計推論與分析。 10 - 20
兩母體變異數比例之F檢定 如果我們要檢定兩組混凝土試體之抗彎強度,兩條生產線產品品質的差異,兩個公司服務品質的差異,或兩個產品包裝的變異時,我們可利用兩母體變異數比的假設檢定方法。 假設條件 兩母體皆為常態分配 隨機且獨立抽取之樣本 10 - 21
兩母體變異數比例之F檢定 設 及 分別抽自 及 的兩組獨立隨機樣本,其中 , , , 皆未知,則決策規則如下: 10 - 22
兩母體變異數比例之F檢定: 檢定統計量 F = Variance of Sample 1 = Variance of Sample 2 n1 - 1 = degrees of freedom = Variance of Sample 2 n2 - 1 = degrees of freedom F 10 - 23
兩母體變異數比例之F檢定: 檢定程序 假設 H0: s12 = s22 H1: s12 ¹ s22 10 - 24
兩母體變異數比例之F檢定: 檢定程序 假設 H0: s12 = s22 H1: s12 ¹ s22 檢定統計量 F = S12 /S22 Two Sets of Degrees of Freedom df1 = n1 - 1; df2 = n2 - 1 10 - 25
兩母體變異數比例之F檢定: 檢定程序 假設 H0: s12 = s22 H1: s12 ¹ s22 檢定統計量 F = S12 /S22 Two Sets of Degrees of Freedom df1 = n1 - 1; df2 = n2 - 1 臨界值: FL( ) and FU( ) FL = 1/FU* (*degrees of freedom switched) n1 -1, n2 -1 n1 -1 , n2 -1 10 - 26
兩母體變異數比例之F檢定: 檢定程序 假設 H0: s12 = s22 H1: s12 ¹ s22 檢定統計量 F = S12 /S22 Two Sets of Degrees of Freedom df1 = n1 - 1; df2 = n2 - 1 臨界值: FL( ) and FU( ) FL = 1/FU* (*degrees of freedom switched) Reject H0 Reject H0 Do Not Reject a/2 a/2 FL FU F n1 -1, n2 -1 n1 -1 , n2 -1 10 - 27
兩母體變異數比例之F檢定:例題5 假設你是一位股票分析師,你如果想要了解不同產業間( NYSE & NASDAQ )的股價是否有所差異? 因此,蒐集了以下資料做一比較: NYSE NASDAQ Number 21 25 Mean 3.27 2.53 Std dev 1.30 1.16 請問在a = 0.05下,兩母體變異數 是否有顯著差異? 10 - 28 © 1984-1994 T/Maker Co.
例題5題解 決定拒絕域(a = 0.05),查F表 10 - 29
例題5題解:傳統拒絕域法 H0: s12 = s22 H1: s12 ¹ s22 10 - 30
例題5題解:傳統拒絕域法 臨界值: H0: s12 = s22 H1: s12 ¹ s22 = 0.05 Df1 = 20 df2 = 24 臨界值: Reject Reject .025 .025 F 0.415 2.33 10 - 31 1.25
例題5題解:傳統拒絕域法 臨界值: 檢定統計量之觀察值: H0: s12 = s22 H1: s12 ¹ s22 = 0.05 Df1 = 20 df2 = 24 臨界值: Reject Reject .025 .025 F 0.415 2.33 10 - 32 1.25
例題5題解:傳統拒絕域法 臨界值: 檢定統計量之觀察值: 決策: Do not reject at a = 0.05 H0: s12 = s22 H1: s12 ¹ s22 = 0.05 Df1 = 20 df2 = 24 臨界值: Reject Reject Do not reject at a = 0.05 .025 .025 F 0.415 2.33 10 - 33 1.25
例題5題解:傳統拒絕域法 臨界值: 檢定統計量之觀察值: 決策: 結論: Do not reject at a = 0.05 H0: s12 = s22 H1: s12 ¹ s22 = 0.05 Df1 = 20 df2 = 24 臨界值: Reject Reject Do not reject at a = 0.05 .025 .025 沒有足夠證據證明兩母體變異數有顯著差異。 F 0.415 2.33 10 - 34 1.25
F Test in PHStat 10 - 35
F 檢定:單尾檢定(左尾) H0: s12 ³ s22 H1: s12 < s22 a = .05 Degrees of freedom switched Reject a = .05 F 10 - 36
F 檢定:單尾檢定(右尾) H0: s12 £ s22 H1: s12 > s22 a = .05 F Reject a = .05 10 - 37
兩相依母體之比較 兩相依母體平均數之檢定 配對資料(Paired or matched) 重複測量 (before and after) 配對資料的差異(Use difference between pairs) 10 - 38
兩相依母體平均數之比較 兩母體平均數差 之檢定─Z檢定(大樣本) 1.若樣本為大樣本時,以常態分配處理。 2.若母體分配為常態分配且兩變異數皆已知,則不論樣本大小為多少皆用常態分配處理。 10 - 39
相依母體平均數差之Z 檢定 (變異數已知) 假設條件 兩母體為常態分配 配對樣本之觀察資料 變異數已知 檢定統計量 10 - 40
兩相依母體平均數之比較 兩母體平均數差 之檢定─T檢定(小樣本) 1.若樣本為小樣本時。 10 - 41
相依母體平均數差之T 檢定 (變異數未知) 假設條件 檢定統計量 兩母體為常態分配 配對樣本之觀察資料 變異數未知 若母體非常態分配,則需大樣本才可 檢定統計量 10 - 42
相依母體平均數差之T 檢定: 例題6 假設你在財務部門工作,今部門引進新操作系統,因此部門主管想要知道此套系統對工作效率是否有所改善? (a=0.05 level)? 收集資料如下: User 現有系統 (1) 新系統 (2) Difference Di C.B. 9.98 Seconds 9.88 Seconds .10 T.F. 9.88 9.86 .02 M.H. 9.84 9.75 .09 R.K. 9.99 9.80 .19 M.O. 9.94 9.87 .07 D.S. 9.84 9.84 .00 S.S. 9.86 9.87 - .01 C.T. 10.12 9.86 .26 K.T. 9.90 9.83 .07 S.Z. 9.91 9.86 .05 10 - 43
相依母體平均數差之T 檢定: 例題6題解 新系統是否較有效率 (0.05 level)? 10 - 44
相依母體平均數差之T 檢定: 例題6題解 新系統是否較有效率 (0.05 level)? H0: mD £ 0 H1: mD > 0 10 - 45
相依母體平均數差之T 檢定 : 例題6題解 a =.05 新系統是否較有效率 (0.05 level)? H0: mD £ 0 Reject a =.05 D = .084 a =.05 臨界值= 1.8331 df = n - 1 = 9 1.8331 3.15 10 - 46
相依母體平均數差之T 檢定 : 例題6題解 a =.05 新系統是否較有效率 (0.05 level)? H0: mD £ 0 Reject a =.05 D = .084 a =.05 臨界值= 1.8331 df = n - 1 = 9 1.8331 3.15 檢定統計量觀察值 10 - 47
相依母體平均數差之T 檢定 : 例題6題解 a =.05 新系統是否較有效率 (0.05 level)? H0: mD £ 0 Reject a =.05 D = .084 a =.05 臨界值= 1.8331 df = n - 1 = 9 1.8331 3.15 決策: Reject H0 檢定統計量觀察值 10 - 48
相依母體平均數差之T 檢定 : 例題6題解 a =.05 新系統是否較有效率 (0.05 level)? H0: mD £ 0 Reject a =.05 D = .084 a =.05 臨界值= 1.8331 df = n - 1 = 9 1.8331 3.15 決策: Reject H0 檢定統計量觀察值 結論: The new software package is faster. 10 - 49
兩相依樣本T檢定 (MS EXCEL之應用) 10 - 50
相依母體平均數比較t 檢定之Excel應用 10 - 51
相依母體平均數比較t 檢定之Excel應用 10 - 52
兩相依樣本T檢定 (MS EXCEL之應用) 10 - 53
Wilcoxon等級合檢定:兩母體分配(中位數)是否相同? 前面討論兩母體平均數差之檢定,在小樣本情況下必須假設母體為: 常態分配 變異數已知或相等 因此,若不符合以上條件,便無法使用前用所介紹之有母數統計方法 本節介紹無母數統計Wilcoxon Rank-Sum Test 10 - 54
Wilcoxon等級合檢定:兩母體分配(中位數)是否相同? 檢定兩母體分配(中位數)是否相同? 母體不需要求為常態分配 母體分配也不需要求為某一特定分配(Distribution free) 資料需可排序 當樣本數皆超過10以上(nj >10),可使用常態分配近似 10 - 55
Wilcoxon等級合檢定:程序 分別由母體1隨機抽取 n1個樣本,母體2抽取n2 個樣本 如果兩個等級合相近,表示沒有證據顯示兩個母體分配是不同的 如果兩個等級合差異很大,表示兩個樣本來自不同母體 10 - 56
Wilcoxon等級合檢定:程序 將n1 + n2 個樣本觀察值,混合指派等級順序 Ri 加總各個樣本之等級Tj 等級順序最小由Ri = 1開始排序,最大到n 若有排序等級相同者(ties)則平均後為其等級 加總各個樣本之等級Tj 檢定統計量 T1 (smallest sample) 10 - 57
Wilcoxon等級合檢定:H0、H1之設定 Two -Tail Test 雙尾檢定 H0: M1 = M2 H1: M1 ¹ M2 Do Not Reject Reject Reject T1L T1U M1 = median of population 1 M2 = median of population 2 10 - 58
Wilcoxon等級合檢定:H0、H1之設定 單尾檢定: H0: M1 ³ M2 H1: M1 < M2 左尾檢定 Reject Do Not Reject T1L M1 = median of population 1 M2 = median of population 2 10 - 59
Wilcoxon等級合檢定:H0、H1之設定 Right -Tail Test 單尾檢定: H0: M1 £ M2 H1: M1 > M2 右尾檢定 Do Not Reject Reject T1U M1 = median of population 1 M2 = median of population 2 10 - 60
Wilcoxon等級合檢定: 例題7 你是一位生產企劃人員,你想要了解兩間工廠之生產作業速率(% of capacity)中位數是否相同?第一間工廠之作業速率觀察值為71, 82, 77, 92, 88,第二間工廠之作業速率為 85, 82, 94 & 97。 在 0.10 顯著水準之下,兩 間工廠之作業速率中位數是否 有顯著差異? 10 - 61
Wilcoxon等級合檢定:例題7題解 Factory 1 Factory 2 Rate Rank Rate Rank 71 1 85 5 82 Tie 3 3.5 82 Tie 4 3.5 77 2 94 8 92 7 97 9 88 6 Rank Sum T2=19.5 T1=25.5 10 - 62
Lower and Upper Critical Values T1 of Wilcoxon Rank Sum Test One-Tailed Two-Tailed 4 5 .05 .10 12, 28 19, 36 .025 11, 29 17, 38 .01 .02 10, 30 16, 39 .005 --, -- 15, 40 6 10 - 63
Wilcoxon等級合檢定:例題7題解 H0: M1 = M2 H1: M1 ¹ M2 10 - 64
Wilcoxon等級合檢定:例題7題解 H0: M1 = M2 H1: M1 ¹ M2 a = .10 n1 = 4 n2 = 5 臨界值: Do Not Reject Reject Reject 12 28 10 - 65
Wilcoxon等級合檢定:例題7題解 檢定統計量: H0: M1 = M2 H1: M1 ¹ M2 a = .10 n1 = 4 n2 = 5 臨界值: 檢定統計量: T1 = 5 + 3.5 + 8+ 9 = 25.5 (Smallest Sample) Do Not Reject Reject Reject 12 28 10 - 66
Wilcoxon等級合檢定:例題7題解 檢定統計量: H0: M1 = M2 H1: M1 ¹ M2 a = .10 n1 = 4 n2 = 5 臨界值: 檢定統計量: 決策: T1 = 5 + 3.5 + 8+ 9 = 25.5 (Smallest Sample) Do not reject at a = 0.10 Do Not Reject Reject Reject 12 28 10 - 67
Wilcoxon等級合檢定:例題7題解 檢定統計量: H0: M1 = M2 H1: M1 ¹ M2 a = .10 n1 = 4 n2 = 5 臨界值: 檢定統計量: 決策: 結論: T1 = 5 + 3.5 + 8+ 9 = 25.5 (Smallest Sample) Do not reject at a = 0.10 Do Not Reject There is no evidence medians are not equal. Reject Reject 12 28 10 - 68
Wilcoxon等級合檢定: 常態分配近似法(Large Sample) 大樣本時,則檢定統計量 T1 為近似常態分配,其平均數為 ,變異數為 。 Z test statistic 10 - 69
Wilcoxon符號等級檢定:成對母體分配是否相同? 符號等級檢定 符號等級檢定不僅考慮差值的正負符號,同時考慮差值大小的等級的檢定方法。 10 - 70
Wilcoxon符號等級檢定:小樣本 符號等級檢定統計量(小樣本) R+或R-:R+為正的D值的等級和, R-為負的D值的等級和。R=Min.{R+, R-} 決策法則 1.雙尾檢定 當RR/2時,則拒絕H0,否則接受H0。 R/2為臨界值。 2.單尾檢定 當RR時,則拒絕H0 ,否則接受H0 。 R為臨界值。 10 - 71
Wilcoxon符號等級檢定:大樣本 符號等級檢定統計量(大樣本n30) 決策法則 1.雙尾檢定 Z-Z/2時拒絕H0 , Z-Z/2則接受H0 。 2.單尾檢定 Z-Z時拒絕H0 , Z-Z則接受H0 10 - 72
Wilcoxon符號等級檢定:例題8 泡泡清潔用品公司宣稱其所生產的沐浴乳每瓶重量的中位數為300公克,今隨機抽查12瓶,得重量如下: 311 303 306 313 292 305 295 298 304 316 307 322 在=0.05在下,以Wilcoxon符號等級檢定法檢定該公司的宣稱是否正確? 10 - 73
Wilcoxon符號等級檢定: 例題8題解 每瓶的重量與300之差的絕對值由小排到大,給予等級: 10 - 74
Wilcoxon符號等級檢定: 例題8題解 每瓶的重量與300之差的絕對值由小排到大,給予等級: 重量 311 303 306 313 292 305 295 298 304 316 307 322 D 11 3 6 13 -8 5 -5 -2 4 16 7 22 等級 9 2 6 10 8 4.5 4.5 1 3 11 7 12 10 - 75
Wilcoxon符號等級檢定: 例題8題解 每瓶的重量與300之差的絕對值由小排到大,給予等級: 重量 311 303 306 313 292 305 295 298 304 316 307 322 D 11 3 6 13 -8 5 -5 -2 4 16 7 22 等級 9 2 6 10 8 4.5 4.5 1 3 11 7 12 T=min(T+,T-)=T-=13.5,查表得n=12之臨界值=14,因T<14 10 - 76
Wilcoxon符號等級檢定: 例題8題解 每瓶的重量與300之差的絕對值由小排到大,給予等級: 重量 311 303 306 313 292 305 295 298 304 316 307 322 D 11 3 6 13 -8 5 -5 -2 4 16 7 22 等級 9 2 6 10 8 4.5 4.5 1 3 11 7 12 T=min(T+,T-)=T-=13.5,查表得n=12之臨界值=14,因T<14。 決策:故拒絕虛無假設。 結論:為中位數Me300。 10 - 77