Presentation is loading. Please wait.

Presentation is loading. Please wait.

兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data

Similar presentations


Presentation on theme: "兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data"— Presentation transcript:

1 兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data
第 二 十 一 講 兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data

2 學 習 目 標 兩類別比例值的比較 多個(二個以上)類別比例值的比較 兩類別因子比例值的比較 b. 2 檢定(卡方檢定) 齊一性檢定
a. Z 檢定 b. 2 檢定(卡方檢定) 多個(二個以上)類別比例值的比較 a. 同質性 兩類別因子比例值的比較 齊一性檢定 獨立性檢定

3 資 料 類 型 Data Types 名義或名目 資 料 數值 類別 Data Numerical Categorical Ordinal
資 料 數值 類別 Data Numerical Categorical Ordinal Nominal 順序

4 資料的獲得 實驗(experiment) 調查(survey) 例如 : 丟擲一個骰子,出現點數為六的次數。
例如 : 丟擲一個骰子,出現點數為六的次數。 調查(survey) 例如 : 某公司新推出的產品在市場上的反應情形。 很滿意 、 滿意 、普通 、 不滿意、 很不滿意

5 單一樣本比例 丟擲一個骰子,出現點數為六的次數,若該骰子共丟擲100次,出現 20 次點數為六,欲知該骰子出現點數為六的
丟擲一個骰子,出現點數為六的次數,若該骰子共丟擲100次,出現 20 次點數為六,欲知該骰子出現點數為六的 機率是否為1/ 6? 令  : 母體的成功比例參數。 p : 母體所抽出樣本的成功比例估計量。 解: H0 :  = 1/ 6 H1 :   1/ 6

6 單一樣本比例 解: H0 :  = 1/ 6 (  : 母體的成功比例參數。)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量。) p = x / n ( x : 母體所抽出樣本為六的次數。) = 20 / ( n : 母體抽出所有樣本次數。) =  n  > 5 , n (1-  ) > 5

7 單一樣本比例 解: H0 :  = 1/ 6 (  : 母體的成功比例參數)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量) p = x / n = 20/100 = ( x : 母體所抽出樣本為六的次數) ( n : 母體抽出所有樣本次數) ( n  > 5 , n (1-  ) > 5 ) RR: | Z | > Z/2 = Z = 1. 96  Z* = < 1.96  不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証據說明骰子出現六點機率不為 1/6 。

8 單一樣本比例另解 丟擲一個骰子,出現點數為六的次數,若丟擲該骰子 100次, 出現 20 次點數為六,欲知該骰子出現點數為六的機率是否為 1/ 6 ? 令  : 母體的成功比例參數。 p : 母體所抽出樣本的成功比例估計量。 解: H0 :  = 1/ 6 H1 :   1/ 6 1 0 0 1 0 0  5/6 1 0 0 /6 期望值 (E) 1 期望機率值( ) 合計 其他 骰子出現點數 觀察值 (O) 80 20 5/6 1/6

9 單一樣本比例另解 利用實際觀測個數(次數)與期望個數之差距來測量其偏離的程度 而該偏離度以 2 表示於下: 骰子出現點數 六 其他 合計
利用實際觀測個數(次數)與期望個數之差距來測量其偏離的程度 而該偏離度以 2 表示於下: 2 = (O-E)2/ E 骰子出現點數 其他 合計 觀察值 (O) 20 80 100 期望值 (E) 100/6 1005/6 1  2 =(O-E)2/ E (20-100/6)2/(100/6)=2/3 (80-500/6)2/(500/6)=2/15 12/15=0.8

10 卡方檢定的意義 在具有 k 個分類別數的資料中(例如:顏色喜好,手機種類),根據研究分析之需要,利用實際觀測個數(次數)與其在虛無假設為真之母體分配所發生的個數(期望個數)之差距來測量其偏離度, 式中 Oi 表示在第i分類之實際觀測個數(次數); Ei 表示在第 i 分類之期望個數 ٥

11 卡方檢定性質 當觀測個數(O)與期望個數(E)之間愈接近χ2值愈小,表示愈不易拒絕虛無假設為真 ;

12 單一樣本比例另解 2 Table (Portion) Upper Tail Area DF .995 … .95 .05 1 ...
2 = (O-E)2/ E 2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6) = 2/3 + 2/15= 0.8 d f = 2 - 1= 1 RR:  2 >  21, 0.05 = 2 Table (Portion) Upper Tail Area DF .995 .95 .05 1 ... 0.004 2 0.010 0.103 .025 .01 5.024 7.378 6.635 9.210

13 單一樣本比例另解 2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
2 = (O-E)2/ E 2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6) = 2/3 + 2/15= 0.8 d f = 2 - 1= 1 RR:  2 >  21, 0.05 =  2 <  21, 0.05 =  不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証據說明骰子出現六點機率不為 1/ 6 。

14 另例、藥品藥效 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96  n >5, n(1- ) >5 H1 :   0.96 方法(一) 以 Z 檢定 p=180/200=0.9 ,

15 藥品藥效例題 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96 H1 :   0.96 方法(二) 以 2 檢定

16 藥品藥效例題 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96 vs H1 :   0.96

17 單一樣本多類別 今丟擲一個骰子360次,欲知該骰子是否為一公正骰子,紀錄其結果如下:
(在α= 0.05條件下進行相關檢定。) H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i not all equal to 1/ 6 42 4 360 63 57 72 66 60 觀測到出現次數 合計 6 5 3 2 1 出現點數X值

18 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
單一樣本多類別 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 8.7 0.15 5.4 2.4 0.6 (O-E)2/ E 360 60 期望出現次數(E) 1 1/6 期望機率() 63 57 42 72 66 觀測到出現次數(O) 合計 6 5 4 3 2 X值 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60 + (42-60)2/60 + (57-60)2/60 + (63-60)2/60 = = 8.7

19 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
單一樣本多類別 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60 + (42-60)2/60 + (57-60)2/60 + (63-60)2/60 = = 8.7 df=6-1=5 RR: 2 > 2 0.05,5 =11.1 ∵ 2 < 11.1 所以α= 0.05之下,不拒絕虛無假設,骰子為不公正的情形不顯著,即認為此骰子為公正的。

20 單一樣本多類別 多項式母體比例的檢定 ∴卡方檢定可用來決定資料是否屬於原有的母體或分配。 適合度檢定
丟擲一個骰子,欲知該骰子是否為一公正骰子? H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 多項式母體比例的檢定 ∴卡方檢定可用來決定資料是否屬於原有的母體或分配。 適合度檢定

21 適合度檢定 多項式母體的檢定 二項式母體的檢定 卜瓦松母體的檢定 常態母體的檢定 以例題分別說明,並以電腦excel操作計算

22 多項式母體的檢定 電腦excel操作 丟擲一個骰子360次,欲知該骰子是否為一公正骰子,紀錄其丟擲結果如下:
(在α= 0.05條件下進行相關檢定。) H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i not all equal to 1/ 6 42 4 360 63 57 72 66 60 觀測到出現次數 合計 6 5 3 2 1 出現點數X值

23

24

25

26

27

28

29

30

31

32

33

34

35

36 3601/6=60

37

38

39

40

41

42

43

44

45

46

47 計算 p-value

48

49

50 求得檢定之 p-value值 p-value

51 另一方法求得檢定之 p-value值

52 另一方法求得檢定之 p-value值

53 另一方法求得檢定之 p-value值

54 另一方法求得檢定之 p-value值

55 另一方法求得檢定之 p-value值

56 另一方法求得檢定之 p-value值 p-value

57 二項母體的檢定 某調查現今小學生配戴眼鏡的分布情形,今收集250戶有2位小學生之家庭資料如下:
105 110 35 觀察到的家庭數O 合計 2 1 小學生戴眼鏡人數 欲知小學生戴眼鏡的情形是否符合60%的二項分配型態。 H0:資料來自B(2 , 0.6) Ha:資料不是來自B(2 , 0.6) 在自由度 df=2 及 α= 時

58 二項母體的檢定 3.9583 2.5 0.8333 0.625 (O-E)2/ E 250 90 120 40 期望的家庭戶數(E) 1
0.36 0.48 0.16 期望機率() 105 110 35 觀察到的家庭戶數(O) 合計 2 小孩戴眼鏡人數 2 = Σ(Oi - Ei) 2 / Ei = (35-40)2/40 + ( )2/120 + (105-90)2/90 = = df=3-1 因為 < 22, 0.05 = ; 或 p-value = Pr(2 > ) 0.1 < p-value < 0.2 22, 0.1 < 2 < 22, 0.2 所以不拒絕虛無假設,沒有充分證據說明此資料不是來自二項分配

59

60

61

62

63

64

65

66

67

68

69 計算p-value

70 0.1 < p-value < 0.2 , 較 =0.05 為大 所以不拒絕虛無假設,沒有充分證據說明此資料不是來自二項分配

71 卜瓦松分配母體檢定 某一加油站調查,每分鐘加油車輛數的觀測值下: 試以α=0.05的顯著水準,檢定加油車輛數的分配是否符合卜瓦松分配。
400 合計 1 8 79 129 182 觀測數 5 4 3 2 到達車數 試以α=0.05的顯著水準,檢定加油車輛數的分配是否符合卜瓦松分配。

72 卜瓦松分配母體檢定 解:H0:母體分配為卜瓦松分配 Ha:母體分配不為卜瓦松分配 由於平均到站加油車數未知,須先估計
400 合計 1 8 79 129 182 觀測次數 5 4 3 2 到達車數 解:H0:母體分配為卜瓦松分配 Ha:母體分配不為卜瓦松分配 由於平均到站加油車數未知,須先估計 =(0182+1129+279+38+41+51)/400= 0.8

73

74

75

76

77

78 由於期望車數必須在五輛以上,進行卡方的檢定方法才準確,因此將到達車次合併至3次,重新計算

79

80 所以加油站車輛加油之分配, 不為卜瓦松分配
由於分配之平均車數未知,為一估計值 因此自由度為 4 – 1 – 1=2 ∵ p-value <0.05 所以加油站車輛加油之分配, 不為卜瓦松分配

81 常態分配的檢定 有一隨機樣本大小為30,而其觀測值如下: 以顯著水準α=0.05,檢定是否符合平均數為25,變異數為10 之常態分配。
以顯著水準α=0.05,檢定是否符合平均數為25,變異數為10 之常態分配。 解: H0:母體分配為常態分配(25,10) Ha:母體分配不為常態分配(25,10)

82 常態分配的檢定 將樣本由小到大排序,如下: 16 18 19 19 20 20 21 22 22 23 24 24 25 25 25
分五組,找出五個20百分位值,在顯著水準α=0.05,檢定是否符合平均數為25,變異數為10之常態分配。 用Excel 電腦軟體進行

83 機率 平均數 標準差

84 機率 平均數 標準差

85 用以計次之數值範圍 限制條件範圍

86

87

88 沒有充分證據說明資料不為N(25,10)之常態分配

89 常態分配的檢定 有一隨機樣本大小為20,而其觀測值如下: 以顯著水準α=0.05,檢定是否符合常態分配。
以顯著水準α=0.05,檢定是否符合常態分配。 解: H0:母體分配為常態分配 Ha:母體分配不為常態分配 決定平均數ヽ變異數及分組數(k)後,再依照前述方法利用Excel進行檢定。特別注意的是卡方檢定自由度為 k-1-(估計參數個數)=k-1-2

90 回 顧 二類別數, 成功或失敗 Z 2 多個類別數(k), 配適度 n ≥ 5, n(1- )≥5 自由度 k-1-(估計參數個數)

91 兩樣本比例差的比較 何時使用? 所需前題: a. 獨立樣本 b. 母體來自二項分配 c. 樣本數要夠大,每一母體均需滿足
n  ≥ 5 且 n (1-) ≥ 5 ,其中 n 為樣本個數; 為成功機率參數

92 兩樣本比例差的比較 符號說明 Pi:自第 i 母體所抽出樣本的成功比例估計量。 ni:自第 i 母體所抽出的全部樣本數。
xi:自第 i 母體所抽出樣本為成功的樣本個數, 其中 Pi = xi / n i 。

93 兩樣本比例差的比較 1 - 2   1 - 2   1 - 2   1 - 2 < 
有興趣研究問題種類 假設條件 兩比例無差異 母體1比例  母體2比例 H 1 - 2   1 兩比例有差異 1 - 2   母體1比例 < 母體2比例 母體1  母體2比例 母體1 > 母體2比例 1 - 2   1 - 2 <  1 - 2   1 - 2 > 

94 兩樣本比例差的比較 1 - 2   1 - 2   1 - 2   1 - 2 < 
有興趣研究問題種類 假設條件 兩比例無差異 母體1比例  母體2比例 H 1 - 2   1 兩比例有差異 1 - 2   母體1比例 < 母體2比例 母體1  母體2比例 母體1 > 母體2比例 1 - 2   1 - 2 <  1 - 2   1 - 2 >  註: 1 - 2   0 ,其中  0可為任一非零的比例

95 兩樣本比例差的比較 1 - 2   1 - 2   1 - 2   1 - 2 < 
有興趣研究問題種類 母體1比例  母體2比例 1 - 2   兩比例有差異 1 - 2   母體1比例 < 母體2比例 母體1  母體2比例 母體1 > 母體2比例 1 - 2   1 - 2 <  1 - 2   1 - 2 >  假設條件 兩比例無差異 H 1 檢定統計量 Z 與  2 Z

96 兩樣本比例差的比較 假設條件 兩比例無差異 兩比例有差異 H 1 檢定統計量 Z 與  2 1 - 2   1 - 2  

97 兩樣本比例差的比較 1 - 2   1 - 2 >  H 檢定統計量 Z 母體 1 比例不較母體 2 比例大
假設條件 母體 1 比例不較母體 2 比例大 母體 1 比例 較 母體 2 比例大 H 1 檢定統計量 Z 1 - 2   1 - 2 > 

98 兩樣本比例差的比較 1 - 2   1 - 2 <  H 檢定統計量 Z 母體 1 比例不較母體 2 比例小
假設條件 母體 1 比例不較母體 2 比例小 母體 1 比例 較 母體 2 比例小 H 1 檢定統計量 Z 1 - 2   1 - 2 < 

99 兩樣本比例差的比較 1 - 2   1 - 2   1 - 2   1 - 2 < 
有興趣研究問題種類 假設條件 兩比例無差異 母體1比例  母體2比例 H 1 - 2   1 兩比例有差異 1 - 2   母體1比例 < 母體2比例 母體1  母體2比例 母體1 > 母體2比例 1 - 2   1 - 2 <  1 - 2   1 - 2 > 

100 兩樣本比例差例題 區間估計 例、公正性認知 某公司人事主管,欲測試兩種員工能力表現評比方法的公正性認知百分比差異變化。以方法Ⅰ評比80位員工中,有60位認為公正;以方法Ⅱ評比75位員工中,有45為認為公正,試估計在95%的信賴係數下,兩種方法公正性的認知差異。

101 兩樣本比例差例題 區間估計 p1:表方法Ⅰ認知百分比估計量 p2:表方法Ⅱ認知百分比估計量
E (p1-p2) = 1- 2 , V(p1-p2) = 1 (1- 1) / n1 + 2 (1- 2) / n2

102 兩樣本比例差例題 區間估計 在 n1 , n2 均為大樣本條件下,由中央極限定理可知, p1p2會近似常態,所以

103 兩樣本比例差例題 區間估計 p1 = 60 / 80 =3 / 4 = 0.75 p2 = 45 / 75 =3 / 5 = 0.6
Z/2=Z 0.025=1.96

104 兩樣本比例差例題 區間估計 在95%的信賴係數下,方法Ⅰ與方法Ⅱ公正性的認知差異介於 (0.00398, 0.29602)
p1 = p2 = 0.6 =0.05, Z/2=Z 0.025=1.96 0.750.61.960.0745 12 0.750.61.960.0745 →  1 2  在95%的信賴係數下,方法Ⅰ與方法Ⅱ公正性的認知差異介於 ( , )

105 兩樣本比例差例題 比例差為某百分比之檢定 例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比方法的公正性認知百分比差異變化。以方法Ⅰ評比80位員工中,有60位認為公正;以方法Ⅱ評比75位員工中,有45為認為公正,由以往的幾次測試結果,欲知方法Ⅰ的評比公正性認知較方法Ⅱ高出1成。

106 兩樣本比例差的比較 1 - 2  .1 1 - 2 > .1 H 檢定統計量 Z
假設條件 母體 1 比例不較母體 2 比例高出一成 母體 1 比例 較 母體 2 比例高出一成 H 1 檢定統計量 Z 1 - 2  .1 1 - 2 > .1

107 兩樣本比例差例題 比例差為某百分比之檢定 解: 下標1表方法Ⅰ, 下標2表方法Ⅱ H0 : 1  2  0.1 H1 : 1  2  0.1 ∵ n1 15, n1(1- 1 )  5 且 n2 2  5, n2(1- 2 ) 5 在 n1 , n2 均為大樣本條件下,由中央極限定理可知, p1p2 會近似常態,所以

108 兩樣本比例差例題 比例差為某百分比之檢定 p1 = 60 / 80 =3 / 4 = 0.75

109 兩樣本比例差例題 比例差為某百分比之檢定 在 H0 : 1  2  0.1 H1 : 1  2  0.1
RR: |Z|> Z/2=Z 0.025=1.96 Z*= < 1.96 Not reject H0 ,方法Ⅰ沒有顯著高於方法Ⅱ 1成。

110 兩樣本比例差例題 比例差是否有差異 例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比方法的公正性認知百分比差異變化。以方法Ⅰ評比80位員工中,有60位認為公正;以方法Ⅱ評比75位員工中,有45為認為公正,試比較在95%的信賴係數下,兩種方法公正性的認知是否有差異存在。

111 兩樣本比例差的比較 1 - 2   1 - 2   H H 檢定統計量 Z 與  2 兩比例無差異 假設條件 兩比例有差異
1 - 2   1 - 2   H H 1 檢定統計量 Z 與  2

112 兩樣本比例差例題 比例差是否有差異

113 兩樣本比例差例題 比例差是否有差異

114 兩樣本比例差的比較 1 - 2   1 - 2   H 檢定統計量 Z 與  2 假 設條 件 兩比例無差異 兩比例有差異
1 檢定統計量 Z 與  2 1 - 2   1 - 2  

115 兩樣本比例差例題 比例差是否有差異 認知 155 75 80 合計 50 30 20 不公正 105 45 60 公正 Ⅱ Ⅰ 評比方法
兩獨立 樣本 變數 水準 p1 = 60 / 80 =3 / 4 = 0.75 p2 = 45 / 75 =3 / 5 = 0.6

116 兩樣本比例差例題 比例差是否有差異 H0 : 1 - 2   H1 : 1 - 2   認知 155 75 80 合計 50
30 20 不公正 105 45 60 公正 評比方法 H0 : 1 - 2   H1 : 1 - 2  

117 兩樣本比例差例題 比例差是否有差異 H0 : 1 - 2   vs H1 : 1 - 2   認知 155 75 80 合計
50 30 20 不公正 105 45 60 公正 評比方法

118 兩樣本比例差例題 比例差是否有差異 認知 n n+2 n+1 合計 n2+ n22 n21 不公正 n1+ n12 n11 公正 評比方法
評比方法

119 兩樣本比例差例題 比例差是否有差異 認知 n n+2 n+1 合計 n2+ n22 n21 不公正 n1+ n12 n11 公正 評比方法
評比方法

120 兩樣本比例差例題 比例差是否有差異 認知 155 75 80 合計 50 30 20 不公正 105 45 60 (54.19) 公正 Ⅱ
60 (54.19) 公正 評比方法

121 兩樣本比例差例題 比例差是否有差異 認知 155 75 80 合計 50 30 (24.19) 20 (25.81) 不公正 105
30 (24.19) 20 (25.81) 不公正 105 45 (50.81) 60 (54.19) 公正 評比方法

122 兩樣本比例差例題 比例差是否有差異

123 兩樣本比例差例題 比例差是否有差異 H0 : 1 - 2   vs H1 : 1 - 2  

124 二維列聯表 R C contingency table 22 列聯表
認知 n n+2 n+1 合計 n2+ n22 n21 不公正 n1+ n12 n11 公正 評比方法 觀測個數 邊際個數 總個數

125 二維列聯表 R C contingency table 22 列聯表 pij = nij /n
認知 1 p+2 p+1 合計 p2+ p22 p21 不公正 p1+ p12 p11 公正 評比方法 觀測機率 邊際機率 總機率

126 兩獨立樣本 認知 155 75 80 合計 50 30 20 不公正 105 45 60 公正 評比方法 變數 水準

127 32 列聯表 變數 水準 系別 195 119 76 合計 64 44 20 經濟 61 70 35 40 26 30 統計 企管 性 別
變數 水準 32 列聯表 系別 195 119 76 合計 64 44 20 經濟 61 70 35 40 26 30 統計 企管 性 別 變數 水準

128 卡方檢定 齊一性 例  某零售商懷疑三家不同公司所批得之零件品質有差異。因此今將各公司購得之零件品質測試紀錄於下表,試以0.05顯著水準檢定,在不同公司零件品質是否有差異。 1470 220 1250 合計 600 90 510 C 500 75 425 B 370 55 315 A 瑕疵個數 良品個數 公司類別 零件品質

129 卡方檢定 齊一性 H1: 三公司零件品質不相同 以 p11表A公司生產良品個數的比例 p21表B公司生產良品個數的比例
p31表C公司生產良品個數的比例 p11 = p21 = p31 p12 = p22 = p32 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同

130 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同

131 卡方檢定 齊一性 H1: 三公司零件品質不相同 E11=3701250/1470=314.6
220 1250 合計 600 90 510 C 500 75 425 B 370 55 315 (314.6) A 瑕疵個數 良品個數 公司類別 零件品質

132 卡方檢定 齊一性 H1: 三公司零件品質不相同 H0 : 11 = 21 = 31 , 12 = 22 = 32 零件品質
1470 220 1250 合計 600 90 (89.8) 510 (510.2) C 500 75 (74.8) 425 (425.2) B 370 55 (55.4) 315 (314.6) A 瑕疵個數 良品個數 公司類別 零件品質

133 卡方檢定 齊一性 1470 220 1250 合計 600 90 (89.8) 510 (510.2) C 500 75 (74.8) 425 (425.2) B 370 55 (55.4) 315 (314.6) A 瑕疵個數 良品個數 公司類別 零件品質

134 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同

135 卡方檢定 齊一性 將卡方檢定由一般情形延伸至多個獨立母體之比較 檢定一個變數(變項)各類別(或水準)在不同母體比例是否相同 應用列聯表
H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 檢定一個變數(變項)各類別(或水準)在不同母體比例是否相同 應用列聯表

136 卡方檢定 齊一性 前題條件 必須為隨機獨立選出樣本 必須為大樣本 所有各期望個數必須大於1

137 齊一性檢定例題 例 : 欲知不同系別畢業生畢業後,最先開始從事的工作性質是否受到其在校主修學位的不同而有差異。今自企管、統計和經濟系畢業生中,隨機抽出適當樣本數,並記錄其畢業後,最先開始從事的工作類別如下: (以α= 0.01檢定之) 主修學位 電腦 銀行 其他 合計 企管 50 16 14 80 統計 25 35 15 75 經濟 21 46 18 85 96 97 47 240

138 齊一性檢定例題 解︰ H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異
p11 = p21 =p31 , p21 = p22 = p32 , p31 = p32 = p33 其中 p11表示企管系畢業生畢業從事電腦工作的百分比 p21表示統計系畢業生畢業從事電腦工作的百分比 p31表示經濟系畢業生畢業從事電腦工作的百分比 E11=80  96 / 240 = 32.0 E21=75  96 / 240 = 30.0 E31=85  96 / 240 = 34.0

139 齊一性檢定例題 期望數的結果 主修學位 電腦 銀行 電子 企管 32.0 32.3 15.7 統計 30.0 30.3 14.7 經濟
34.0 34.4 16.7

140 齊一性檢定例題 解︰ H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異
p11 = p21 =p31 , p21 = p22 = p32 , p31 = p32 = p33 其中 p11表示企管系畢業生畢業從事電腦工作的百分比 p21表示統計系畢業生畢業從事電腦工作的百分比 p31表示經濟系畢業生畢業從事電腦工作的百分比 E11=80  96 / 240 = 32.0 E21=75  96 / 240 = 30.0 E31=85  96 / 240 = 34.0

141 齊一性檢定例題 H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異

142 卡方檢定 獨立性 例: 某食品公司欲知不同性別消費者,對所推出的3種不同口味產品喜好是否有差異。今隨機調查200位消費者,在試吃後選出其最喜歡的口味種類。在顯著水準0.01下,檢定性別對產品的喜好看法是否有差異。 200 40 120 合計 83 20 18 45 117 22 75 C B A 性別 產品口味

143 卡方檢定 獨立性 產品口味 解︰ H0:性別與產品口味無差異 ( i j =  i+  +j)
Ha:性別與產品口味有差異 ( i j   i+  +j) ( i :性別, 男: 1, 女: 2 ; j : 口味, A:1, B:2, C:3 ) 200 40 120 合計 83 20 18 45 117 22 75 C B A 性別 產品口味

144 卡方檢定 獨立性 產品口味 性別 200 40 120 合計 83 20 (16.6) 18 (16.6) 45 (49.8) 女 117
20 (23.4) 22 (23.4) 75 (70.2) C B A 性別 產品口味

145 卡方檢定 獨立性 H0:性別與產品口味無差異 (i j =  i+  +j) Ha:性別與產品口味有差異 ( i j   i+  +j)

146 卡方檢定 獨立性 顯示兩變項間的關係 1.僅由一個母體中抽出樣本 應用列聯表
H0:i j =  i+  +j Ha: i j   i+  +j 2.每個變項均有兩個或多個類別(或水準) 3.不顯示因果關係 4.不顯示兩變項間的性質 應用列聯表

147 卡方檢定 獨立性 與齊一性比較 齊一性 1.將卡方檢定由一般情形延伸至多個獨立母體之比較 H0 : 11 = 21 = 31 , 12 = 22 =  H1: 三公司零件品質不相同 2.檢定一個變數(變項)各類別(或水準)在不同母體比例 是否相同 獨立性 1.顯示兩變項間的關係 僅由一個母體中抽出樣本 H0:i j =  i+  +j vs Ha: i j   i+  +j

148 應用列聯表,Excel 程式

149

150

151

152

153

154 可省略直接應用CHITEST(B2:D3,B7:D8)

155 總結 兩類別比例值的比較 多個(二個以上)類別比例值的比較 兩類別因子比例值的比較 b. 2 檢定(卡方檢定) 齊一性檢定 獨立性檢定
a. Z 檢定 b. 2 檢定(卡方檢定) 多個(二個以上)類別比例值的比較 a. 同質性 兩類別因子比例值的比較 齊一性檢定 獨立性檢定

156 關於本講程... 請你靜下來想一想: 1. 你學到哪些 ? 2. 想想在您日常生活中,是否有某些事物或 現象符合我們以上所提的各種分析方法?
您是否能對您有興趣瞭解的現象,進行適 當檢定與決策。 3. 是否還有相關問題與疑問 ?


Download ppt "兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data"

Similar presentations


Ads by Google