Presentation is loading. Please wait.

Presentation is loading. Please wait.

第九章 兩組樣本之檢定 陳順宇 教授 成功大學統計系.

Similar presentations


Presentation on theme: "第九章 兩組樣本之檢定 陳順宇 教授 成功大學統計系."— Presentation transcript:

1 第九章 兩組樣本之檢定 陳順宇 教授 成功大學統計系

2 問題形式 1.就數學成績而言, 男生成績(母體1)平均數與 女生成績(母體2)平均數是否有顯著差異。

3 2.就數學成績而言, 男生成績(母體1)變異數 是否比女生成績(母體2)的變異數大。

4 兩組獨立樣本 第一種是由兩個母體各自獨立抽樣, 這種情況下兩組樣本間是獨立的, 稱之為〝兩組獨立樣本〞。

5 兩組相關樣本 第二種情形是由兩個母體中成對的抽樣, 這種情況下兩組樣本間是相關的, 稱之為〝兩組相關樣本〞 (或稱為成對的樣本)

6 判斷兩種配方效果是否有差異? (1)研究兩種施肥方式(或兩種不同肥料)對 蕃茄產量是否有影響? (2)兩種不同教學方式
(傳統教學與電腦輔助教學) 教學效果是否有差異?

7 (3)成年男女生的平均IQ是否有不同? (4)兩種不同的體能訓練何者效果較佳? (5)某公司薪資待遇是不是有性別歧視 這些都是做兩個母體平均數的檢定問題

8 我們關心的是這兩個母體的表現 (以平均數當指標)有無差異(雙尾檢定), 或是某一母體平均數是否 〝高於〞另一母體之平均數(單尾檢定)。

9 如何驗證上述的問題呢? 首要工作是收集資料,統計分析方法與資料如何取得有密切的關係, 基本上資料收集分成
完全隨機設計(CRD) 獨立樣本),與 集區隨機設計(BRD) 相關樣本)

10 後者在兩組樣本時又稱為成對取樣(Pair)。
例如我們想知道台灣地區 已婚男生平均體重與已婚女生平均體重是否有差異? 男生的體重為一母體, 女生的體重為另一母體

11 圖9.1 男女生體重之分配

12 獨立樣本 從男生中抽50人得到50筆體重資料 從女生中抽32人得到32筆體重資料 此為二組獨立樣本。

13 相關樣本 如果抽樣方式是抽40對夫婦, 得到40筆男生體重與40筆女生體重, 因夫婦體重可能有相關, 此為兩組相關樣本

14 9.1 兩組樣本獨立與相關的差異 問題1. 旭光牌的日光燈平均壽命與 飛利浦的日光燈平均壽命 是否有差異?

15 問題2. 每分地使用50公斤的氮肥是否比 每分地使用40公斤的氮肥 蕃茄平均產量高?

16 問題3. 吃某種減肥菜是不是有減肥效果?

17 問題4. 電腦輔助教學與傳統教學法 在教學效果上有無差異?

18 第1問題 如從旭光牌中隨機取20支日光燈 量測其壽命量測結果資料設為 x1, x2 ,..., x20

19 再從飛利浦產品中隨機取35支日光燈量其壽命,量測結果資料為
y1, y2,..., y35, 以這種方式的取樣, 為完全隨機設計(CRD)

20 完全隨機設計與第一章所談的 簡單隨機抽樣法相似, 這種資料就是2組獨立樣本 (此問題要用成對抽樣(RBD)較困難)

21 第2個問題 影響產量因素除了肥料外尚有其他因素, 例如土壤、水份、園丁等, 為了使實驗正確(即能判斷出氮肥多寡是否對蕃茄產量有影響),
應對其他如土壤等因素加以控制

22 最好方法就是以成對(Pair) 收集資料 (或更廣義的說法是集區設計的概念)

23 成對在實驗設計的重要性就像前面所談 ”分層“隨機抽樣法在民意調查中的 重要性一樣, 〝成對〞也與〝分層〞有相同困難度

24 以此題而言,如果我們認為除氮肥外,土壤也是影響產量的重要因素,
可以考慮安排下面的實驗方式,

25 找一對對土壤品質很接近土地 例如找20對土地(共40塊), 每對土地的土壤品質很接近, 然後對每一對土地, 隨機安排
一塊土地施40公斤氮肥, 一塊土地施50公斤氮肥,

26 這樣就可得到20對如下形式的資料 (x1, y1), (x2, y2),…, (x20, y20)

27 第3問題 可以安排 CRD 實驗 也可以安排 RBD 實驗

28 CRD: 如果找40位體重超過80公斤的 女士參與此種減肥的實驗, 20位吃減肥菜(實驗組), 20位不吃減肥菜(對照組)
(代之以安慰劑,外型與減肥菜相同),

29 設實驗3個月後得到每組20筆資料 此為兩組獨立的樣本也就是CRD 實驗。

30 RBD: 如果我們依體型 (或其他認為對減肥有影響因素也可) 事先將40位配對,分成20組, 每組的兩位體型大致相同, 然後隨機安排
一位吃減肥菜,一位吃安慰劑,

31 設實驗三個月後得體重資料 這種資料是成對資料也就是 RBD 實驗。

32 醫學上最常用來做成對的是雙胞胎, 尤其同卵雙胞胎, 若是動物實驗則利用同窩白老鼠。

33 本尊與分身 重複測量是以同一個人(本尊) 做集區, 而以性質相似的受測者或雙胞胎 做分組配對則是以分身做集區

34 第4個問題 教學方式對教學效果的影響 可考慮下列幾種實驗設計: (1)同一老師,兩種教法 (2)同一學生接受兩種教學
(3)成對(Pair)或集區設計

35 9.2 兩組獨立樣本之檢定 (變異數已知)

36

37

38

39 1.求m1-m2的1-a信賴區間

40 2.雙尾檢定

41 統計量

42

43 表9.1 變異數已知的 兩組獨立平均數之檢定表

44 例9.1男女生平均體重有無差異 設收集40位男生與30位女生體重, 男生的樣本平均體重是66.65 , 標準差已知是s1= 7,
女生的樣本平均體重是56.40, 標準差已知是s2= 6,

45 (1)求男女生平均體重差距m1-m2的 95%信賴區間。 (2)檢定男女生平均體重有無差異?

46

47

48 (2)檢定男女生的 平均體重有無差異

49

50 男女生平均體重有顯著差異

51 若要檢定男、女生平均體重 是否相差5公斤以上?

52

53 所以男、女生平均體重 相差5公斤以上

54 兩組獨立樣本之檢定(變異數未知) 變異數分成 有均質性與異質性 兩種情形

55

56 綜合樣本變異數

57 統計量

58

59 兩組平均數比較的檢定問題

60 兩組獨立樣本t 檢定統計量 (均質性)

61 表9.2 變異數未知但相等 兩組獨立母體平均數之檢定表
表9.2 變異數未知但相等 兩組獨立母體平均數之檢定表

62 兩組獨立母體平均數檢定, 在有均質性下 只要提供兩組抽樣資料 (a) 樣本數 (b) 樣本平均數 (c) 樣本標準差
3種統計量(次級資料), 就可算出t值做結論, 不一定要有原始資料

63 例9.2、(例9.1續)男女生的體重 若男女生的體重標準差都未知, 由樣本分別算出樣本標準差為 s1= 6.974,s2= ,

64 (1)男生平均體重m1與女生平均體重m2 差距m1-m2的95%信賴區間。 (2) 檢定男女生平均體重有無差異?

65 綜合樣本變異數

66 綜合樣本標準差

67 誤差界限

68

69 t值

70 男、女生平均體重有顯著差異

71 例9.3、某人欲檢定某地區 男、女生平均收入是否有差異?
(1)抽樣男生20位、女生20位, 得樣本平均數分別為40000元與38000元 男女生收入的樣本標準差相等=5000 元 試問此地區男、女生平均收入 是否有顯著差異?

72 (2)若抽樣男生100位、 女生100位, 得樣本平均數分別40000 元與38000元 樣本標準差相等=5000 元,
試問此地區男、女生平均收入 是否有顯著差異?

73 檢定

74 t值

75 男、女生平均收入是 沒有顯著差異

76 抽男生100位、女生100位 t值

77 有證據說 男、女生平均收入有顯著差異

78 註1: 若樣本平均數與標準差沒有改變, 則樣本數增加,t值增大

79 註2:抽男生100位、女生100位,若收入單位改為萬元

80 所以不論收入單位為何,t 值沒有改變 即兩組樣本 t 檢定的t 值是單位不變量

81 例9.4、 若由甲、乙兩生產線分別抽樣 100個、200個產品測量其容量, 得甲、乙的樣本平均數分別為 30.2cc、30cc,
而標準差分別為 0.5cc、0.52cc,

82 請問 (1)甲生產線平均容量是否顯著高於30? (2) 甲、乙兩生產線所生產產品的平均 容量是否有顯著差異?

83 檢定

84 t 值

85 有證據說甲生產線 平均容量高於30cc

86 (2) 此即檢定

87 綜合樣本標準差

88 t 值

89 有證據說甲、乙兩生產線的 平均容量有顯著差異

90 例9.5 陽明貨運公司想從甲輪胎公司與 乙輪胎公司中選一種廠牌購買輪胎,

91 從甲、乙各選10個輪胎 做壽命檢查 假設已知兩家公司輪胎壽命變異數相等, 檢定兩公司輪胎平均壽命有無顯著差異?

92 表9.3 甲、乙輪胎壽命比較

93

94 例9.7、 (例1.9續) 抽樣50位台南市成年市民 身高資料如例1.9, 男、女生平均身高與標準差分別為

95 (1)檢定台南市民男、女生平均身高 是否有顯著差異? (2)檢定台南市男生平均身高 是否比女生平均高5公分以上?

96 綜合樣本標準差

97 (1) t值

98 即男女生身高有顯著差異

99 (2) 檢定男生身高比女生 高5公分以上,即檢定
(2) 檢定男生身高比女生 高5公分以上,即檢定

100 t值

101 即男生比女生高5公分以上

102

103 兩組獨立樣本檢定統計量 (異質性)

104 自由度

105 保守的自由度

106

107 檢定

108 兩組獨立樣本檢定統計量 (異質性) t值

109 棄卻域

110 例9.8、(例9.5續) 對輪胎壽命例題, 如不知道變異數是否相等? 檢定兩公司輪胎平均壽命是否有差異?

111

112 t值

113 自由度

114 即兩公司輪胎壽命無顯著差異

115 9.4兩組獨立樣本變異數之檢定 如何先做兩組變異數相等的檢定呢?

116 二組資料分別來自常態母體

117 檢定(右尾)

118 右尾檢定(9.39) 式兩組變異數棄卻域

119 例9.9、(例9.5續) 對輪胎壽命例題, 檢定兩公司輪胎壽命變異數是否相等?

120 檢定

121

122

123 即沒有證據說兩輪胎公司 輪胎壽命變異數不相等

124 SAS

125 SAS執行結果如下

126 註7:值與 t值的關係如下圖, t值為坐標,p值為面積

127 兩組成對樣本 t 檢定

128 下面是兩組成對平均值檢定 基本上是將二組成對資料變成一組資料 再利用t檢定

129 兩組資料的差

130 平均數

131 標準差

132

133 例9.10、 甲、乙兩種測量儀器,測量產品厚度 隨機找10個產品分別以兩種儀器測量, 測量次序是隨機的, 結果如下:
8.4 8.2

134 (1)請問此兩種儀器所測量的平均厚度 是否有顯著差異 ? (2)利用兩種儀器測量厚度相差的標準差 求此兩種儀器測量厚度之相關係數?

135 甲、乙兩種測量厚度平均值與標準差分別

136 d為甲、乙兩種儀器測量 厚度的相差

137

138 t 值

139 兩種測量儀器無顯著差異

140

141

142 例9.11

143 A,B 評分之變異數

144 綜合樣本變異數

145 t值

146 A,B兩種飲料平均評分 無顯著差異

147 上面兩組獨立檢定方法是不正確的, 主要理由在於同一人評A,B兩種產品時,其評分會有相關, 相關樣本資料的檢定需要利用 『成對t 檢定』

148 A,B 之差距及差距之平方

149

150 t值

151 A,B兩種飲料平均評分 有顯著差異

152 例9.12、 某連鎖商店想了解廣告 (1)前後銷售量是否有相關? (2)平均銷售量是否有差異? 搜集18家商店廣告前後的銷售量 (單位:箱)

153

154 (1) 求廣告前後銷售量的相關係數? (2) 檢定廣告前後之平均銷售量 是否有差異? (3) 檢定廣告後之平均銷售量 是否比廣告前多3箱以上?

155 廣告前後銷售量的相關係數

156

157 t值

158 廣告前後平均銷售量 有顯著差異

159 (3) 檢定

160 t值

161 即無證據說廣告後 平均銷售量多3箱

162 實驗組與對照組之選擇 在進行兩組資料的比較時, 最大困難在於如何選擇實驗對象做比較,

163 例9.13、 1916年第一次小兒麻痺症在美國流行,其後40年有幾十萬人死於小兒麻痺, 尤其是小孩。 1950年代已有許多預防針上市,
其中以沙賓疫苗最被看好,

164 如何將學童分在 實驗組與對照組? 1954年公共衛生服務部準備做 一大型的實驗, 將近幾百萬位小孩參加此實驗,
研究沙賓疫苗是否對預防小兒麻痺有效? 這是一次規模相當大的醫學實驗。

165 幾個可能的想法: (1) 前後二年的比較: (2)年級比較的設計: (3)同意參加(實驗組)與 不同意參加(對照組)的比較:
(4)雙盲隨機取樣法:

166 (4)雙盲隨機取樣法: 將願意參與實驗的學生分成兩組, 最好兩位一對 其條件(如父母收入等)儘量相同 然後隨機取
一人在實驗組(注射沙賓疫苗), 另一人在對照組(未注射沙賓疫苗)。

167 此種實驗設計稱為雙盲設計, 是醫學實驗較常使用的方法
而在實驗過程中為了避免心理及其他主觀的判斷造成診斷偏差,應使用安慰劑

168 即對照組學生以注射鹽水劑當安慰劑 使參與實驗的學生不知道 他被分在那一組, 而且醫生也不知道 那一位學生是實驗組,那一位是對照組,

169 例9.14、 日光燈剛問世時,有人認為在日光燈的輻射下將喪失生殖能力,
以老鼠做實驗,未在日光燈輻射下的控制組老鼠已有了正常數目的子孫,但實驗組則無子孫。 因此認為在日光燈下確實對生殖能力有影響, 後來經過重新檢驗發現 實驗組老鼠都是同性的。

170 第九章 摘要

171 1. CRD設計與RBD設計的差別 學習分辨資料是 兩組獨立的樣本或相關的樣本, 並知道CRD設計與RBD設計的差別

172 2. 兩組獨立樣本檢定 需先判斷兩組母體的變異數是否相等? 如變異數相等 則需求出綜合樣本變異數, 如變異數不相等
 需先判斷兩組母體的變異數是否相等? 如變異數相等 則需求出綜合樣本變異數, 如變異數不相等 則需以個別的(樣本)變異數計算。

173 3.兩母體變異數是否相等 學習如何檢定兩母體變異數是否相等? 基本上以統計量檢定之。

174 4.軟體做兩組樣本的檢定 學習以軟體做兩組樣本的 t檢定(檢定平均數是否相等)及 F檢定(檢定變異數是否相等)。

175 5.成對檢定 兩組成對檢定的基本方法是 將一對對資料相減後變成一組資料 再做檢定, 學生應了解成對觀念及其重要性。

176 變異數以綜合代

177 變異數以個別代

178 7.t值是單位不變量 與一組樣本值一樣, 兩組樣本值也是單位不變量


Download ppt "第九章 兩組樣本之檢定 陳順宇 教授 成功大學統計系."

Similar presentations


Ads by Google