八、假設檢定 I (Hypothesis Testing Ⅱ) 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生物資訊組 劉仁沛教授 jpliu@ntu.edu.tw
假設檢定(Hypothesis Testing Ⅱ) 小樣品均值檢定 單樣品比例檢定 二個樣品均值比較之推論 相依樣品(Paired Samples) 獨立樣品(Independent Samples) 樣品數決定 二獨立樣品比例比較之推論 變方推論(Inference for Variance)
小樣品均值檢定 在大樣品(n≧30) 的分佈為標準常態分佈 但小樣品(n<30) 之分佈並非為標準常態分佈
小樣品均值檢定 1908年,在愛爾蘭都柏林Guiness 啤酒廠工作的William Sealy Gosset因研究啤酒品質的需要導出t的分佈,並以其Student筆名發表於Biometrika統計期刊(公司禁止員工發表任何研發成果)故此分佈又稱Student-t分佈。
性質 1.對稱於0。 2.與自由度有關(n-1)。 3.長尾 4.自由度大時t分佈趨近於標準常態分佈 見P.475-476附表5。
單尾檢定 H0:μ≧μ0 vs. Ha: μ<μ0 決策方法:顯著水準=α (1) 拒絕H0 (2) 拒絕H0 (3) 拒絕H0 樣本數
單尾檢定 H0:μ≦μ0 vs. Ha: μ>μ0 決策方法:顯著水準=α (1) 拒絕H0 (2) (3) 拒絕H0 樣本數
雙尾檢定 H0:μ=μ0 vs. Ha: μ≠μ0 決策方法:顯著水準=α (1) (2) (3) 樣本數
例:某速食品防腐劑含量3,4,5,4,2 ppm.消基會是否可證明此速食食品防腐劑含量高於政府所定國家標準3ppm. H0:μ=3ppm(=μ0) vs. Ha:μ>3ppm
95 %信賴下限 無法拒絕H0 95%信賴區間
例:標準治療肺癌病人3年內的存活率為0.10。現有150肺癌病人接受一種新的試驗療法,3年內共24位存活(126位死亡) 問題:新的療法是否可改善肺癌病人3年內的存 活率?
單樣品比例檢定 單尾檢定H0:P≧P0 vs. Ha:P<P0 決策方法:
單樣品比例檢定 單尾檢定H0:P≦P0 VS. Ha:P>P0 決策方法:
單樣品比例檢定 雙尾檢定 H0:P=P0 VS. Ha:P≠P0
例(繼續)
二樣品均值比較之推論 今欲比較洗腎病人透析前後之體重是否不同,6位病人腎臟透析前後體重如下表。
A,B兩種嬰兒奶粉,A奶粉試用於9個初生男嬰,B奶粉試用於10個初生男嬰。一個月後嬰兒體重增加如:
洗腎病人透析先後體重變化係指同一位病人在透析先後的體重變化(才有意義) 同一位病人透析先後之體重, 均測量自同一病人(試驗單位) 同一病人二次體重是配對的(Paired), 而具有相關係配對樣品(Paired Samples) 同一試驗單位在不同環境所得之觀測值均為 配對樣品 有氧舞蹈前後心跳的變化 服用降血壓藥前後收縮壓之變化
A.B兩種嬰兒奶粉, 吃A奶粉的9位男嬰與吃B奶粉的10位男嬰是不同 吃A奶粉9位男嬰體重增加之觀測值 與吃B奶粉10位男嬰體重增加之觀測值 是無關獨立樣品(Independent Samples) 痛風病人與正常人血液中尿酸含量 兩個不同水稻品種每公噸的產量。
配對樣品均值比較之推論 假定Di為常態分佈,資料結構 試驗單位 樣品1(X1i) 樣品2(X2i) 差(Di=X1i-X2i) 1 X11 D1=X11-X21 2 X12 X22 D2=X12-X22 … i X1i X2i Di=X1i-X2i n X1n X2n Dn=X1n-X2n 平均 變方 S2
配對樣品均值比較之推論步驟
雙尾檢定 H0:μ1=μ2 vs. Ha: μ1≠μ2 決策: (1) (2) (3)
單尾檢定 H0:μ1≦μ2 vs. Ha: μ1>μ2 決策 (1) 拒絕H0 (2) (3) 拒絕H0
單尾檢定 H0:μ1≧μ2 vs. Ha: μ1<μ2 決策 (1) 拒絕H0 (2) 拒絕H0
例:病人腎臟透析前後體重之差異
95%信賴區間
配對樣品均值比較之推論 當n≧30,可用標準常態百分位值
二獨立樣品均值比較之推論 平均 變方
二獨立樣品均值比較之推論
兩獨立樣品平均差之抽樣分佈
雙尾檢定
單尾檢定
單尾檢定
例:A、B兩種奶粉男嬰一個月體重增加 敘述統計量 樣品 樣品數 平均 平方和 變方 1 n1=9 SS1=4.08 0.5100 2 0.7693
若族群變方不等
雙尾檢定
單尾檢定
單尾檢定
例:痛風病人與正常人血中尿酸量之比較 資料 痛風病人 8.2 16.7 7.5 14.6 6.3 9.2 11.9 5.6 12.8 4.9 痛風病人 8.2 16.7 7.5 14.6 6.3 9.2 11.9 5.6 12.8 4.9 正常人 4.7 6.3 5.2 6.8 5.6 4.2 6.0 7.4 敘述統計量 痛風病人 正常人 樣品數 平均 平方和 變方 n1=10 =9.17 94.4010 10.6001 n2=8 =5.775 8.0150 1.1450
加權t值
加權自由度
大樣本
樣品數決定
例: 設計一個試驗比較A、B兩藥品服用後血中 濃度曲線下之面積(Area Under Curve AUC,代表藥物被身體吸收的量)若假定A、B兩藥品AUC平均差異為7.8,共同變方為170,α=0.05,檢定力為0.8,則本試驗每組需多少人? 先用大樣品公式取得小樣品公式起始值
兩獨立樣品比例比較之推論 新殺蟲劑 現使用殺蟲劑 合計 死蟲數 320(0.8) 60(0.6) 380 活蟲數 80(0.2) 40(0.4) 120 400 100 500 兩種殺蟲劑效果是否不同?
P1:使用新殺蟲劑某昆蟲族群之死亡率 P2:使用現有殺蟲劑某昆蟲族群之死亡率 資料結構 新殺蟲劑 現使用殺蟲劑 合計 死蟲數 X1 X2 X1+X2 活蟲數 n1-X1 n2-X2 n1+n2-X1-X2 n1 n2 n1+n2
變方推論 例:奶粉每罐重量為450公克。產品規格訂定標 準偏差σ0不能大於10公克,現抽取今日生 產5罐奶粉重量如下: 430、435、460、465、435 今日生產的奶粉標準偏差是否大於10公克?
卡方分佈(Chi-square Distribution) 卡方分佈為常態變數平方和之分佈 Z為標準常態變數 Z2為卡方1個自由度之分佈 P.477 附表6
例:奶粉罐重量 α=0.05
總結(Summary) 小樣品均值檢定:t-分佈 單樣品比例檢定 二個樣品均值比較之推論 相依樣品 獨立樣品 樣本數之決定 兩獨立樣品比例比較之推論 變方推論 習題: P.203 2,4 , P.204 6,7,8