Download presentation
Presentation is loading. Please wait.
Published by裔 房 Modified 8年之前
2
學生氏 t 分布 單一樣品均值推論 兩樣品均值差之分布 兩樣品非成對 t 值檢定 兩樣品成對 t 值檢定 二項分佈均值差推論 第八章. 樣品均值比較問題 The Comparison Problem of Sample Mean
3
8.1 學生氏 t 分布 於實際應用上,族群變方 通常都是未知的,因此 以樣品資料求得樣品均方 來代替族群變方 於實際應用上,族群變方 通常都是未知的,因此 以樣品資料求得樣品均方 來代替族群變方 所得並非標準常態分布的標準化值 Z ,而是 t 值。 所得並非標準常態分布的標準化值 Z ,而是 t 值。
4
學生氏 t 分布 此 t 值之分佈為學生氏 t 分布 (Student’s t- distribution) ,為高斯特 (William Sealy Gosset) 於 1908 年所推導得,並以其筆名 Student 來命名。 此 t 值之分佈為學生氏 t 分布 (Student’s t- distribution) ,為高斯特 (William Sealy Gosset) 於 1908 年所推導得,並以其筆名 Student 來命名。 t 分布之機率密度函數為: t 分布之機率密度函數為:
5
8.2 t 分布之性質 t 分布是以均值 0 為中心的左右對稱分布,而不同 的自由度 有不同的 t 分布。 t 分布是以均值 0 為中心的左右對稱分布,而不同 的自由度 有不同的 t 分布。 t 分布不與橫軸相交, t 分布曲線下的面積等於 1 。 t 分布不與橫軸相交, t 分布曲線下的面積等於 1 。 t 分布決定於自由度 ,它是 t 分布唯一的參數。 t 分布決定於自由度 ,它是 t 分布唯一的參數。 若 n 趨近於無窮大時, t 分布會趨近於標準常態分 布 (Z 分布 ) 。 若 n 趨近於無窮大時, t 分布會趨近於標準常態分 布 (Z 分布 ) 。 t 分布曲線下的機率,如同標準常態分布,已有累 計機率表可供查閱 ( 附表五 ) 。 t 分布曲線下的機率,如同標準常態分布,已有累 計機率表可供查閱 ( 附表五 ) 。
6
-3 -2 -1 0 1 2 3 t 分布之性質
7
虛無假設 (null hypothesis) 對立假設 (alternative hypothesis) 定顯著水準 或 ( 雙尾 ) 計算 t 值 若 ,則接受 H 0 的假設,反之則拒絕 H 0 的假 設。 ( 附表 5 列出右單尾機率及其 t 值,與附表 4 之 Z 值分佈表示法不同 ) 若 ,則接受 H 0 的假設,反之則拒絕 H 0 的假 設。 ( 附表 5 列出右單尾機率及其 t 值,與附表 4 之 Z 值分佈表示法不同 ) 8.3 單一樣品均值推論 如檢測一樣品是否來自於某族群,若族群變方 未知,而以樣品均方 來代替族群變方,則其假 設檢定程序為: 如檢測一樣品是否來自於某族群,若族群變方 未知,而以樣品均方 來代替族群變方,則其假 設檢定程序為:
8
例子 8.1 假設消基會調查市面上某速食品所含防 腐劑如下: 3 , 4 , 5 , 4 , 2 ppm ,試推論此速食 品所含防腐劑是否符合國家訂定的標準值 3ppm 。 首先計算資料之平均值及均方 首先計算資料之平均值及均方
9
例子 8.1 假設消基會調查市面上某速食品所含防 腐劑如下: 3 , 4 , 5 , 4 , 2 ppm ,試推論此速食 品所含防腐劑是否符合國家訂定的標準值 3ppm (1) (2) (3) 設定顯著水準 ( 雙尾 ) (4) 計算 t 值 ,故接受 H 0 的假設, 表示此速食品所含防腐劑符合國家標準值 3ppm 。
10
由上式信賴區間中包括 3ppm 在內,故接受 H 0 的假設。 另外我們也可求 的 之信賴區間如下: 另外我們也可求 的 之信賴區間如下: 例子 8.1 可得此速食品防腐劑含量之 95% 信賴區 間為 例子 8.1 可得此速食品防腐劑含量之 95% 信賴區 間為
11
虛無假設 (null hypothesis) 對立假設 (alternative hypothesis) 3) 定顯著水準 ( 雙尾 ) 4) 計算 若 ,則接受 H 0 的假設,反之則拒絕 H 0 的假 設。 ( 見附表 4 之 Z 值分布 ) 若 ,則接受 H 0 的假設,反之則拒絕 H 0 的假 設。 ( 見附表 4 之 Z 值分布 ) 8.4 二項族群樣品均值推論 二項族群檢測一樣品是否來自於某族群,其假設 檢定程序為: 二項族群檢測一樣品是否來自於某族群,其假設 檢定程序為:
12
[ 例 8.2a] 一般患肺癌病人 3 年內之死亡率約 90%, 今有 一新療法, 試驗 150 位病人 3 年內有 126 位病人死亡, 問新療法是否較佳 故接受, 新療法較佳 故接受, 新療法較佳
13
或以樣品合計亦得同樣結果
14
[ 例 8.2b] 設今有甲乙兩位市長候選人, 在投票前做民 調, 從全市電話 100 萬號中隨機訪問 1000 人, 結果有 480 人贊成甲候選人,520 人贊成甲候選人, 試推算兩 位市長候選人之得票率有無差異 ( 1) 得票率 ( 1) 得票率 甲 : p1=480/1000=0.48 甲 : p1=480/1000=0.48 乙 : p2=520/1000=0.52 乙 : p2=520/1000=0.52 (2) 得票率估計誤差值 (2) 得票率估計誤差值 為安全起見, 在估算估計值 ( 得票率 p) 之變 方時, 當取 p=0.5, 可得族群最大變方為 為安全起見, 在估算估計值 ( 得票率 p) 之變 方時, 當取 p=0.5, 可得族群最大變方為 V(p)=pq/n=0.5x0.5/1000=0.00025 V(p)=pq/n=0.5x0.5/1000=0.00025 其抽樣誤差 (sampling error) 為 其抽樣誤差 (sampling error) 為 SE(p)= SE(p)=
15
在 95% 信賴水準下 ( ), 估計誤差值 (b) 為 b= b= (3) 95% 信賴區間 (3) 95% 信賴區間 甲 :(0.48-0.032,0.48+0.032) 甲 :(0.48-0.032,0.48+0.032) (0.448,0.512) (0.448,0.512) 乙 :(0.52-0.032,0.52+0.032) 乙 :(0.52-0.032,0.52+0.032) (0.488,0.552) (0.488,0.552)
16
結論 在乙候選人之 95% 信賴區間 (48.8%,55.2%) 中包括甲候選人之 得票率估計值上限 51.2%, 因此推斷 兩候選人之得票率沒有差別。 在乙候選人之 95% 信賴區間 (48.8%,55.2%) 中包括甲候選人之 得票率估計值上限 51.2%, 因此推斷 兩候選人之得票率沒有差別。 不過當調查人數 (n) 增加時, 其結論 就不一定相同了。 不過當調查人數 (n) 增加時, 其結論 就不一定相同了。
17
8.5 兩樣品均值差之推論 Inference of The Difference of Two Sample Means 一般從事試驗性研究,多會比較兩事物 ( 兩族群 ) 是否有差異,如 A 、 B 兩種藥品治療某疾病是否 有差別,或是兩種土壤 pH 值是否一樣等問題。 一般從事試驗性研究,多會比較兩事物 ( 兩族群 ) 是否有差異,如 A 、 B 兩種藥品治療某疾病是否 有差別,或是兩種土壤 pH 值是否一樣等問題。 而採用的方法是由兩事物中隨機抽取樣品,並 以兩樣品均值之差,經假設檢定程序以推論兩 事物是否有差異存在。 而採用的方法是由兩事物中隨機抽取樣品,並 以兩樣品均值之差,經假設檢定程序以推論兩 事物是否有差異存在。 我們不能單憑比較兩樣品均值的大小而下結論。 我們不能單憑比較兩樣品均值的大小而下結論。 關於如何進行假設檢定,我們先要瞭解兩樣品 均值差之分佈型態。 關於如何進行假設檢定,我們先要瞭解兩樣品 均值差之分佈型態。
18
8.5.2 兩樣品均值差之 Z 分佈 若兩樣品均值之分佈都為常態,則兩樣品均值 差之分佈亦為常態,因此可求得標準常態化值 Z 為: 若兩樣品均值之分佈都為常態,則兩樣品均值 差之分佈亦為常態,因此可求得標準常態化值 Z 為: 若兩族群之變方 相等,則上式可改寫成: 若兩族群之變方 相等,則上式可改寫成:
19
8.5.2 兩樣品均值差之 t 分佈 8.5.2 兩樣品均值差之 t 分佈 由於族群變方通常未知,因此以樣品均方 來代 替,即可得 t 值如下: 由於族群變方通常未知,因此以樣品均方 來代 替,即可得 t 值如下: 若兩族群之變方相等時,兩樣品均方可求得一 共同均方 ,則上式可改寫成: 若兩族群之變方相等時,兩樣品均方可求得一 共同均方 ,則上式可改寫成:
20
8.5.3 兩樣品均值差成對 t 檢定 (paired t test for two sample means) 當欲比較之兩樣品來自相同環境時,如每個試 驗單位可分前後期來比較,或者可分為兩個小 單位,以隨機安排兩處理 (treatment) 。 當欲比較之兩樣品來自相同環境時,如每個試 驗單位可分前後期來比較,或者可分為兩個小 單位,以隨機安排兩處理 (treatment) 。 則我們宜採用成對 t 檢定法。 則我們宜採用成對 t 檢定法。 例如比較同一株菸草,其上、下部葉片之尼古 丁含量是否有差別,我們可將上半部菸草及下 半部菸草當作兩個樣品,而且此兩樣品是成對 的,兩族群變方也是相同的。 例如比較同一株菸草,其上、下部葉片之尼古 丁含量是否有差別,我們可將上半部菸草及下 半部菸草當作兩個樣品,而且此兩樣品是成對 的,兩族群變方也是相同的。
21
(1) 虛無假設 (2) 對立假設 (3) 設定顯著水準 或 。 (4) 計算 t 值,首先求成對樣品觀測值之差 而 n 對觀測值差之總和為 其均值為 假設檢定程序 平方和為均方為 成對樣品均值差之均方為
22
故 t 值為 假設檢定程序 若實測 |t|> 值, 自由度為 ,顯著水準為 , 表示兩族群均值有差異,反之則否。
23
成對 t 值檢定 (paired t test) 一. 自身配對: 如下圖為 A,B 兩種病毒分別接種於一片菸葉的兩邊, 以比較此菸草品種抗何 種病毒。 如下圖為 A,B 兩種病毒分別接種於一片菸葉的兩邊, 以比較此菸草品種抗何 種病毒。 同一試驗單位(如人、大型動物或植物)分成兩部位安排兩處理。 同一試驗單位(如人、大型動物或植物)分成兩部位安排兩處理。 同一試驗單位在前後不同時間安排兩處理 同一試驗單位在前後不同時間安排兩處理
24
透析前體重透析後體重 53.248.05.2 73.069.63.4 61.857.24.6 43.441.61.8 52.951.81.1 62.859.63.2 和 347.1 327.819.3 均值 57.85 54.63333.2167 例子 8.3 今欲比較洗腎病人透析前後之體重是 否不同,6 位病人腎臟透析前後體重如下表: 例子 8.3 今欲比較洗腎病人透析前後之體重是 否不同,6 位病人腎臟透析前後體重如下表:
25
t = 5.0097 > ,表示一般洗腎病人透析 後之體重會減輕。 透析前體重為一樣品, 透析後之體重為另一樣品, 兩樣品相對樣品點均來自同一人, 故以成對 t 值檢 定法先求兩樣品相對觀測值差之平方和為 透析前體重為一樣品, 透析後之體重為另一樣品, 兩樣品相對樣品點均來自同一人, 故以成對 t 值檢 定法先求兩樣品相對觀測值差之平方和為 自身配對
26
成對 t 值檢定 (paired t test) 二. 同源配對-安排兩處理之兩個試驗單位 二. 同源配對-安排兩處理之兩個試驗單位 (動物或植物)要同性質, 如種屬、同性 別、同年齡與相近體重。 (動物或植物)要同性質, 如種屬、同性 別、同年齡與相近體重。
27
【例】今有 A 、 B 兩營養食品品質比較, 每種食品 重複四次, 試驗材料為白老鼠, 每兩隻為不同時期 出生, 隨機安排兩食品, 飼養一段時間後之增重如 下 出 生 時 期 ( 週 ) 食品IⅡⅢⅣ和平均 A101516185914.75 B162025288922.25
28
同源配對 (paired t test) 食品 ` ⅠⅡⅢⅣ和平均 A101516185914.75 B162025288922.25 A-B-6-5-9-10-30-7.50 兩食品間品質有差異, 以 B 食品為優
29
8.5.4 非成對 t 檢定 (unpaired t test) 當兩樣品並非成對得來,而是獨立取得時,則 宜採用非成對 t 檢定。 當兩樣品並非成對得來,而是獨立取得時,則 宜採用非成對 t 檢定。 安排兩處理之試驗單位應全為同質,並將試驗 單位完全隨機分成兩組。 安排兩處理之試驗單位應全為同質,並將試驗 單位完全隨機分成兩組。 試驗單位 n=20 第 1 組 (10) 第 2 組 (10) A 藥品 B 藥品 隨機分配 根據族群變方是否相等,而有不同的檢定式。 根據族群變方是否相等,而有不同的檢定式。
30
(1) 變方相等 ( ) 兩處理 ( 藥品、食品、療法、技術 ) 比較 非成對 t 值檢定 (unpaired t test) ( 兩獨立處理比較 ) ( 兩獨立處理比較 ) @ 安排兩處理之試驗單位全為同質, 如下圖為 8 隻白老鼠同時出生, 每處理重複 4 次, 隨機安排兩 處理, 可得各處理有相同變方 ( 各處理隨機排列 )
31
編號 A 奶粉嬰兒增重 B 奶粉嬰兒增重 16.96.4 27.66.7 37.35.4 47.68.2 56.85.3 6789107.28.05.57.36.65.85.76.27.1 合計64.263.4 平均7.136.34 例子 8.4 假設有 A 、 B 兩種嬰兒奶粉, A 奶粉試 用 9 位初生男嬰, B 奶粉試用 10 位男嬰,則一 個月後兩組嬰兒增重情形如下,試比較兩種嬰 兒奶粉的增重效果是否有差異? ( ) 例子 8.4 假設有 A 、 B 兩種嬰兒奶粉, A 奶粉試 用 9 位初生男嬰, B 奶粉試用 10 位男嬰,則一 個月後兩組嬰兒增重情形如下,試比較兩種嬰 兒奶粉的增重效果是否有差異? ( )
32
(1)(2) (3) 設定顯著水準 ( 雙尾 ) (4) 計算 t 值,首先求兩獨立樣本之平方 和 ,故拒絕 H 0 的假設,表示 A 奶粉對嬰兒的增重效果較 B 奶粉 佳。 共同均方為
33
(2) 族群變方不等 ( )
34
雙尾檢定
35
單尾檢定
36
例 :痛風病人與正常人血中尿酸濃度 之比較 資料 痛風病人 : 8.2 16.7 7.5 14.6 6.3 9.2 11.9 5.6 12.8 4.9 正常人 : 4.7 6.3 5.2 6.8 5.6 4.2 6.0 7.4 痛風病人正常人 樣品大小平均平方和均方 n 1 =10 : 9.17 : 9.1794.40110.600 n 2 =8 :5.775 :5.7758.01501.1450
38
加權自由度
39
加權 t 值
40
[ 案例 ] 設今有 A 、 B 兩種藥品欲比較其對某種疾病 之療效,有 12 位病患自願參與試驗,試問如何 安排此試驗比較妥當? 1. 每種藥品選擇兩位年齡體位相近的病人隨機安 排 A 、 B 兩藥品,採用同源配對試驗。 2. 將 12 位病患隨機分成兩組,每組 6 人,各安排 A 、 B 兩藥品,採用非成對 t 值試驗。 請問?你比較贊成那種試驗法,為什麼 ? @ 人為雜種動物, 無法同源配對, 故採用非成對 t 值 測驗比較妥當。 思考題
41
8.6 樣品大小之決定 當兩族群變方已知, 且兩樣品大小 (n) 相同, 在顯著水準, 當兩族群變方已知, 且兩樣品大小 (n) 相同, 在顯著水準, 檢定力為 條件下, 樣品大小應多大, 才能測出兩族群 均值之差異, 其 n 之求法為 : 檢定力為 條件下, 樣品大小應多大, 才能測出兩族群 均值之差異, 其 n 之求法為 : 當
42
當族群變方未知時, 以樣品均方代替, 則 n 之計算公式 為
43
設今有 A,B 兩藥品各試驗 10 位病人, 服藥後測 定病人血液中之吸收總藥量如下 : 藥品 | -------- | ---------------------------------------------------------------------------------------------- A | 61.5 71.3 49.4 76.5 60.8 90.4 81.6 55.4 68.7 85.9 |701.5 A | 61.5 71.3 49.4 76.5 60.8 90.4 81.6 55.4 68.7 85.9 |701.5 B | 80.6 90.5 60.8 70.4 75.6 70.8 87.6 99.8 62.7 85.6 |784.4 B | 80.6 90.5 60.8 70.4 75.6 70.8 87.6 99.8 62.7 85.6 |784.4---------------------------------------------------------------------------------------------------------
44
若兩藥品被吸收總量之差的絕對值要達到 B 藥 品的 10%, 即, 而, 則, 設 故至少需要 49 人才有 80% 的檢定力以偵測出兩 族群平均值有 10% 的差異 故至少需要 49 人才有 80% 的檢定力以偵測出兩 族群平均值有 10% 的差異
45
8.7 二項分佈兩樣品均值差推論 當取得的樣品夠大時,二項分佈可呈近似常態分 佈,而二項分佈兩樣品均值差之分佈,亦為近似 常態分佈 當取得的樣品夠大時,二項分佈可呈近似常態分 佈,而二項分佈兩樣品均值差之分佈,亦為近似 常態分佈 (1) 虛無假設 (2) 對立假設 (3) 設定顯著水準 或 。 (4) 計算 Z 值
46
二項分布兩樣品均值差推論 二項分布兩樣品均值差推論 若 ,且 H 0 的假設成立,則其 p 之估值為 若 ,且 H 0 的假設成立,則其 p 之估值為 則 Z 值為 虛無假設對立假設
47
例子 8.7 某農藥商宣稱,其新的農藥產品比舊 產品之殺蟲效果高出 8% ,今將此農藥施用於 某昆蟲,其結果得如下記錄: 例子 8.7 某農藥商宣稱,其新的農藥產品比舊 產品之殺蟲效果高出 8% ,今將此農藥施用於 某昆蟲,其結果得如下記錄: 新產品舊產品合計 死蟲數活蟲數320806040380120 合計死亡率400100500
48
(1) 虛無假設 (2) 對立假設 (3) 設定顯著水準 。 (4) 計算 Z 值 ,則拒絕 H 0 的假設,表示新產品之殺 蟲效果比舊產品高出 8% 。 ,則拒絕 H 0 的假設,表示新產品之殺 蟲效果比舊產品高出 8% 。
49
(1) 虛無假設 (2) 對立假設 (3) 設定顯著水準 。 (4) 計算 Z 值 ,則拒絕 H 0 的假設,表示新產品之 殺蟲效果比舊產品好。 ,則拒絕 H 0 的假設,表示新產品之 殺蟲效果比舊產品好。 假設我們只要知道新產品是否比舊產品之殺蟲 效果好,而不一定要知道殺蟲率高多少。 假設我們只要知道新產品是否比舊產品之殺蟲 效果好,而不一定要知道殺蟲率高多少。
50
卜瓦松分布兩樣品比較 根據卜瓦松分布原理, 根據卜瓦松分布原理, 當, 之分布接近常態分布 當, 之分布接近常態分布 卜瓦松分布兩樣品比較公式為 卜瓦松分布兩樣品比較公式為
51
[ 例 8.10] 設今檢察 A,B 兩國小學童大便中有無蛔蟲, 分別得為 A 校為 8 人,B A 校為 15 人, A,B 兩國小學童 大便中有蛔蟲人數有無不同 實測 |Z|=1.4596< 1.96 實測 |Z|=1.4596< 1.96 故推論 A,B 兩國小學童大便中有蛔蟲人數相同 故推論 A,B 兩國小學童大便中有蛔蟲人數相同
52
(1) 單一樣品 t 檢定 (2) 兩樣品 非成對 t 檢定 (3) 兩樣品 成對 t 檢定
53
本章結束
Similar presentations