第 8 章 一組樣本 單變項推論方法
例如: HIN1病人體溫是否高於37度 新式教法是否提升學生成績 一組樣本單變項推論方法:最簡單和最基本推論方法,用在不需要對比的變項。 估計:變項新的區間值。 假設檢定:學理或經驗累積的預設值是否發生變化。 例如: HIN1病人體溫是否高於37度 新式教法是否提升學生成績
區間估計 連續變項母體變異數 的區間估計:大樣本,樣本變異數 等於母體變異數 ,只有點估計,沒有區間估計。 連續變項母體變異數 的區間估計:大樣本,樣本變異數 等於母體變異數 ,只有點估計,沒有區間估計。 間斷二項分配大樣本成功變數 S 母體機率 P 的區間估計:抽樣分配是 ,統計量是單次成功機率 p,用 Z 分配估計。 連續變項母體平均數μ的區間估計:抽樣分配是 或 ,統計量是平均數 和標準誤差 或 ,用 Z 分配或 t 分配估計。 右尾估計:最大值或上限的估計。 左尾估計:最小值或下限的估計。 雙尾估計:同時得到上限和下限的估計。
平均數μ的估計(Z 分配) 估計母體平均數μ的時機: (1) 隨機抽樣。 (2) 母體 是或抽樣分配是 (3) 已知母體變異數 。 (1) 隨機抽樣。 (2) 母體 是或抽樣分配是 (3) 已知母體變異數 。 (4) 大小樣本皆適用。
母體平均數μ雙尾估計公式 (1) (2)
(3) 經代數處理後: (4) 雙尾估計公式:
(5) 寫成等式: e 是誤差容許度或稱為信賴度 (confidence limit),可用來估計樣本數。
區間估計執行步驟: (1) 選定信賴係數 (1 –α),常選 0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 計算樣本平均數 。 (4) 代入公式得到母體平均數μ區間估計值。
看個例子 假設研究36隻mouse體重特性分析,量測每一隻體重後得知樣本平均數為50公克,樣本標差為4公克,求母體平均數之95%C.I.;
使用SPSS 注意: SPSS中對母體平均之95%C.I. 均是用t分配. 假設有一組110筆身高樣本,建立平均身高之95% C.I..
平均數μ的估計(t 分配) 估計母體平均數μ的時機: (1) 隨機抽樣。 (2) 母體是 或抽樣分配是 (3) 只能使用樣本變異數 。 (1) 隨機抽樣。 (2) 母體是 或抽樣分配是 (3) 只能使用樣本變異數 。 (4) 大小樣本皆適用。 (5) 大樣本, 等於 ,擇一使用 t 分配或 Z 分配。
母體平均數μ雙尾估計公式: (1) (2)
(3) 經代數處理後 : (4) 雙尾估計公式 :
(5) 寫成等式 : e 是誤差容許度或稱信賴度(confidence limit),用來估計樣本數。
區間估計執行步驟: (1) 選定信賴係數 (1 –α),常選 0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 計算樣本平均數 和樣本標準誤差 。 (4) 代入公式,得到母體平均數μ區間估計值。
看個例子 假設研究36隻mouse體重特性分析,量測每一隻體重後得知樣本平均數為50公克,樣本標準差為4公克,求母體平均數之95%C.I.;
比例值 p 的估計( Z分配) 估計成功變數母體機率值 p 的時機: (1) 隨機抽樣。 (2) 母體是二項分配但抽樣分配是 (1) 隨機抽樣。 (2) 母體是二項分配但抽樣分配是 (3) 樣本數 。 (4) 小樣本 使用二項分配。
變數母體機率值 p 雙尾估計公式: (1) (2)
(3) 經代數處理: (4) 雙尾估計公式:
(5) 寫成等式: e 是誤差容許度或稱信賴度(confidence limit),用來估計樣本數。
區間估計執行步驟: (1) 選定信賴係數 (1 –α),常選0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 計算樣本機率值。 (4) 代入公式,得到母體機率值 p 區間估計值。
看個例子 假設研究一地區某物種毛之顏色特性分析,從調查樣本100隻中紅色毛物種共有30隻。求母體紅色毛比例之95%C.I.;
樣本數的估計 1. 利用誤差容許度 e 或信賴度(confidence limit),計算理論樣本數。 2. 依據時間和經費參酌經驗等因素增刪,估計實際樣本數。
常態分配樣本數的估計 1. 依據誤差容許度 e 估算。 2. 信賴係數 (1 –α)。 2. 信賴係數 (1 –α)。 3. 檢定檢力(power of test) (1 –β)。
估計理論樣本數時機: 估計實際樣本數步驟: (1) 選定信賴係數 (1 –α),常選 0.95。 (2) 得到上界 U 和下界 L 的值。 與估計母體平均數μ相同。 估計實際樣本數步驟: (1) 選定信賴係數 (1 –α),常選 0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 利用誤差容許度公式:
(4) 定出誤差容許度 e 的大小。 (5) (a) 由相關研究得到母體標準差 ,代 入誤差容許度公式,得到理論樣本數。 (b) 估算母體標準差 : R 是全距預估值。代入誤差容許度公式,得到理論樣本數。 (6) 依據經費、經驗和完成時限估算實際樣本數。
看個例子 假設研究mouse體重特性分析,母體標準差為4公克且誤差0.5公克。求95%C.I.條件下需要多少樣本數?
看個例子 假設研究mouse體重特性分析,母體標準差為4公克,在95%C.I.條件下期望樣本數100隻, 求最小誤差(公克)?
樣本數估計( t 分配) 估計理論樣本數時機: 與估計母體平均數μ相同。 估計實際樣本數步驟: (1) 選定信賴係數 (1 –α),常選0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 誤差容許度公式:
(4) 定出誤差容許度 e 的大小。 (5) (a)由相關研究得到母體標準差 n-1,代入誤差容許度公式,得到理論樣本數。 (b) 估算母體標準差 n-1 : R 是全距預估值。 (6) 依據經費、經驗和完成時限估算實際樣本數。
看個例子 假設研究mouse體重特性分析,30隻樣本之標準差為4公克且誤差0.5公克。求95%C.I.條件下需要多少樣本數?
看個例子 假設研究mouse體重特性分析,30隻樣本之標準差為4公克,在95%C.I.條件下期望樣本數100隻, 求最小誤差多少?
樣本數估計( 檢力因素) 考慮檢力 (power) 因素,(1 – β)不能低於80%: (1) 將Z分配之樣本公式改成:
看個例子 假設研究mouse體重特性分析,母體標準差為4公克,在95%C.I.條件下,檢定力0.9最小誤差0.5公克。求最少樣本數?
(2) 將t分配之樣本公式改成: (3) 其餘步驟與前二小節相同,
看個例子 假設研究mouse體重特性分析,30隻樣本之標準差為4公克,在95%C.I.條件且檢定力0.9最小誤差0.5公克。求最少樣本數?
二項分配樣本數的估計 1. 依據誤差容許度 e 估算。 2. 信賴係數(1 –α)。 2. 信賴係數(1 –α)。 3. 檢定檢力 (power of test) (1 –β)。
樣本數估計(Z分配) 估計理論樣本數時機: (1) 母體是二項分配,抽樣分配是 (2) 較適合大樣本。 估計實際樣本數步驟: (1) 母體是二項分配,抽樣分配是 (2) 較適合大樣本。 估計實際樣本數步驟: (1) 選定信賴係數 (1 –α),常選0.95。 (2) 得到上界 U 和下界 L 的值。 (3) 利用誤差容許度公式。
P是母數。 (4) 定出誤差容許度 e 的大小。 (5) (a) 由相關研究得到變數母體機率值 p,代入誤差容許度公式,得到理論樣本數。 (b) 用機率 p = 0.5估算,公式化簡成: (6) 依據經費、經驗和完成時限估算實際樣本數。
樣本數估計(檢力因素) 考慮檢力(power)因素,(1 – β)不能低於80%: (1) 將樣本數公式改成:
(2) 將樣本數公式改成: (3) 其餘步驟與前小節相同。
看個例子 假設研究一地區某物種毛之顏色特性分析,從調查樣本發現紅色毛物種比例約為0.3。求在95%C.I.及誤差0.2之下的調查樣本數?求在95%C.I.、0.9檢定力及誤差0.2之下的調查樣本數?
看個例子 假設研究一地區某物種毛之顏色特性分析,從調查樣本發現紅色毛物種比例約為0.3。求在95%C.I.及調查樣本數30之誤差為何?求在95%C.I.、0.9檢定力及調查樣本數30之誤差為何?
母數檢定法 1. 連續變項推論樣本平均數 與母體平均數預設值 之間關係,抽樣分配是 或 ,統計量是平均數 和標準誤差 或 ,使用 Z 分配或 t 分配檢定。
2. 間斷二項分配變項大樣本推論成功變數樣本機率 與母體機率預設值 之間關係,抽樣分配是 ,統計量是單次成功機率 ,使用 Z 分配檢定。
平均數μ的檢定(Z 分配) 檢定母體平均數μ的時機: 與估計母體平均數μ時機相同。 檢定母體平均數μ步驟: (1) 設定假設值 μ0 。 (1) 設定假設值 μ0 。 (2) 選定顯著水準α,常選0.05。 (3) 是常態分配。 (4) 建立虛無假設 H0 和對立假設 H1。
(5) 得到臨界值(critical values)並訂出接受區和拒絕區。
(6) 計算樣本平均數 。 (7) 代入公式,得到檢定統計量 :
(8) 二種判斷接受或拒絕虛無假設 H0 的方法: (a) Z0 在接受區,接受 H0,但可能犯了β型錯誤; Z0 在拒絕區,拒絕 H0 ,接受 H1,是最佳結果。 (b) 雙尾檢定拒絕 H0 的條件: 或
右尾檢定拒絕 H0 的條件: 左尾檢定拒絕 H0 的條件: (9) 依據接受 H0 或 H1 的條件作成結論。
看個例子 假設研究36隻mouse體重特性分析,母體標準差為4公克且樣本平均為16公克。請問在顯著水準0.05之下,是否與母體平均數15公克不同?
使用SPSS 假設有一組110筆身高樣本,檢定母體平均數是否與170不同(顯著水準=0.01)? H0: μ=170 v.s. H1: μ≠170 Decision Rule: P(t<-2.157) = 0.033 > 0.005. Do not rejectH0.
平均數μ的檢定(t 分配) 檢定母體平均數μ的時機: 檢定母體平均數μ步驟: (1) 如下表。 (2) 雙尾檢定臨界值 U 和 L 與估計母體平均數μ時機相同。 檢定母體平均數μ步驟: (1) 如下表。 (2) 雙尾檢定臨界值 U 和 L
(3) 右尾檢定臨界值 U: (4) 左尾檢定臨界值 L: (5) 計算樣本平均數 和樣本標準誤差 (6) 代入公式,得到判定值 t0 :
(7) 二種判斷接受或拒絕虛無假設 H0 的方法: (a) t0 在接受區,接受 H0,但可能犯了β型的錯誤; t0 在拒絕區,拒絕 H0 ,接受 H1,是最佳結果。 (b) 雙尾檢定拒絕 H0 的條件: 或
右尾檢定拒絕 H0 的條件: 左尾檢定拒絕 H0 的條件: (8) 依據接受 H0 或 H1 的條件作成結論。
看個例子 假設研究25隻mouse體重特性分析,樣本標準差為4公克且樣本平均為14公克。請問在顯著水準0.05之下,是否與母體平均數15公克不同?
比例值 p 的檢定( Z 分配) 檢定母體平均數 p 的時機: 檢定母體平均數 p 步驟: (1-4)參閱前節 Z 步驟與下表。
H0:P=P0 H1:P≠P0 H0:P≥P0 H1:P<P0 Z0 ≤-Z(1-α/2) 或 Z0 ≥ Z(1-α/2) 2. P(Z ≤ Z0) ≤α/2 P(Z ≥ Z0) ≤α/2 H0:P≤P0 H1:P>P0 Z0 ≥ -Z(1-α) 2. P(Z ≥ Z0) ≤α H0:P≥P0 H1:P<P0 Z0 ≤-Z(1-α) 2. P(Z ≤ Z0) ≤α
(5) 計算樣本機率值: (6) 代入公式,得到判定值 Z0: (7) 依據接受 H0 或 H1 的條件作成結論。
看個例子 假設研究一地區某物種毛之顏色特性分析,從調查49樣本發現紅色毛物種比例約為0.3。請問該比例是否與過去發現之比例0.5不同?
看個例子 假設研究一地區某物種毛之顏色特性分析,從調查49樣本發現紅色毛物種比例約為0.3。請問該比例是否與過去發現之比例0.5不同?
無母數檢定法 無母數檢定法:利用中位數和二項分配特性,檢定數量數列變項母體分配情形。 檢定法:符號檢定法和Wilcoxon 符號等級檢定法。
符號檢定法 使用時機: (1) 資料是任何分配形態的隨機樣本。 (2) 連續隨機變數,母體中位數是 M。 (1) 資料是任何分配形態的隨機樣本。 (2) 連續隨機變數,母體中位數是 M。 (3) 其功能與母體平均數 μ 的 Z 檢定或 t 檢定相同。
符號檢定法 分析步驟: (1) 選定顯著水準α,常選 0.05。 (2) 設定假設值 M0。 (3) 雙尾檢定假設:
左尾檢定的假設是: (8.46) (4) 樣本觀測值 x 與 M0 比較,觀測值比M0 大,用“ + ”號取代;觀測值比 M0 小,用“ ”號取代;觀測值與 M0 相等,用“ 0 ”號取代。
(5) 計算步驟 (4) 中 “ + ” 號和 “ ” 號次數,檢定統計量 d 等於 “ + ” 號和 “ ” 號次數中較少的次數,所以沒有右尾。有“ 0 ”號應捨棄,樣本數應減去“ 0 ”號數量。 (6) 判斷接受或拒絕 H0 有下列二種情形: (a) 樣本數 n < 30 時,利用公式:
雙尾檢定決策法則: 左尾檢定的決策法則是:
(b) 樣本數 n > 30 時, Z 分配判定值 Z0 公式是:
雙尾檢定決策法則: 或
或 左尾檢定的決策法則是: (7) 依據接受 H0 或 H1 的條件作成結論。
Wilcoxon 符號等級檢定法 使用時機: (1) 資料是任何分配形態的隨機樣本。 (1) 資料是任何分配形態的隨機樣本。 (2) 連續隨機變數,且對稱於中位數 M 的 對稱分配 (symmetric distribution)。 (3) 使用符號檢定法分析的資料,可以使 用Wilcoxon 等級檢定法。 (4) 其功能與母體平均數μ的 Z 檢定或 t 檢定相同。
分析步驟: (1) 選定顯著水準α,常選0.05。 (2) 設定假設值 M0。 (3) 雙尾檢定假設:
左尾檢定的假設是: (4) 樣本觀測值 x 減 M0 得到差。差是 “ 0 ”值應捨棄,樣本數應減去 “ 0 ” 值數量。將不等於 “ 0 ” 的差值按絕對值大小排序和編號,每個號碼代表一個等級。絕對值相同時,求等級平均數代替原等級值。
(5) 分別計算差值是 “ + ” 號等級和 W+,差值是 “ ” 號等級和 W,檢定統計量 d 是 W+ 和 W 的最小值。 W+ 和 W 的和: (6) 判斷接受或拒絕 H0 有下列二種情形:
(a) 樣本數 5≤ n ≤ 30,查表 得到臨界值 或 ,雙尾檢定決策法則: 左尾檢定的決策法則是:
(b) 樣本數 n > 30 時, Z 分配判定值 Z0:
雙尾檢定決策法則: 或
或 左尾檢定的決策法則是: (7) 依據接受 H0 或 H1 的條件作成結論。
來個例子 下表為50名同學之學期成績,假設往年成績中位數為74分,請問同學成績是否比往年差? 將差之絕對值排序並列出等級, , 將差之絕對值排序並列出等級, 絕對值相同時,用平均等級代替
回顧 : 單一樣本檢定法 平均數μ檢定: 母體比例p檢定 無母數檢定法 Z分配: n≥30,抽樣分配具常態 T分配: n<30,抽樣分配具常態 母體比例p檢定 二項分配: n<30,抽樣分配具常態 無母數檢定法 符號檢定: 隨機且連續變數 Wilcoxon符號等級檢定:隨機、連續變數且對稱中位數
回顧 : 單一樣本檢定法 重要名詞: Pvalue(P值) 顯著水準(α) 型I誤差(α) 、型II誤差(β) 信賴區間、信賴水準 檢設檢定
總 結 常態分配的連續資料,推論母體平均數 μ。 母體是二項分配,抽樣分配是常態分配的資料,推論變數在母體中機率 P。 總 結 常態分配的連續資料,推論母體平均數 μ。 母體是二項分配,抽樣分配是常態分配的資料,推論變數在母體中機率 P。 樣本數估計,分別依據 Z 分配和 t 分配設定誤差容許度 e 估算,檢定力 (1 – β) 不能低於 0.8。 任何分配的連續變項,皆可以使用符號檢定法和 Wilcoxon 符號等級檢定法。