第 7 章 推論方法
推論統計學(inferential statistics):由相對少數隨機樣本得到統計量,配合適當抽樣分布,推論母體母數或變數分布的過程。 常用方式:母數統計法和無母數統計法。 推論方法:估計(estimation)和假設檢定(test of hypotheses)。
7.1 推論方式 母數統計法或參數統計法(parametric methods):由樣本統計量推論對應母數的過程,只能用於常態分布的變項。 7.1 推論方式 母數統計法或參數統計法(parametric methods):由樣本統計量推論對應母數的過程,只能用於常態分布的變項。 無母數統計法或無參數統計法(nonparametric methods):由樣本變項中變數分布情形推論母體變項中變數分布情形的過程,使用於任何分布形態的變項。
7.1.1 母數統計法 連續變項推論下列三種結果: 1. 一組樣本母體平均數 μ。 7.1.1 母數統計法 連續變項推論下列三種結果: 1. 一組樣本母體平均數 μ。 2. 二組樣本母體平均數差( 1 2 ),但必須先推論二母體變異數是否相等或變異數比 是否等於 1? 3. 二組以上樣本,各組母體平均數是否有差異?但必須先推論各組母體變異數是否相等?稱為變異數分析法。
7.1.1 母數統計法 大樣本間斷變項推論下列二種結果: 1. 一組樣本變項中變數出現母體機率 P。 7.1.1 母數統計法 大樣本間斷變項推論下列二種結果: 1. 一組樣本變項中變數出現母體機率 P。 2. 二組樣本相同變項中相同變數出現母體機率差 ( P1P2 )。
7.1.1.1 母數統計法的選用原則 選用原則: (1) 隨機樣本。 (2) 常態分布或近似常態分布。 (3) 數量數列(包含量化數列)。 7.1.1.1 母數統計法的選用原則 選用原則: (1) 隨機樣本。 (2) 常態分布或近似常態分布。 (3) 數量數列(包含量化數列)。 (4) 由統計量推論母體母數。
7.1.1.1 母數統計法的選用原則 (5) 符合各種假設條件。 7.1.1.1 母數統計法的選用原則 (5) 符合各種假設條件。 (6) 平均數μ或二平均數差 ( 1 2 ) 用 Z分布或 t 分布推論。 (7) 二組以上母體平均數差異或二變異數比 用 F 分布推論。 (8) 大樣本二項分布,變數母體機率 P 或機率差 ( P1P2)用 Z 分布推論。
7.1.2 無母數統計法 連續變項推論下列三種結果: 1. 一組樣本母體中位數M。 2. 二組樣本母體中位數差 ( M1M2)。 7.1.2 無母數統計法 連續變項推論下列三種結果: 1. 一組樣本母體中位數M。 2. 二組樣本母體中位數差 ( M1M2)。 3. 二組以上樣本,各組母體中位數是否有差異? 間斷變項推論下列二種結果: 1. 一組樣本變項中變數分布情形。 2. 二組以上樣本相同變項中變數分布情形的差異性或相關性。
7.1.2.1 無母數統計法的選用原則 選用原則: (1) 任何分布,又稱母體自由分布統計法(distribution-free methods)。 (2) 類別或分組資料,排出等級(ranks)順序資料,又稱順序統計法(order statistics)。 (3) 資料整理和計算過程比較簡單,假設條件比較少。
7.1.2.1 無母數統計法的選用原則 (4) 數量數列資料容易產生誤差。 7.1.2.1 無母數統計法的選用原則 (4) 數量數列資料容易產生誤差。 (5) 檢定效度(efficiency)和靈敏度比母數統計法低,可用增加樣本數改善。 (6) 利用中位數、二項分布或 分布當作推論依據。 (7) 常用假設檢定法來推論。
7.2 推論方法 7.2.1 估 計 估計(estimation):得到母數概略估算值的過程。 7.2 推論方法 估計(estimation):得到母數概略估算值的過程。 假設檢定(test of hypotheses):驗證依據學理或經驗所做假設是否正確的過程。 7.2.1 估 計 估計方法:點估計(point estimation)和區間估計(interval estimation)。
7.2.1.1 點估計 點估計(point estimation):抽樣分布是常態分布,樣本統計量直接視為對應母數概略值。 7.2.1.2 區間估計 區間估計(interval estimation):在設定信賴水準條件下,用點估計值當基準,推測出母數概略值範圍的推論方法。
7.2.1.2 區間估計 信賴係數(confidence coefficient)或信賴水準(confidence level):區間估計的機率函數值 (1 – α)。 顯著水準(level of significance):區間估計外的機率函數值α。
7.2.1.2 區間估計 區間估計步驟: (1) 選出信賴水準 (1 – α),常用0.95。 7.2.1.2 區間估計 區間估計步驟: (1) 選出信賴水準 (1 – α),常用0.95。 (2) 計算信賴水準 (1 – α)區間範圍。 (3) 計算點估計值。 (4) 推測出信賴區間值。
7.2.2 假設檢定 7.2.2.1 檢定的種類 假設檢定(test of hypotheses):驗證假設是否成立的過程。 7.2.2 假設檢定 假設檢定(test of hypotheses):驗證假設是否成立的過程。 7.2.2.1 檢定的種類 假設三種狀況:高於、等於或低於假設值。 二種互相排斥的假設: (1) 虛無假設(null hypothesis)。 (2) 對立假設(alternative hypothesis)。
7.2.2.1 檢定的種類 以母體平均數高於、等於或低於 80 分為例: 7.2.2.1 檢定的種類 以母體平均數高於、等於或低於 80 分為例: (1) 母體平均數高於 80 分互斥假設:右端或右尾檢定 (right-tailed test)。 (7.1) (2) 母體平均數等於80分互斥假設:二端或雙尾檢定(two-tailed test)。
7.2.2.1 檢定的種類 (3) 母體平均數低於80分互斥假設:左端或左尾檢定(left-tailed test)。 7.2.2.1 檢定的種類 (7.2) (3) 母體平均數低於80分互斥假設:左端或左尾檢定(left-tailed test)。 (7.3) 右尾或左尾檢定又稱為單尾檢定(one-tailed test)。
7.2.2.2 第 I 和第 II 型錯誤 真實與假設母數可能發生下列二種誤判情形: (1) H0 假設是對的, H1 假設是錯的:第 I型錯誤 (type I error) 或 α 型錯誤。 接受 H0 是正確判斷。 拒絕 H0 是錯誤判斷。
7.2.2.2 第 I 和第 II 型錯誤 (1) H0 假設是錯的, H1 假設是對的:第 II 型錯誤 (type II error)或 β 型錯誤。 接受 H0 是錯誤判斷。 拒絕 H0 是正確判斷。 檢定檢力 (power of test):接受對立假設 H1 機率 (1 -β)。
7.2.2.2 第 I 和第 II 型錯誤
7.2.2.2 第 I 和第 II 型錯誤 表7.1的解釋: (1) 接受 H0,對的機率是 (1 –α),但其中可能包含機率β: (7.4) (1 –α) 的值是不確定的。 (2) 拒絕 H0 , H0 錯的機率是 (1 –β),但其中可能包含機率 α,α 是可控制已知值。
7.2.2.2 第 I 和第 II 型錯誤 (3) 機率β以低於0.2為佳。同時降低α和β型錯誤是增加樣本數。 (3) 機率β以低於0.2為佳。同時降低α和β型錯誤是增加樣本數。 (4) 拒絕虛無假設 H0 ,是最想得到的結果。拒絕虛無假設 H0 的條件稱為決策法則(decision rule)。
7.2.2.3 檢定的步驟 假設檢定步驟: (1) 設立假設值。 (2) 設定機率值α,常用0.05。 (3) 判斷抽樣分布。 7.2.2.3 檢定的步驟 假設檢定步驟: (1) 設立假設值。 (2) 設定機率值α,常用0.05。 (3) 判斷抽樣分布。 (4) 選擇右尾、雙尾或左尾檢定原則如下: (a) 結果是變大或增加,用右尾檢定(right-tailed test)。 (b) 結果是發生變化或不相等,用雙尾檢定(two-tailed test)。:
7.2.2.3 檢定的步驟 (c) 結果是變小或減少,用左尾檢定(left-tailed test)。 7.2.2.3 檢定的步驟 (c) 結果是變小或減少,用左尾檢定(left-tailed test)。 (d) 變異數分析法和無母數統計法常用右尾檢定(right-tailed test)。 (5) 建立互斥假設。 (6) 計算統計量。 (7) 依據抽樣分布、機率值α和統計量機率值推論 H0 和 H1 何者成立。 (8) 分析結果得到結論。
7.3 區間估計與假設檢定的關係 信賴上界U (upper confidence limit)或上限:信賴區間的最大值。 7.3 區間估計與假設檢定的關係 信賴上界U (upper confidence limit)或上限:信賴區間的最大值。 信賴下界 L (lower confidence limit)或下限:信賴區間的最小值。 臨界值(critical values):信賴上界 U 或信賴下界 L。 接受區:信賴水準區。參閱圖7.1和圖7.2 。 拒絕區:顯著水準區。參閱圖7.1和圖7.2 。
圖7.1對稱分布估計與假設檢定的關係
圖7.2 變異數估計與假設檢定的關係
7.4 例 題
7.4 例 題
( 沒有右尾檢定法 )。
雙
7.5 結 語 估計:二端估計,估計母體平均數μ、二平均數差( 1 2)、機率 P 或二機率差(P1 P2)的區間值。 7.5 結 語 估計:二端估計,估計母體平均數μ、二平均數差( 1 2)、機率 P 或二機率差(P1 P2)的區間值。 假設檢定:雙尾、右尾和左尾三種檢定方法,常用α型錯誤做檢定。 母數統計法或參數統計法(parametric methods):常態分布,利用樣本統計量的抽樣分布,推論母體對應母數的過程。
7.5 結 語 無母數統計法或無參數統計法(nonparametric methods):任何分布,用間斷抽樣分布或中位數特性推論母體分布特性的過程。