抽樣分配 許明宗
基本概念 母體參數 隨機樣本 統計量 描述母體資料特性的統計量數(一般簡稱為參數或母數)。 設X1,X2,…,Xn為由同一母體(其機率函數為f(x))中抽出的n個隨機變數,若滿足下列的條件,則稱(X1,X2,…,Xn )為一組隨機樣本: X1,X2,…,Xn皆為獨立 X1,X2,…,Xn的機率函數皆為f(x) 統計量 樣本的表徵數,是樣本內隨機變數的函數,不包含未知數,本身亦為隨機變數。
母體分佈 抽樣分佈 功用 母體資料的機率分佈 統計量的機率分佈稱為抽樣分佈 可測量統計推論中不確定性程度之大小 可利用抽樣分佈之機率原理來說明統計推論結果之可靠性
常用的隨機變數函數 若有任二獨立之隨機變數 X及Y,其 累積機率函數 期望值 變異數 F(x) = P(X≦x) = Σxi≦xf(xi) ------間斷型隨機變數 = ∫xi≦xf(x)dx ------連續型隨機變數 期望值 E(X) = Σxif(xi) ------間斷型隨機變數 = ∫xf(x)dx ------連續型隨機變數 變異數 Var(X) = σ2 = E[(X - μ)2] = E(X2)-[E(X)]2
期望值的特性(a、b為任意實數) 變異數的特性(a、b為任意實數) E(aX) = aE(X) E(X+b) = E(X) + b E(X +Y) = E(X) + E(Y) 變異數的特性(a、b為任意實數) Var(aX) = a2Var(X) Var(X+b) = Var(X) Var(X + Y) = Var(X) + Var(Y)
常態母體的統計量及其平均數的抽樣分佈 令(X1,X2,…,Xn )為一組由常態母體所抽出之隨機樣本 其樣本平均數及樣本變異數分別為:
其抽樣分佈為
抽樣分佈的特性 平均數的分佈還是以母體平均數μ為中心,不論樣本數多寡 樣本數增加會使得樣本平均數的變異數變小,即樣本越大樣本平均數越集中於母體平均數μ附近 隨著樣本數的增加,平均數的分佈會越來越趨近常態分佈(請參考中央極限定理)
中央極限定理(CLT) 如果X1,X2,…,Xn為一組抽自任意分佈的隨機樣本,此分佈具有有限值的平均數μ及變異數σ2,那麼下面定義的Zn的極限分配服從標準常態分佈。 表示為:
樣本平均數的抽樣分佈 設(X1,…,Xn)為抽任母體的隨機樣本,母體的平均數為μ,變異數為σ2,則當樣本很大時
獨立母體間平均數差異的抽樣分佈 設(X1,…,Xn1)及(Y1,…Yn2)分別為抽自獨立之任二母體的隨機樣本,兩母體的平均數分別為μ1及μ2,變異數為σ12σ22,則當樣本很大時
樣本比例之抽樣分佈 設(X1,…,Xn)為抽自柏努利分佈母體的一組隨機樣本,則:
幾種常用來進行統計推論而且和常態分佈有關的分佈 t分佈 卡方分佈 F分佈
常態分佈 若隨機變數 X 滿足下列的公式,則我們稱此隨機變數 X 服從常態分佈,記為X~N(μ,σ2)
標準常態分佈 為了查表和計算上的方便我們經常會將常態分佈標準化,即
GAMA函數
卡方分佈 若隨機變數 Y 滿足下列的公式,則我們稱此隨機變數 Y 服從自由度為ν之卡方分佈,記為Y~χ2(ν)
卡方分佈的性質 若兩獨立隨機變數 X~ χ2(ν1)及 Y~ χ2(ν2),則: E(X) = ν1 Var(X) = 2ν1 r.v. W = X + Y,則 W ~ χ2 (ν1+ ν2 ) Z~N(0,1),則 Z2 ~ χ2(1) 設(X1,…,Xn)為抽自常態母體 N(μ,σ2) 的一組隨機樣本,則: (n-1)S2 / σ2 ~χ2(n-1) P( X > χα2(ν1) ) = α
卡方分佈的用途 單一母體變異數之估計及檢定 無母數統計中的適合度、獨立、齊一性等檢定
t分佈 若隨機變數 T 滿足下列的公式,則我們稱此隨機變數 T 服從t分佈,記為 T ~ t(ν)
t分佈的性質 若隨機變數T ~ t(ν),則 E(T) = 0 Var(T) = ν / (ν-2) 當ν ∞ , TN(0,1) T2~F(1, ν) P(T > tα(ν)) = α且 t1-α(ν) = - tα(ν) 若 Z ~ N(0,1) ╨ W ~ χ2(ν1) 則
設(X1,…,Xn)為抽自常態母體 N(μ,σ2) 的一組隨機樣本,則
t分佈的主要用途 當樣本是來自常態母體且 n ≤ 30 及 σ未知時,t分佈可用來 單一母體平均數之推論 二母體平均數差異之推論
F分佈 若隨機變數 X 滿足下列的公式,則我們稱此隨機變數 X 服從F分佈,記為 X ~ F(ν1, ν2)
F分佈的性質 若隨機變數 X ~ F(ν1, ν2) E(X) = ν2 / (ν2 -2) , ν2 > 2 Var(X) = [2 ν22(ν1 + ν2 -2)] / [ν1(ν2 -2)2(ν2 -4)] , ν2 > 4 P( F > Fα(ν1, ν2) ) = α F1-α(ν1, ν2) = 1 / Fα(ν2, ν1) 若 X~ χ2(ν1) ╨ Y~ χ2(ν2),則
χα2(ν1) = ν1Fα(ν1, ∞) 設(X1,…,Xn1)與(Y1,…,Yn2)分別為由常態母體N(μ1,σ12)與N(μ2,σ22)所抽出的兩組獨立的隨機樣本,則
F分佈的主要用途 檢定兩獨立母體間的變異數是否相等 變異數分析中之檢定 可以利用F分佈表查出t分佈、卡方分佈、及常態分佈的查表值