第 7 章 抽樣與抽樣分配 Part B (7.6-7.8)
7.6 的抽樣分配 樣本比例 統計推論的過程 母體比例 從母體抽取 n 個元素 p = ? 為一簡單隨機樣本 用樣本資料計算 用 值 7.6 的抽樣分配 樣本比例 統計推論的過程 母體比例 p = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 P 值 用樣本資料計算 樣本比例 第7章 抽樣與抽樣分配 Part B (7.6-7.8)
的抽樣分配 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中 p = 母體比例 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中 p = 母體比例 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第278頁
的抽樣分配 的標準差 有限母體 無限母體 是母體的標準誤 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁
的抽樣分配 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 回到 EAI 的例子,以 30 位主管的簡單隨機樣本,求其樣本比例的標準誤。在 EAI 一例中,參加管理課程的主管的比例為 p=0.60,由於 n/N = 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母體校正因子,若樣本數為 30 位主管,則 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁
抽樣分配的形狀 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下兩個條件: 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下兩個條件: np ≥ 5 且 n(1 – p) ≥ 5 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁
的抽樣分配的形狀 當 np ≥ 5及 n(1-p) ≥ 5, 的抽樣分配可以利用常態分配來近似。 在 EAI 一例中,有參加管理訓練課程的主管的母體比例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此, 抽樣分配可以趨近常態分配,如圖 7.8 所示。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.8
抽樣分配的實務價值 假設人事經理想要知道樣本比例 值落在母體比例±0.05 範圍內的機率;也就是樣本比例 值落在 0.55 到 0.65 間的機率。 圖 7.9的陰影部分就是此機率。我們已知 抽樣分配可以用常態分配來近似,平均數為 0.60,標準誤 =0.0894,則 =0.65 所對應的標準常態 z 值=(0.65-0.60)/0.0894=0.56,查標準常態分配表可知,對應於 z=0.56 的累積機率為 0.7123;同樣地,在 =0.55 時, z 值=(0.55 –0.60)/0.0894=-0.56。標準常態分配表可知,對應於 z= -0.56 的累積機率為 0.2877,因此,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.7123 – 0.2877=0.4246。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.9
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280-281頁 抽樣分配的實務價值 如果我們增加樣本數到 n=100,則比例的標準誤變為 樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比例 值落在母體比例 p 值±0.05 的機率值。因抽樣分配近似常態,且平均數為 0.60,標準差為0.049,利用標準常態分配表就可以計算所要的面積或機率。 當 =0.65 時,z=(0.65 – 0.60)/0.049=1.02,查標準常態分配表得知介於 z=1.02 的累積機率為 0.8461;同樣地,當 =0.55 時, z=(0.55 – 0.60)/0.049=-1.02。 介於 z=-1.02 間的面積為 0.1539,因此,若樣本大小由 30 增加為 100 時,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.8461 – 0.1539=0.6922。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280-281頁
7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 θ 是希臘字母,發音是theta, 則唸做 theta-hat。 一般而言,θ 代表任何母體參數,例如母體平均數、母體標準差及母體比例等; 則代表對應的樣本統計量,例如樣本平均數、樣本標準差及樣本比例。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-285頁 7.7 點估計量的性質 良好點估計量的性質有: 不偏性 有效性 一致性 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-285頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-284頁 不偏性 如果樣本統計量的期望值等於要估計的母體參數之期望值,則此樣本統計量就是母體參數的不偏估計量 (unbiased estimator)。 不偏性 樣本統計量 是母體參數 θ 的不偏估計量,如果 其中 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-284頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第284頁 圖7.10
有效性 假定有 n 個元素的簡單隨機樣本可以提供同一個母體參數兩個不偏估計量。此種情況下,我們會使用標準差較小的點估計量,因為它可以提供更接近母體參數的估計值。標準差較小的點估計量相對於其他點估計量,有更高的相對有效性 (relative efficiency)。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第284頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁 圖7.11
一致性 優良點估計量的另一個特性是一致性(consistency)。簡單來說,當樣本變大,點估計量的數值變得更接近母體參數時,就稱點估計量是一致的。換言之,大樣本比小樣本能提供更好的點估計值。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁
評註 我們在第 3 章說過,平均數與中位數都是集中趨勢的量數。本章只討論平均數的理由是,常態母體的母體平均數及母體中位數是相同的。而自常態母體抽樣,中位數的標準誤比平均數的標準誤大了 25%。以 EAI 問題為例,n=30,樣本平均數的標準誤是 = 730.3,中位數的標準誤則大概是 1.25(730.3) =913。因此,樣本平均數是更有效的,且有更大的機率更接近母體平均數。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁
分層隨機抽樣 在分層隨機抽樣(stratified random sampling)中,母體的所有元素先被區隔成數群,稱為層(strata)。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖 7.12 是一個母體被分成 H 個層的示意圖。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁 圖7.12
分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽樣,利用公式可將各分層的樣本資訊整合成我們感興趣的母體參數估計值。 分層抽樣品質的好壞端視資料層內元素的同質性程度,如果同質性高 (元素都很相近),則層內的變異將減少,只要少量的抽樣資料就可以得到整個資料層的良好估計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣本數較少的簡單隨機抽樣相同。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
叢式抽樣 在叢式抽樣 ( cluster sampling) 中,母體首先被分出幾群,稱為叢體(clusters) 。 在理想的情況下,每一個叢體都可代表一整個母體,就像是母體的縮小版。 叢式抽樣的好壞評斷標準在於所用的叢體對母體是否有代表性。 如果每個叢體都能代表母體,則只抽出少數的叢體做樣本就可得到母體參數的良好估計值。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁 圖7.13
第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286-287頁 叢式抽樣 叢式抽樣主要的應用之一是地區抽樣,每一叢體可以是城市的某個區域或其他定義清楚的地區。 優點:可以達到增加樣本數,減少成本優點(如:可在短時間內蒐集許多樣本觀察值)。 缺點:此抽樣方法通常抽取的樣本數會比簡單隨機抽樣和分層隨機抽樣來得多。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286-287頁
系統抽樣 例如,在 5000 個元素的母體中我們要抽出 50 個當作樣本,可以從每 5000/50=100 個元素中抽出一個元素。 假設我們已將母體元素依序排列。這個程序是先從前 100 個元素隨機抽出一個元素,由這個被抽中的元素開始,每隔 100 個元素,就抽出 1 個,直到抽出 50 個元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當母體元素呈隨機排序時,由於第一個被抽出的元素是隨機決定的,系統抽樣通常也被假設為具有簡單隨機抽樣的特性。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁
系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個元素,就抽出1 個。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁
便利抽樣 便利抽樣 (convenience sampling) 是屬於非機率抽樣 (nonprobability sampling)方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣本中的元素被抽中的機率。 例如,教授可能以自願參與實驗的學生為樣本,因為學生是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能以樣本的代表性來評估樣本的「適合度」(goodness) 。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁
判斷抽樣 使用判斷抽樣(judgment sampling)的研究者必須非常瞭解研究對象,選出他認為最能代表母體的樣本。 不能作為適合度分析。 例如一名記者可能會選出他認為最能反映全體參議員看法的兩位或三位參議員來採訪。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁
判斷抽樣 優點:樣本抽選相當簡便。 缺點:選出的樣本品質端視研究者的判斷而定 。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁
評註 我們在本章推薦使用的機率抽樣方法共有:簡單隨機抽樣、分層隨機抽樣、叢式抽樣或系統抽樣,欲知這些方法所抽出的樣本統計量是否接近母體參數,我們可以用某些公式來評估其「適合度」。便利抽樣和判斷抽樣並不能做適合度分析,因此,在解釋非機率抽樣方法得到的結果時,必須非常小心。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第288頁
End of Chapter 7, Part B