第 7 章 抽樣與抽樣分配 Part B (7.6-7.8)
抽樣與抽樣分配 Part B 7.6 的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法 7.6 的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第253頁
7.6 的抽樣分配 母體比例 統計推論的過程 母體比例 從母體抽取 n 個元素 p = ? 為一簡單隨機樣本 用 值 用樣本資料計算 7.6 的抽樣分配 母體比例 統計推論的過程 母體比例 p = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 μ 值 用樣本資料計算 母體比例 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第272頁
的抽樣分配 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中: p 是母體比例 E( ) 是 的期望值 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中: p 是母體比例 E( ) 是 的期望值 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第272頁
的抽樣分配 的標準差 有限母體 無限母體 是母體的標準誤 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第273頁
的抽樣分配 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 回到 EAI 的例子,以 30 位主管的簡單隨機樣本,求其樣本比例的標準誤。在 EAI 一例中,參加管理課程的主管的比例為 p=0.60,由於 n/N = 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母體校正因子,若樣本數為 30 位主管,則 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第273頁
抽樣分配的形狀 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件 np ≥ 5 以及 n(1 – p) ≥ 5 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第273頁
的抽樣分配的形狀 當 np ≥ 5以及 n(1-p) ≥ 5, 的抽樣分配可以利用常態分配來近似。 在 EAI 一例中,有參加管理訓練課程的主管的母體比例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此, 抽樣分配可以趨近常態分配,如圖 7.8 所示。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁 圖7.8 的抽樣分配的形狀 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁 圖7.8
抽樣分配的實務價值 假設人事經理想要知道樣本比例 值落在母體比例±0.05 範圍內的機率;也就是樣本比例 值落在 0.55 到 0.65 間的機率。 圖 7.9的陰影部分就是此機率。我們已知 p 抽樣分配可以用常態分配來近似,平均數為0.60,標準誤 =0.0894,則 =0.55 所對應的標準常態 z 值=(0.55-0.60)/0.894=-0.56,查標準常態分配表可知介於 z=-0.56 到 z=0 間的面積為 0.2123;同樣的在 =0.65 時,z=0 到 z=0.56 間的面積為 0.2123,因此,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.2123+0.2123=0.4246。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275頁 圖7.9 抽樣分配的實際值 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275頁 圖7.9
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274-275頁 抽樣分配的實際值 如果我們增加樣本數到 n=100,則比例的標準誤變為 樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比例 值落在母體比例 p 值±0.05 的機率值。因抽樣分配近似常態,且平均數為 0.60,標準差為0.049,利用標準常態分配表就可以計算所要的面積或機率。 當 =0.55 時,z=(0.55-0.60)/0.049=-1.02,查標準常態分配表得知介於 z=-1.02 到 z=0 間的面積為 0.3461;同樣的,當 =0.65 時,介於 z=0 到 z=1.02 間的面積也為 0.3461,因此,當樣本大小由 30 增到 100 時,樣本比例 值落在母體比例 p 值 ±0.05 的機率從 0.4246 變為 0.3461+0.3461=0.6922。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274-275頁
7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 θ 是希臘字母,發音是theta, 則唸做theta-hat。 一般而言,θ 代表任何母體參數,例如母體平均數、母體標準差及母體比例等等; 則代表對應的樣本統計量,例如樣本平均數、樣本標準差及樣本比例。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第277頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第277-278頁 點估計量的性質 良好點估計量的性質有: 不偏性 有效性 一致性 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第277-278頁
點估計量的性質 不偏性 如果樣本統計量的期望值等於要估計的母體參數之期望值,則此樣本統計量就是母體參數的不偏估計量 (unbiased estimator)。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第277頁
點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第277頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278頁 圖7.10 點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278頁 圖7.10
點估計量的性質 有效性 假定有 n 個元素的簡單隨機樣本可以提供同一個母體參數兩個不偏估計量。此種情況下,我們會使用標準差較小的點估計量,因為它可以提供更接近母體參數的估計值。標準差較小的點估計量相對於其他點估計量,有更高的相對有效性 (relative efficiency)。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁 圖7.11 點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁 圖7.11
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278-279頁 點估計量的性質 一致性 優良點估計量的另一個特性是一致性(consistency)。簡單來說,當樣本變大,點估計量的數值變得更接近母體參數時,就稱點估計量是一致的。換言之,大樣本比小樣本能提供更好的點估計值。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278-279頁
評註 我們在第 3 章說過,平均數與中位數都是集中趨勢的量數。本章只討論平均數的理由是,常態母體的母體平均數及母體中位數是相同的。而自常態母體抽樣,中位數的標準誤比平均數的標準誤大了 25%。以 EAI 問題為例,n=30,樣本平均數的標準誤是 = 730.3,中位數的標準誤則大概是 1.25(730.3) =913。因此,樣本平均數是更有效的,且有更大的機率更接近母體平均數。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279-281頁 7.8 其他抽樣方法 分層隨機抽樣 叢式抽樣 系統抽樣 便利抽樣 判斷抽樣 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279-281頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279-280頁 分層隨機抽樣 在分層隨機抽樣(stratified random sampling)中,母 體的所有元素先被區隔成數群,稱為層(strata)。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖 7.12 是一個母體被分成 H 個層的示意圖。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279-280頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.12 分層隨機抽樣 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.12
分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽樣, 利用公式可將各分層的樣本資訊整合成我們感興趣的 母體參數估計值。 分層抽樣品質的好壞端視資料層內元素的同質性程度, 如果同質性高 (元素都很相近),則層內的變異將減少, 只要少量的抽樣資料就可以得到整個資料層的良好估 計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣本數 較少的簡單隨機抽樣相同。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
叢式抽樣 在叢式抽樣 ( cluster sampling) 中,母體首先被分出幾群 ,稱為叢體(clusters) 。 在理想的情況下,每一個叢體都可代表一整個母體, 就像是母體的縮小版。 叢式抽樣的好壞評斷標準在於所用的叢體對母體是否有 代表性。 如果每個叢體都能代表母體,則只抽出少數的叢體做 樣本就可得到母體參數的良好估計值。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.13 叢式抽樣 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.13
叢式抽樣 叢式抽樣主要的應用之一是地區抽樣,每一叢體可以是 城市的某個區域或其他定義清楚的地區。 優點:可以達到增加樣本數,減少成本優點(如:可在 短時間內蒐集許多樣本觀察值) 缺點:此抽樣方法通常抽取的樣本數會比簡單隨機抽 樣和分層隨機抽樣來得多 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁
系統抽樣 例如,在 5,000 個元素的母體中我們要抽出 50 個當作 樣本,可以從每 5000/50=100 個元素中抽出一個元素。 假設我們已將母體元素依序排列。這個程序是先從前 100 個元素隨機抽出一個元素,由這個被抽中的元素 開始,每隔 100 個元素,就抽出 1 個,直到抽出 50 個 元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當母體 元素呈隨機排序時,由於第一個被抽出的元素是隨機 決定的,系統抽樣通常也被假設為具有簡單隨機抽樣的 特性。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁
系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個 元素,就抽出1 個。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁
便利抽樣 便利抽樣 (convenience sampling) 是屬於非機率抽樣 (nonprobability sampling)方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣本 中的元素被抽中的機率。 例如教授可能以志願參與實驗的學生為樣本,因為學生 是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能以 樣本的代表性來評估樣本的「適合度」(goodness) 。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁
判斷抽樣 使用判斷抽樣(judgment sampling)這個方法的研究者 必須非常瞭解研究對象,選出他認為最能代表母體的 樣本。 不能作為是適合度分析。 例如一名記者可能會選出他認為最能反應全體參議員 看法的 2 位或 3 位參議員來採訪。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁
判斷抽樣 優點:樣本抽選相當簡單 缺點:選出的樣本品質端視研究者的判斷而定 。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281-282頁 評註 我們在本章推薦使用的機率抽樣方法共有:簡單隨機抽樣、分層隨機抽樣、叢式抽樣或系統抽樣,欲知這些方法所抽出的樣本統計量是否接近母體參數,我們可以用某些公式來評估其「適合度」。便利抽樣和判斷抽樣並不能做適合度分析,因此,在解釋非機率抽樣方法得到的結果時,必須非常小心。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281-282頁
End of Chapter 7, Part B