Download presentation
Presentation is loading. Please wait.
1
第 7 章 抽樣與抽樣分配 Part B ( )
2
抽樣與抽樣分配 Part B 7.6 的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法
的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法 第7章抽樣與抽樣分配 Part B ( ) 第253頁
3
7.6 的抽樣分配 母體比例 統計推論的過程 母體比例 從母體抽取 n 個元素 p = ? 為一簡單隨機樣本 用 值 用樣本資料計算
的抽樣分配 母體比例 統計推論的過程 母體比例 p = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 μ 值 用樣本資料計算 母體比例 第7章抽樣與抽樣分配 Part B ( ) 第273頁
4
的抽樣分配 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中: p =母體比例
的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中: p =母體比例 第7章抽樣與抽樣分配 Part B ( ) 第274頁
5
的抽樣分配 在 7.1 節中,我們提到 EAI 母體的比例 p=0.60,此 p 值為完成管理訓練課程的主管的比例,因此 EAI 抽樣問題中, 的期望值為0.60。 第7章抽樣與抽樣分配 Part B ( ) 第274頁
7
的抽樣分配 的期望值 有限母體 無限母體 是母體的標準誤 第7章抽樣與抽樣分配 Part B ( ) 第274頁
8
的抽樣分配 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。
一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 回到 EAI 的例子,以 30 位主管的簡單隨機樣本,求其樣本比例的標準誤。在 EAI 一例中,參加管理課程的主管的比例為 p=0.60,由於 n/N = 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母體校正因子,若樣本數為 30 位主管,則 第7章抽樣與抽樣分配 Part B ( ) 第275頁
9
抽樣分配的形狀 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件
當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件 np ≥ 5 以及 n(1 – p) ≥ 5 第7章抽樣與抽樣分配 Part B ( ) 第275頁
10
的抽樣分配的形狀 當 np ≥ 5以及 n(1-p) ≥ 5, 的抽樣分配可以利用常態分配來近似。
在 EAI 一例中,有參加管理訓練課程的主管的母體比例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此, 抽樣分配可以趨近常態分配,如圖 7.8 所示。 第7章抽樣與抽樣分配 Part B ( ) 第275頁
11
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第276頁 圖7.8
的抽樣分配的形狀 第7章抽樣與抽樣分配 Part B ( ) 第276頁 圖7.8
12
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275-276頁
抽樣分配的實際值 假設某公司人事經理想要知道樣本比例 值落在母體比例±0.05 範圍內的機率為何?也就是樣本比例 值落在 0.55 到 0.65 間的機率。(母體比例P=0.6,每組樣本30個) 第7章抽樣與抽樣分配 Part B ( ) 第 頁
13
圖 7. 9的陰影部分就是此機率。我們已知 p 抽樣分配可以用常態分配來近似,平均數為0. 60,標準誤 =0. 0894,則 =0
圖 7.9的陰影部分就是此機率。我們已知 p 抽樣分配可以用常態分配來近似,平均數為0.60,標準誤 =0.0894,則 =0.55 所對應的標準常態 z 值=(0.55-0.60)/0.894=-0.56,查標準常態分配表可知介於 z=-0.56 到 z=0 間的面積為 ;同樣的在 =0.65 時,z=0 到 z=0.56 間的面積為 ,因此,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 +0.2123=0.4246。
14
抽樣分配的實際值 如果我們增加樣本數到 n=100,則比例的標準誤變為 樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比例 值落在母體比例 p 值±0.05 的機率值。因抽樣分配近似常態,且平均數為 0.60,標準差為0.049,利用標準常態分配表就可以計算所要的面積或機率。 當 =0.55 時,z=(0.55-0.60)/0.049=-1.02,查標準常態分配表得知介於 z=-1.02 到 z=0 間的面積為 ;同樣的,當 =0.65 時,介於 z=0 到 z=1.02 間的面積也為 ,因此,當樣本大小由 30 增到 100 時,樣本比例 值落在母體比例 p 值 ±0.05 的機率從 變為 +0.3461=0.6922。 第7章抽樣與抽樣分配 Part B ( ) 第276頁
15
小結 影響抽樣分配的因素: 母體分配、樣本統計量、樣本大小 母體分配、樣本分配與抽樣分配 母體分配 樣本分配 抽樣分配
16
練習 35
17
35 公司的總裁相信30% 的訂單來自新顧客,現以簡單隨機樣本抽出100份訂單以估計新客戶的比例。
a. 假設該總裁的認知是對的,也就是p=0.30,那麼 的p-bar的抽樣分配為何? b. 樣本比例(p-bar) 介於0.20到0.40間的機率為何? c. 樣本比例p-bar介於0.25到0.35間的機率為何?
18
7.7 點估計量的性質 注意: θ = 母體參數 θ 是希臘字母,發音是theta, 則唸做theta-hat。
7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 θ 是希臘字母,發音是theta, 則唸做theta-hat。 一般而言,θ 代表任何母體參數,例如母體平均數、母體標準差及母體比例等等; 則代表對應的樣本統計量,例如樣本平均數、樣本標準差及樣本比例。 第7章抽樣與抽樣分配 Part B ( ) 第278頁
19
點估計量的性質 良好點估計量的性質有: 不偏性 有效性 一致性 第7章抽樣與抽樣分配 Part B ( ) 第278頁
20
點估計量的性質 不偏性 如果樣本統計量的期望值等於要估計的母體參數之期望值,則此樣本統計量就是母體參數的不偏估計量 (unbiased estimator)。 第7章抽樣與抽樣分配 Part B ( ) 第279頁
21
點估計量的性質 第7章抽樣與抽樣分配 Part B ( ) 第279頁
22
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁 圖7.10
點估計量的性質 第7章抽樣與抽樣分配 Part B ( ) 第279頁 圖7.10
23
點估計量的性質 有效性 假定有 n 個元素的簡單隨機樣本可以提供同一個母體參數兩個不偏估計量。此種情況下,我們會使用標準差較小的點估計量,因為它可以提供更接近母體參數的估計值。標準差較小的點估計量相對於其他點估計量,有更高的相對有效性 (relative efficiency)。 第7章抽樣與抽樣分配 Part B ( ) 第280頁
24
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.11
點估計量的性質 第7章抽樣與抽樣分配 Part B ( ) 第280頁 圖7.11
25
點估計量的性質 一致性 優良點估計量的另一個特性是一致性(consistency)。簡單來說,當樣本變大,點估計量的數值變得更接近母體參數時,就稱點估計量是一致的。換言之,大樣本比小樣本能提供更好的點估計值。 第7章抽樣與抽樣分配 Part B ( ) 第280頁
26
評註 我們在第 3 章說過,平均數與中位數都是集中趨勢的量數。本章只討論平均數的理由是,常態母體的母體平均數及母體中位數是相同的。而自常態母體抽樣,中位數的標準誤比平均數的標準誤大了 25%。以 EAI 問題為例,n=30,樣本平均數的標準誤是 = 730.3,中位數的標準誤則大概是 1.25(730.3) =913。因此,樣本平均數是更有效的,且有更大的機率更接近母體平均數。 第7章抽樣與抽樣分配 Part B ( ) 第280頁
27
7.8 其他抽樣方法 分層隨機抽樣 叢式抽樣 系統抽樣 便利抽樣 判斷抽樣
7.8 其他抽樣方法 分層隨機抽樣 叢式抽樣 系統抽樣 便利抽樣 判斷抽樣 第7章抽樣與抽樣分配 Part B ( ) 第253頁
28
分層隨機抽樣 (stratified random sampling)
體的所有元素先被區隔成數群,稱為層(strata)。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖 7.12 是一個母體被分成 H 個層的示意圖。 第7章抽樣與抽樣分配 Part B ( ) 第281頁
29
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.12
分層隨機抽樣 台灣 學生 教師 資訊業上班族 第7章抽樣與抽樣分配 Part B ( ) 第281頁 圖7.12
30
分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽樣, 利用公式可將各分層的樣本資訊整合成我們感興趣的 母體參數估計值。
分層抽樣品質的好壞端視資料層內元素的同質性程度, 如果同質性高 (元素都很相近),則層內的變異將減少, 只要少量的抽樣資料就可以得到整個資料層的良好估 計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣本數 較少的簡單隨機抽樣相同。 第7章抽樣與抽樣分配 Part B ( ) 第281頁
31
叢式抽樣(cluster sampling)
在理想的情況下,每一個叢體都可代表一整個母體, 就像是母體的縮小版。 叢式抽樣的好壞評斷標準在於所用的叢體對母體是否有 代表性。 如果每個叢體都能代表母體,則只抽出少數的叢體做 樣本就可得到母體參數的良好估計值。 第7章抽樣與抽樣分配 Part B ( ) 第 頁
32
第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.13
叢式抽樣 台灣 台北市 新北市 高雄市 第7章抽樣與抽樣分配 Part B ( ) 第281頁 圖7.13
33
叢式抽樣 叢式抽樣主要的應用之一是地區抽樣,每一叢體可以是 城市的某個區域或其他定義清楚的地區。
優點:因為已經分成幾個叢體或地區,訪問者可在同一 地區訪問 (例如,某縣市的一個里),成本反而會降低, 時間也可縮短。 缺點:通常抽取的樣本數會比簡單隨機抽樣和分層隨機 抽樣來得多。 第7章抽樣與抽樣分配 Part B ( ) 第282頁
34
系統抽樣(systematic sampling)
例如,在 5,000 個元素的母體中我們要抽出 50 個當作 樣本,可以從每 5000/50=100 個元素中抽出一個元素。 假設我們已將母體元素依序排列。這個程序是先從前 100 個元素隨機抽出一個元素,由這個被抽中的元素 開始,每隔 100 個元素,就抽出 1 個,直到抽出 50 個 元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當母體 元素呈隨機排序時,由於第一個被抽出的元素是隨機 決定的,系統抽樣通常也被假設為具有簡單隨機抽樣的 特性。 第7章抽樣與抽樣分配 Part B ( ) 第282頁
35
系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個 元素,就抽出1 個。
第7章抽樣與抽樣分配 Part B ( ) 第282頁
36
便利抽樣(convenience sampling)
(nonprobability sampling)方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣本 中的元素被抽中的機率。 例如教授可能以志願參與實驗的學生為樣本,因為學生 是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能以 樣本的代表性來評估樣本的「適合度」(goodness) 。 第7章抽樣與抽樣分配 Part B ( ) 第282頁
37
判斷抽樣 使用判斷抽樣(judgment sampling)這個方法的研究者 必須非常瞭解研究對象,選出他認為最能代表母體的 樣本。
例如一名記者可能會選出他認為最能反應全體參議員 看法的 2 位或 3 位參議員來採訪。 第7章抽樣與抽樣分配 Part B ( ) 第283頁
38
判斷抽樣 優點:樣本抽選相當簡單 缺點:選出的樣本品質端視研究者的判斷而定 。
第7章抽樣與抽樣分配 Part B ( ) 第283頁
39
評註 我們在本章推薦使用的機率抽樣方法共有:簡單隨機抽樣、分層隨機抽樣、叢式抽樣或系統抽樣,欲知這些方法所抽出的樣本統計量是否接近母體參數,我們可以用某些公式來評估其「適合度」。便利抽樣和判斷抽樣並不能做適合度分析,因此,在解釋非機率抽樣方法得到的結果時,必須非常小心。 第7章抽樣與抽樣分配 Part B ( ) 第283頁
40
End of Chapter 7, Part B
41
43 青少年每天看電視的平均時間是3小時 (Barron‘s, November 8, 1999)。假定母體平均數 μ =3,母體標準差 σ=1.2小時。如果以50位青少年為樣本來研究看電視的時間。 a. 請做X-bar 的抽樣分配。
42
54 Lori Jeffrey是一位成功的大學教科書業務代表。依照過去的經驗,經由電話拜訪與說明,Lori取得訂單的機率是25%,現抽出她某個月的業務電話當樣本,並假設該資料所產生的比例標準誤為0.0625。 本研究需要多少樣本?也就是說在那個月中Lori共打了多少通業務電話? 令 為推銷的成功率,請顯示 的抽樣分配
Similar presentations