統計調查管理研習班 統計調查抽樣設計 鄭宇庭 國立政治大學統計學系.

Slides:



Advertisements
Similar presentations
Sampling 抽樣 中央大學. 資訊管理系 范錚強 mailto: updated 11.
Advertisements

認識食品標示 東吳大學衛生保健組製作.
第十三章 医学统计学方法的基本概念和基本步骤
Survey Sampling 問卷調查和訪談
第八章 互换的运用.
颞下颌关节常见病.
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
致理科技大學保險金融管理系 實習月開幕暨頒獎典禮
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
脊柱损伤固定搬运术 无锡市急救中心 林长春.
國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
行政訴訟法 李仁淼 教授.
2013年二手车市场环境分析.
結腸直腸腫瘤的認知.
經歷復活的愛 約翰福音廿一1-23.
古緯詩(PHD; 香港中文大學社會學系兼任教授)
郭詩韻老師 (浸信會呂明才小學音樂科科主任)
第五章 抽 样 第一节 抽样的含义.
第二章 研究设计与评价.
104學年度高一新生成長營 教務處工作報告 ~~做自己學習的主人~~
第 六 章 審 計 抽 樣.
医学统计学 Medical Statistics.
第十一章 MIL-STD-1916及 其他抽樣檢驗計畫.
前 言 二十一世纪是一个专家的时代,个人的魅力以及良好的仪态,可以让你胜任一份月薪千元的工作,要想拿更高的薪水,就要看你脑袋里对你自己这行业有多少的专业知识啦!
預告統計資料發布 & 機關辦理統計調查管理作業
2. 戰後的經濟重建與復興 A. 經濟重建的步驟與措施 1.
好好學習 標點符號 (一) 保良局朱正賢小學上午校.
設計師與消費者在食品包裝理解力傳達設計之認知差異
學生:蔡耀峻、許裕邦 座號:23號、21號 指導老師:黃耿凌 老師
統計學 授課教師:林志偉 Tel:5021.
Analysis of Variance 變異數分析
Population proportion and sample proportion
4. 聯合國在解決國際衝突中扮演的角色 C. 聯合國解決國際衝突的個案研究.
新陸書局股份有限公司 發行 第十九章 稅捐稽徵法 稅務法規-理論與應用 楊葉承、宋秀玲編著 稅捐稽徵程序.
民法第四章:權利主體 法人 楊智傑.
What are samples?. Chapter 6 Introduction to Inferential Statistics Sampling and Sampling Designs.
大眾媒體研究導論 Chapter 4 抽樣 第一部分 研究程序
第 7 章 抽樣與抽樣分配 Part B ( ).
Sampling Theory and Some Important Sampling Distributions
第11章 抽樣設計 本章的學習主題 1.抽樣的基本概念 2.抽樣的程序 3.機率抽樣 4.非機率抽樣 5.電話抽樣
Marketing Research and Analysis
調查訪問講授大綱 東吳大學政治學系 黃秀端 教授.
Chapter 7 Sampling and Sampling Distributions
護理研究概論─ 樣本與取樣策略 許翠華 長庚科技大學 護理系 T.H. Hsu.
外语教学中的 科研方法 刘润清 中国外语教育研究中心 10月.
Workshop on Statistical Analysis
四年級 中 文 科.
? 非概率,等概率,不等概 第五章 不等概抽样 每个单元入样的概率 ? 非概率,等概率,不等概.
社会研究方法 第四讲:问卷调查.
第四章 抽樣與抽樣分配 4.1 抽樣與抽樣方法 抽樣分配概論 常見的抽樣分配 中央極限定理55
資料精簡 (Data Reduction).
生物統計 1 課程簡介 (Introduction)
第五章 三角比 二倍角与半角的正弦、余弦和正切 正弦定理、余弦定理和解斜三角形.
Introduction to Basic Statistics
抽樣分配 Sampling Distributions
相關統計觀念復習 Review II.
聖誕禮物 歌羅西書 2:6-7.
第七章 抽樣與抽樣分配.
Introduction to Basic Statistics
政府採購法 第四章 履約管理 報 告 人:郭明恩 政府採購法及其子法相關規定 本法 第四章(§63~70)【8】
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
朝陽科技大學 環境工程與管理學系 課程名稱:空氣污染實驗 課程內容:採樣及分析方法概論 上課班級 : 二A & 二B   授課教師:楊錫賢教授.
医学统计学 (Medical Statistics)
第三章 離散及連續型機率分配.
依撒意亞先知書 第一依撒意亞 公元前 740 – 700 (1 – 39 章) 天主是宇宙主宰,揀選以民立約,可惜他們犯罪遭
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
生物统计学 Biostatistics 第一章 统计数据的收集与整理
基督是更美的祭物 希伯來書 9:1-10:18.
第二單元:資料哪裡來?(2) 授課教師:國立臺灣大學政治學系 洪永泰 教授
經文 : 創世紀一章1~2,26~28 創世紀二章7,三章6~9 主講 : 周淑慧牧師
Presentation transcript:

統計調查管理研習班 統計調查抽樣設計 鄭宇庭 國立政治大學統計學系

統計調查管理研習班 統計調查抽樣設計 抽樣基本概念

ex. 多少比率贊成統圖獨、公投、行政首長下台 抽樣問題的基本要素 母體太大 樣本 推論 推論 mean ex. 台灣平均家中小孩、收入 total τ ex. 多少瀕臨絕種動物、多少人抗議遊行 proportion p ex. 多少比率贊成統圖獨、公投、行政首長下台

每個樣本包含一些訊息( , τ, p),每一個樣本需要經費。 決策者決定要花多少錢來買訊息。 每個人都希望花最少的錢獲得最多訊息。 所以抽樣計劃可以告訴你花多錢 (sample size) 可以得到多精確的結果。

在一個社區探討民眾對於社區建設的支持率(贊成率): elements(基本單元): 有投票權的社區民眾 measurement(測量): 意見---贊成(1),反對(0) population(總體): 在這個社區有投票權的民眾的集合 target , survey sampling units(抽樣單位): 一個民眾、一個家 frame(底冊;抽樣單位的名單): 個人---戶政事務所 家庭---電話簿 sample---(抽樣樣本): 在底冊中若被抽樣選中的抽樣單 位所形成的集合

如何選擇樣本數 :母體參數, :估計 B:精準度 ( , α = 5% ) 希望控制在B之下,那種抽樣方法可以達到 B,而且花費最少 。

統計調查管理研習班 統計調查抽樣設計 抽樣方法

I. 非機率抽樣 Quota Sampling (配額抽樣) (分層抽樣- 隨機選取 ;配額抽樣-隨意選取) (ex.1948年前蓋洛普民調) Convenience Sampling (便利抽樣) (ex.街頭面訪) Judgment Sampling (判斷抽樣) (ex.主計處編製物價指數) Snowball Sampling (雪球抽樣) (ex.單親家庭,特殊疾病)

II. 機率抽樣 Simple Random Sampling (簡單隨機抽樣) (缺點:母體不能太大,花費太大) Systematic Sampling (等距抽樣) (ex.電話簿抽樣) Stratified Sampling (分層抽樣) (ex. 大四、大三、大二、大一) Cluster Sampling (群集抽樣) (ex. 一班) Multistage Sampling 多段抽樣

簡單隨機抽樣方法 Simple Random Sampling

各種隨機抽樣方法,一般可分為五個步驟 (1) 決定採用何種抽樣方法 (2) 選擇估計數 (3) 求估計數的標準誤 (4) 計算母體參數的信賴區間 (5) 決定樣本大小

定義 簡單隨機抽樣法 (Simple Random Sampling)(SRS) 我們從母體 N 抽出樣本 n 的隨機樣本,其每一組可能的樣本均有相等被抽出的機會。這種抽樣程序即稱為簡單隨機抽樣法。其所抽出的樣本稱為簡單隨機樣本。

隨機樣本的抽出 隨機數字表 (Random Number Table) 隨機數字表的使用 隨機選取起始點,連續取用數字 隨機選取起始點,抽出個、十、百位數字

母體平均數的估計 平均數 (µ) Bound on the error of estimation

(II) 總和 (τ) Bound on the error of estimation

Bound on the error of estimation (III) 比例 (P) y=0, 1 Bound on the error of estimation

樣本數的選擇 如何代入S ? (1) 分兩階段取樣 (2)Pilot Survey 平均數 (µ) (3)Prior Information (4) range = 4S

(II) 總和 (τ) 如何代入S ? (1) 分兩階段取樣 (2)Pilot Survey (3)Prior Information (4) range = 4S

(III) 比例 (P) 如何代入S ? (1) 分兩階段取樣 (2)Pilot Survey (3)Prior Information (4)p=q = 1/2

簡單隨機抽樣使用時機 (1) 母體小 (2) 令人滿意的母體名冊 (3) 單位訪問成本不受地點遠近之影響   簡單隨機抽樣使用時機 (1) 母體小 (2) 令人滿意的母體名冊 (3) 單位訪問成本不受地點遠近之影響 (4) 母體名冊是有關母體資訊的唯一來源

分層隨機抽樣方法 Stratified Random Sampling

定義 分層隨機抽樣法 (Stratified Random Sampling) 將母體按某種標準分為若干副母體,這些副母體舊稱為層(strata)。各層中所包含的個體互不重疊。其次各層中以簡單隨機抽樣抽出各層的簡單隨機樣本,然後將各層隨機樣本合併起來即成一組分層隨機樣本。這種抽樣程序即稱為分層隨機抽樣法。

分層的功用 縮小樣本的誤差 降低成本 管理方便 副母體特性

分層的準則 空間(地點)的標準: 北部,中部,南部,東部 種類的標準: 產業的類別 等級的標準: 產品優劣,喜好差異 數量的標準: 人數,所得 組織的標準:學院,縣市鄉鎮鄰里

分層的先決條件 去分層? 分層抽樣的一個先決問題是如何去分層,應依哪一種性質或標準 抽樣調查必有一定的目的,應針對這個目的分層,或說哪一種分層法最有助於抽樣目的之達成,即採用那一種 抽樣必用某方法去實行,哪一種方法最便於實行,即採用那一種 分層需憑藉已有的全體的某些資料,這些資料是否完整,應就最完整可靠的資料去分層 抽樣調查所費不貲,而各種分層法所用的費用多少並不相同,應採用最少的一種去分層

母體平均數、總和及比例的估計 (I) 平均數 (µ) Bound on the error of estimation

(II) 總和 (τ) Bound on the error of estimation

Bound on the error of estimation (III) 比例 (P) Bound on the error of estimation

樣本數的選擇 (I) 平均數 (µ)

(II) 總和 (τ)

(III) 比例 (P)

配置樣本 分層隨機抽樣方法中,若 n 表示總樣本大小而 表示各層的樣本, 則 n 和 會滿足: 由上式可知 表示每層樣本大小 和總樣本大小 n 的比例,稱之為樣本配置(allocation) 。

當考慮分層隨機抽樣每一層樣本大小 的配置時,應注意下列三項事情: 每層母體的大小 每層變數的變異數 每層選取樣本的成本

其中 表示固定成本,而 表示每層每單位的調查費用。在本節中,我們將探討 (1)在抽樣調查總費用 C 固定的條件下,如何計算每層配置的權數 設 C 表示抽樣調查的總費用,且 C 滿足 其中 表示固定成本,而 表示每層每單位的調查費用。在本節中,我們將探討 (1)在抽樣調查總費用 C 固定的條件下,如何計算每層配置的權數 以使得樣本統計量的變異數 V 有最小值;(2)在準確度固定的條件下,如何計算每層配置的權數 以使得調查總費用 C 有最小值。

不論是限制總成本而使變異數為最小,或固定準確度而使總成本為最小,理論可得 代入 n 之公式可得

同理

若每層的樣本大小滿足上述的等式,則此種樣本配置稱為Deming’s配置或最優配置。 如何代入σ ? (1) Prior Information (2) Range = 4σ (3) p = q = 1/2

Neyman’s Allocation 若我們不考慮每層樣本的成本 或假設 則每層樣本大小 為

Proportional Allocation 若我們不考慮每層的母體變異數 和樣本的成本 或假設 ; 則每層樣本大小 為

分層抽樣和簡單抽樣的比較 Neyman分層估計量的準確度較Proportional分層估計量的準確度高,即 若我們以取出不放回的方式取樣或有限校正因子fpc 趨近於1,則Proportional分層估計量較簡單隨機估計量準確,即

事後分層 我們在前面討論的分層抽樣是事先分層好,然後在每個分好的層內分別抽樣。事後分層式在抽到樣本之後,再依樣本的資料(例如:性別,年齡等)將樣本分層。假設首先抽取到 n 個隨機樣本,而將樣本資料分層後在第 i 層得到 個樣本。此時層樣本數 是隨機變數,且 滿足多項式分配。這個結果和事前分層然後抽樣不相同,在後者情況下, 是固定數不是隨機變數 。

如果 是固定的,則 但是,如果 是隨機則在計算 需將 以其期 望值代入

可得 右式第一項為Proportional分層估計量的變異數,第二 項之數值恆為正數。此增加的變異量是因為在事後才 分層所造成的額外可能的差異。

雙重抽樣法 (Double Sampling) 在分層隨機抽樣法中, 各層母體大小為已知。在本節中我們將討論各層母體大小未知時,如何利用樣本資料來估計母體參數。 在雙重抽樣法中,我們將分兩個階段來估計各個階段的母體參數。首先,我們自母體中以簡單隨機抽樣法抽出 個樣本,做為第一重樣本以估計各層母體大小 ; 其次,再從第一重 個樣本中以簡單隨機抽樣法,從每一層中隨機抽出 個樣本做為第二重樣本以估計母體參數。

系統抽樣方法 Systematic Sampling

定義 系統抽樣法 (Systematic Sampling) 將含有N單位的群體依序從 1 至 N 加以編號,並將之分為若干 k 個單位。其抽取方法,普通係由第一 k 個單位中隨機抽取一個單位,假定其為第 j 號,然後由第 j 號開始,每隔 k 個單位取一個單位,直到取遍了整個群體為止。此種樣本稱為系統樣本(Systematic Sample), 或稱 k 取 1 系統樣本(1-in-k systematic sample)。

系統抽樣法的主要任務在於 達到真正的隨機性 抽樣操作的簡單化 解決隨機表不敷應用的困擾

系統抽樣法的優點 抽樣工作簡捷無誤 解決隨機表不敷應用的困擾 統計效率等於或大於簡單隨機抽樣的統計效率 選擇偏誤(或者訪員偏誤)減少

如何選取系統樣本  系統樣本中 k 值的大小通常是由 N 及 n 值決定,即若母體大小 N 已知,則可得 k≦ N/n 。例如 : 若 N=15,000且我們想從抽樣名冊中抽取 n=100個單位做為一個樣本,則 k 值必須小於等於 150。   若 k=150,則我們可得100個樣本 ; 若 k < 150,則我們可得100個以上的樣本,而我們只需選取前100個樣本即可。   但若母體大小 N 未知,則我們便無法精確的選擇 k 值,此時我們必須先決定樣本大小 n,然後再猜測 k 值以得到 n 個抽樣樣本。

在此節中,我們假設母體呈現隨機性 (random)。 母體平均數、總和及比例的估計   若母體資料呈現隨機性次序(random order),則稱此母體資料具有隨機性(random) 。 在此節中,我們假設母體呈現隨機性 (random)。

(I) 平均數 (µ) Bound on the error of estimation

(II) 總和 (τ) Bound on the error of estimation

Bound on the error of estimation (III) 比例 (P) Bound on the error of estimation

樣本數的選擇 (I) 平均數 (µ)

(II) 總和 (τ)

(III) 比例 (P)

重複系統抽樣法(Repeated Systematic Sampling) 由於我們無法利用一個系統樣本來估計  ,故本節介紹如何利用重複系統抽樣法來估計系統樣本平均數的變異數。   重複系統抽樣法是指在一個母體中同時抽出許多系統樣本,而由這許多系統樣本組成一個系統樣本的設計。

例如 :在系統抽樣法中,設母體大小 N=500,若我們隨機在此母體中抽出一個“5取1”的系統樣本,則可得依樣本大小n =100的系統樣本。 同理,若我們以重複系統抽樣法在此母體中抽出十個“50取1”的系統樣本,則可得十個樣本大小 n=10 的系統樣本。我們則可以利用重複系統抽樣法所得的十個系統樣本來估計系統樣本平均數的變異數。

在上述的重複系統抽樣法, k = 5 , , 則母體平均數和總和的估計量為

系統抽樣和簡單抽樣準確度的比較 在本節中,我們將討論母體系統資料之間的相關性對母體平均數系統估計量 的變異數 的影響,也將比較母體平均數簡單隨機樣本平均數 的變異數 和系統估計量 的變異數 的大小關係。

N = kn 系統樣本  1 … 2 ︰ i k

系統樣本平均數的變異數 可以表示成組間變異SSB:

令 則在系統抽樣法中,母體平均數的系統估計量 的變異數可表示 故可得

故 及 的大小完全由 MSW 及 的大小決定 : 若 , 則 系統估計量較簡單估計量的準確度低。 若 , 則 系統估計量較簡單估計量的準確度相同。 系統估計量較簡單估計量的準確度高。

此式說明 可以分成兩個部分,第一部份為母體總變異數 ,第二部份為系統樣本內的總變異SSW。可知系統樣本內的總變異愈大,即 SSW 愈 大,則系統樣本平均數的變異數愈小 ; 也就是說, 系統樣本內的資料差異愈大,則系統樣本平均數的變異數愈小 。

最後,我們將討論那一種母體系統變數資料會使得系統樣本內變數資料的差異很大或很小 最後,我們將討論那一種母體系統變數資料會使得系統樣本內變數資料的差異很大或很小 ? 或那一種母體系統變數資料會使得 k 個系統樣本內變量之間的相關係數為正值,為負值或為 0 ? 為回答這個問題,我們必須考慮下面三種母體變數資料的型態 : 隨機性母體 (randomness population) 次序性母體 (ordered population) 週期性母體 (periodic population)

若母體系統變數資料呈現隨機性次序 (random order),則稱此母體系統變數資料具有隨機性 (randomness) 。則我們會預期所取的系統樣本內變量之間的相關係數會趨近於 0 。 若母體系統變數資料呈現直線趨勢 (linear trend),則稱此母體系統變數資料具有次序性 (ordered) 。則我們會預期所取的系統樣本內變量之間的相關係數會小於 0 。 若母體系統變數資料呈現週期變動 (cyclical variation),則稱此母體系統變數資料具有週期性 (periodic) 。則我們會預期所取的系統樣本內變量之間的相關係數會大於 0 。

群集抽樣方法 Cluster Sampling

群集抽樣法的意義 不論採用簡單隨機抽樣法,分層隨機 抽樣法或系統抽樣法作抽樣調查,都 必須有抽樣底冊方可進行。在沒有抽 樣底冊或在經費短絀情況下,要作抽 樣調查,就得採用其他抽樣方法,例 如群集抽樣法。

定義 群集隨機抽樣法 (Cluster Sampling)

群集隨機抽樣法的意義 劃分群集的標準,大體而言,與劃分層的標準完全相反,分層著重層內各元素的齊一,而群集則加強各群集內元素間的分化,也就是要做到各群集內的元素能是其母體的縮型,才算合乎劃分群集的標準。因為如此,從這些群集中抽取若干群集為一樣本,則其代表性就高。

群集和分層隨機抽樣法的差別 以抽樣單位區分:群集隨機抽樣法的抽樣單位為群集而分層隨機抽樣法的抽樣單位為母體元素。 以劃分目的區分:群集隨機抽樣法希望群與群之間的差異愈小愈好而分層隨機抽樣法則希望每層之內的差異愈小愈好。

集體抽樣法的功能 母體名冊不容易獲得或者非常昂貴 成本考量 減少行政管理困難

 群集樣本  n 個群集 1 … 2 ︰ i N

假設 母體: N 個群集 樣本: n 個群集

一般 母體: N 個群集 樣本: n 個群集

假設 (conti) 樣本: n 個群集

母體平均數、總和及比例的估計 (I) 平均數 (µ) Bound on the error of estimation

(II) 總和 (τ) : M 已知 Bound on the error of estimation

(II-1) 總和 (τ) : M 未知 Bound on the error of estimation

Bound on the error of estimation (III) 比例 (P) Bound on the error of estimation

樣本數的選擇 (I) 平均數 (µ) 如何代入 ? (1)Pilot Survey (2)Prior Information

(II) 總和 (τ) : M 已知 如何代入 ? (1)Pilot Survey (2)Prior Information

(II-1) 總和 (τ) : M 未知 如何代入 ? (1)Pilot Survey (2)Prior Information

(III) 比例 (P) 如何代入 ? (1)Pilot Survey (2)Prior Information

群集抽樣和簡單抽樣準確度之比較 在此節,我們只討論各個群集大小都相等時,群集估計量和簡單平均估計量準確度的比較。

群集樣本平均數的變異數 可以表示成組間變異 群集樣本平均數的變異數 可以表示成組間變異 SSB:

故 及 的大小完全由 的正負號決定 : 若 , 則 群集估計量較簡單估計量的準確度低。 群集估計量較簡單估計量的準確度相同。 群集估計量較簡單估計量的準確度高。

當 時, 有最大值。又 表示各群集之內沒有變異,各群集之間有很大的變異, 此時群集隨機抽樣法較簡單隨機抽樣法的準確度低。

當 時, 有最小值。又 表示各群集之間沒有變異,各群集之內有很大的變異, 此時群集隨機抽樣法較簡單隨機抽樣法的準確度高。

比例機率抽樣法 (Probabilities Proportional to Size) (pps) 在群集抽樣法中,若每一群集的母體大小差異不大時或母體變異數差異不大時,我們會以均等機率(equal probability),即一般的簡單隨機抽樣法進行抽樣。但若每一群集的母體大小差異很大時或母體變異數差異很大時,則各個群集單位對母體參數所提供的訊息就可能不一樣。若能對母體每一群集,給予一個對應的抽取機率 ,i=1,2, …, N 。則

若可選取

在可是在抽樣之前是不可能知道各個群集的總數(yi),因此我們通常就以每一群集的母體大小做為每一群集對母體參數所提供的訊息比重,如下所示 :

母體總和及平均數的比例機率估計

多階段抽樣方法 Multi-Stage Sampling

在本節,我們將簡單隨機抽樣法,分層隨機抽樣法及群集抽樣法,這三種抽樣法結合在一起。 這三種隨機抽樣法,各有其優點也有其缺點。簡單隨機抽樣法不須考慮任何抽樣因素故簡單實用;分層隨機抽樣法雖然較簡單隨機抽樣法精確,但其前提是各層之內變數資料的變異要小;群集隨機抽樣法兼具經濟與準確雙重好處,但前提是各個群集之間變數資料的變異要小。

當抽樣母體很大時,執行簡單隨機抽樣法,其抽出率f 相對的會很小,所以母體参數估計的準確度相對的也會變小。 執行分層隨機抽樣法時,為了將類似的元素放在同一層級中,則層級個數勢必也相對的變大,如此一來便失去分層的意義。 執行群集抽樣法時,為了將相異的元素放在同一群集中,則每個群集的群集大小勢必也相對的會變大,如此一來群集抽樣便失去了同時到達經濟與準確的目的。

多階段抽樣法 將母體分割成N個抽樣單位,稱為第一階段並在其中以 簡單隨機抽樣法抽出n個抽樣單位稱為第一抽樣單位 (primary sampling units),以psu表示; 其次,將第一階段 中的每一個抽樣單位分割成Mi(i=1,2, …,N)個抽樣單位, 稱為第二階段,並在第一抽樣單位中以簡單隨機抽樣 法抽出mi個(i=1,2, …,n)抽樣單位稱為第二抽樣單位 (secondary sampling units),以ssu表示; 然後,再將第二 階段中的每一個抽樣單位分割成Kij (i=1,2, …,N; j=1,2,…, Mi)個抽樣單位,稱為第三階段,並在第二抽 樣單位中以簡單隨機抽樣法抽出kij個(i=1,2, …,n; j=1,2,…, mi)抽樣單位稱為第三抽樣單位(third sampling units),以tsu表示。

一般而言,多段抽樣法,大多只進行到第三段為止,最多進行至第四段,鮮有進行至第五段以上者。 由多階段抽樣法的定義可知,簡單隨機抽樣法即為一階段抽樣法; 分層隨機抽樣法即為 n = N 的兩階段抽樣法; 群集隨機抽樣法即為 的兩階段抽樣法。因此分層隨機抽樣法及群集隨機抽樣法只是兩階段抽樣法的特例。

兩段抽樣法樣本結構 欲瞭解多段抽樣法,須先從兩段抽樣法開始。所謂兩段抽樣法係先將母體按某種標準分為若干類,用簡單隨機抽樣方式從其中抽取若干類,為第一階段操作; 再由被抽得的類別中進行抽樣調查,為第二階段操作。 兩段抽樣法為群集抽樣法及分層抽樣法的折衷辦法。其第一階段為群集抽樣法,即先由所有群集中抽出若干群集;其第二階段為分層抽樣法,即對所抽得的群集再舉行分層抽樣調查。

母體總和、平均數及比例的估計 將母體分割成N個抽樣單位為第一階段; 其次將第一階段中的每 一個抽樣單位分割成Mi(i=1,2, …,N)個抽樣單位為第二階段。 第一階段抽樣單位 第二階段抽樣單位 母體資料 1 M1 y11, y12, ..., y1M1 2 M2 y21,y22, ..., y2M2   N MN yN1,yN2, ..., yNMN

從第一階段的抽樣母體以簡單隨機抽樣法抽出n個抽樣單位; 其次再從第一階段第i 個抽樣單位中以簡單隨機抽樣法抽出 mi(i=1,2, …,n)個為第二抽樣單位。 第一抽樣單位 樣本資料 1 m1 y11, y12, . . . , y1m1 2 m2 y21,y22, . . . , y2m2   n mn yn1,yn2, . . . , ynmn

在兩階段抽樣法中,將會使用到下列公式: 寫成 在期望值及變異數的下方加註一個2表示我們在執行第二階段的抽樣分析;在下方加註一個1表示我們在執行第一階段的抽樣分析。

母體總和、平均數及比例的估計 先考慮第二階段: 母體 樣本

母體總和、平均數及比例的估計 再考慮第一階段: 母體 樣本

母體總和、平均數及比例的估計 計量,故 再由上式可得下列統計量為第一階段第i個抽樣單位母體總 數和的不偏估計量, 由簡單隨機抽樣法可知樣本平均數為母體平均數的不偏估 計量,故 再由上式可得下列統計量為第一階段第i個抽樣單位母體總 數和的不偏估計量, 同理,我們在第一階段以簡單隨機抽樣法取出n 個抽樣單 位,則

母體總和、平均數及比例的估計 (I) 平均數 (µ) M 已知

若M未知,則用下列式子來估計M

(I-1) 平均數 (µ) M未知

(II) 總和 (τ)

(III) 比例 (P) M已知

(III-1) 比例 (P) M未知

單位大小相等的兩階段估計 當第一階段的抽樣單位大小都相等且第二階段的抽樣單位大小都相等時,此種兩階段抽樣法稱為單位大小相等的兩階段抽樣法,即

(1) 當N很大時, 僅跟群集的平均數有關。 (2) , , 兩階段抽樣法就成了群集抽樣法。 (3 ) n = N, , 兩階段抽樣法就成了分層抽樣法。 (4) 當 時,兩階段抽樣法就比較像群集抽樣法。 (5) 當 時,兩階段抽樣法就比較像分層抽樣法。 (6) 當在兩階段抽樣法中,如果各個分類中是異質,選擇(4) 。 (7) 當在兩階段抽樣法中,如果各個分類中是同質,選擇(5) 。

樣本數的選擇 即第一階段的抽出單位 n 及第二單位 m 的大小應該 如何配置。假設調查的固定成本經費為C0,第一階 在單位大小相等的兩階段抽樣法,如何配置樣本? 即第一階段的抽出單位 n 及第二單位 m 的大小應該 如何配置。假設調查的固定成本經費為C0,第一階 段抽出單位的費用為C1 ,第二階段抽出單位的費用 為C2 ,因此總成本的費用為 C = C0 + nC1 + nmC2 。 我們將探討 (1)在抽樣調查總費用 C 固定的條件下, 如何計算 n 及 m 的配置,以使得樣本統計量的變異數 V 有最小值;(2)在準確度固定的條件下,如何計算 n 及 m 的配置,以使得調查總費用 C 有最小值。

不論是限制總成本而使變異數為最小,或固定準確度而使總成本為最小,理論可得 解出 m 值後,再代入總成本或變異數,即可得 n

從上式可知,當 增加時,m 增加 ; 當 增加時,m 減少。 當 C1 增加時,m 增加 ; 當 C2 增加時,m 減少。

比例機率抽樣法 (Probabilities Proportional to Size)(pps) 前面數節的兩階段抽樣法稱為均等機率兩階段抽樣法,在本節中則是注重於比例機率之兩階段抽樣法。比例機率之兩階段抽樣法的比例部分只用於第一階段。在群集的比例機率抽樣法中,母體總和的比率機率估計量為 : 在兩階段抽樣法中,第i 個群集總數和 未知,故我們將母體總和的比率機率估計量修正為:

如同群集抽樣法中,我們通常以每一抽出單位中的母體大小做為每一抽出單位的比重,即 故可得母體總和的比率機率估計量為:

母體總和及平均數的比例機率估計

統計調查管理研習班 統計調查抽樣設計 調查應用實例

抽樣調查設計 調查目的 調查對象及區域範圍 調查底冊 抽樣方法 調查方法 調查工具---問卷 試驗調查(問卷測試) 人員訓練 實施調查期間與進度 資料收集---coding, key in, checking 資料分析

調查中誤差之來源 調查是由一連串的步驟共同形成的測量過程。若要評估根據調查所做的推估的品質好壞,調查過程中的每一個環節都應該要考慮到: 1. 抽樣方面的誤差 2. 問卷方面的誤差 3. 訪員方面的誤差 4. 資料整理的誤差

抽樣方面的誤差 A. 當從母體抽樣出來的抽樣底冊或名單並沒有包 括所有母體所描述的特性時,那麼就會有某一 些類別的人被排除在樣本之外; B. 因為抽樣所依循的樣本比例(機率)並沒有充 分地反應母體比例; C. 當有一些樣本拒絕參與調查、不肯提供答案, 或對某些敏感性問題拒答。  

問卷方面的誤差 A. 當問題被誤解; B. 當問題本身並不能表達出自己真正想 得到的資訊; C. 當受訪者並不願正確地回答題目。

訪員方面的誤差 A. 當訪員並沒有逐字地唸出題目; B. 當訪員做引導式的追問(probe); C. 當訪員對受訪者的答案加入自己的偏見; D. 訪員記錄不正確。

資料整理的誤差 A. 當過錄員使用不一致的過錄原則, 或對所該適用的過錄碼判斷錯誤; B. 當資料在鍵入電腦時鍵入錯誤。  

世上並無抽樣調查的『專家』, 有的只是有『經驗』。 只有一種方法可以學到經驗: 做實際的問題。 有人問馬克吐溫怎麼寫小說?答曰: 「坐下來把紙攤開來寫」。 怎麼應用抽樣調查?其答案也相差不遠。

抽樣調查的方法及技巧, 猶如中國武俠小說中的劍招, 而實戰經驗,因為現場狀況太多, 無法在課堂上,課本上教出來。 所以,你可以學到劍法招式, 可是衝鋒肉搏仍然是你自己家的事。 惟有勇於接受問題,了解問題,進而解決問題, 才能從獨孤求敗蛻變成獨孤不敗。