量化研究與統計分析 抽樣 謝寶煖 台灣大學圖書資訊學系 2006年4月1日.

Slides:



Advertisements
Similar presentations
Sampling 抽樣 中央大學. 資訊管理系 范錚強 mailto: updated 11.
Advertisements

3 受訪者對於本校畢業生各項就業力表現的滿意程度 4 受訪者認為本校畢業生哪些就業力具有優勢.
撲克牌 的 機率. 一副撲克牌共 52 張,取 5 張 求各種 「牌型」 出現的 機率 先來複習一下 n 個相異物中,取出 k 個,所有可能 的方法共有多少種? 還記得為什麼吧!
單元九:單因子變異數分析.
Unit 8 如何確定研究對象及如何選用或編製研究工具?
3-4 統計資料的來源.
行銷研究 單元三 次級資料的蒐集.
國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
沈冠甫 財務金融系 統計與生活 沈冠甫 財務金融系
08 CSS 基本語法 8-1 CSS 的演進 8-2 CSS 樣式規則與選擇器 8-3 連結HTML 文件與CSS 樣式表
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
第一節 抽樣調查的基本概念 第二節 隨機抽樣技術 第三節 非隨機抽樣技術 第四節 抽樣誤差與樣本數 第五節 有關抽樣設計的幾個問題 思考題
統計調查管理研習班 統計調查抽樣設計 鄭宇庭 國立政治大學統計學系.
抽樣與抽樣分配 7.1 抽樣問題 7.2 簡單隨機抽樣 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配 7.6 的抽樣分配
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
估計.
設計師與消費者在食品包裝理解力傳達設計之認知差異
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
大眾媒體研究導論 Chapter 4 抽樣 第一部分 研究程序
第 13 章 抽樣.
第 7 章 抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
第 13 章 抽樣.
計數值抽樣檢驗計劃 (MIL-STD-105E)
2-3 基本數位邏輯處理※.
電子商務基本概念 電子商務的定義 1-1 電子商務的特性 1-2 電子商務的演進 1-3.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
第11章 抽樣設計 本章的學習主題 1.抽樣的基本概念 2.抽樣的程序 3.機率抽樣 4.非機率抽樣 5.電話抽樣
Sampling Methods and the Central Limit Theorem
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
第五章 抽樣與抽樣分配.
抽樣計畫 6.1 了解抽樣 6.2 抽樣程序 6.3 樣本大小的決定 6.4 平均數、比率的樣本統計量分配 6.5 信賴區間
護理研究概論─ 樣本與取樣策略 許翠華 長庚科技大學 護理系 T.H. Hsu.
大數據與我 4A 陳駿榜.
統計應用 與 Microsoft Excel 簡介
第一章 緒論 1.1 統計學的意義 統計學(statistics)是一種科學方法與原理,其包括資料的蒐集,資料的整理,陳示,分析與解釋,並獲得結論,以幫助做更有效的決策。 統計學包含敘述統計學(descriptive statistics)與推論統計學(inferential statistics)。
學習單元:N6 數的性質 學習單位:N6-3 用短除法求H.C.F. 和 L.C.M. 學習重點 : 1. 複習因數分解法求
數學 近似值 有效數值.
How to use Edmodo Alice Lin 8-12th Grade Valencia High School
第七章 抽樣與抽樣分配.
Definition of Trace Function
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
小學四年級數學科 8.最大公因數.
第 5 章 資料的蒐集和抽樣.
學習內容 概說 損失函數 雜音:造成品質變異的原因 訊號雜音比 直交表 回應表與回應圖 田口方法.
數學科 六年級下學期.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
實用數學 長度單位的認識與換算.
產品設計與流程選擇-服務業 等候線補充資料 20 Oct 2005 作業管理 第六章(等候線補充資料)
Marketing Research and Analysis
Ch06 抽樣設計.
Parameter Estimation and Statistical Inference
1-1 隨機的意義– P.1.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第六章 抽樣方法.
抽樣設計的重點 「抽樣」(smapling)是自母群體中選取部份元素/基本單位(elements)為樣本,並且認為從選取的樣本可得知母群體的特徵。 1.有那些機率抽樣方法?特性為何? 2.有那些非機率抽樣方法?特性為何? 3.抽樣時應考慮那些要素? *
Introduction to Basic Statistics
第二單元:資料哪裡來?(2) 授課教師:國立臺灣大學政治學系 洪永泰 教授
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
10303: How Many Trees? ★★☆☆☆ 題組:Contest Archive with Online Judge
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
調查研究的概念 蔡佳泓 政大選舉研究中心 副研究員.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

量化研究與統計分析 抽樣 謝寶煖 台灣大學圖書資訊學系 2006年4月1日

抽樣 自母群體(population)中抽出一個較小的樣本(sample) 然後從樣本的個案收集所需的資料 經由對樣本的研究與了解來推論母群體的情況 要得到有意義的結果,樣本應該取多大?

抽樣的歷程 從母群體中抽取樣本時,必需使樣本具代表性,推論母群體情況時才不致有太大的誤差 樣本的品質與大小同樣重要 選樣本的過程是關鍵 不偏:被選中的機會都一樣 獨立:一個個體被選中,不影響其他個體是否被選中 所以,在抽樣時就是盡量要求能找到一個代表性樣本(representative sample),以減少抽樣誤差(sampling error)

抽樣的歷程 界定母群體 收集名單 決定樣本的大小 設計抽樣方法 同時考慮抽樣誤差和研究代價 容忍的誤差愈小,樣本就要愈大 付出的研究成本愈少,樣本就要酌量減少 設計抽樣方法

抽樣誤差 選取的樣本推論到母群體時產生的誤差稱為 抽樣誤差 抽樣誤差其實不是計算自於樣本統計量和母體參數的差別,因為母體參數是未知而待推估的;抽樣誤差能被估算,是依據該樣本在「抽樣分配」所在的位置,及其意含的機率

抽樣分配 抽樣分配的形成是假設在一個母群體中,不斷抽取大小相同樣本,測量其統計量,所構成的一個分配 從一副撲克牌中任意抽出9張牌,出現紅色牌的情況0到9張都有可能,其中應以出現5張紅牌最為可能,而出現0或9張紅牌的機會最小 抽樣分配集中或分散的程度就是「抽樣誤差」計算的依據 樣本大小是個關鍵,也就是樣本大抽樣誤差較小,反之,樣本數量小抽樣誤差較大

樣本之決定 本調查之母群體為2,989家台北市電腦同業公會之會員 95%之信賴水準 最大誤差小於0.05之條件下樣本數之決定方式為: 設P為本調查之全體對象之任一比例值,p為其估計值,倘要 P(p-P<d)>1- 則樣本數n如下表:

誤差上界 d 信賴水準 1- 樣本數 n   0.05 0.95 0.96 0.97 0.98 0.99 341* 371 407 460 541 0.04 500 591 661 768 0.03 787 842 910 1003 1037

有限母體樣本數之推估公式 當估計最大誤差d=0.05,可靠度至少95%的條件下,其計算公式如下: 本調查之樣本數應為341 公式:

應抽取341家企業為調查樣本 然因考慮到電話訪問不免會遇到打不通的情形,因此本調查以系統抽樣方法,依會員名單順序,每七名抽樣一名,共計抽取427名為本調查之樣本

http://www.surveysystem.com/sscalc.htm

抽樣方法 非機率抽樣法 (non-probability sampling) 機率抽樣法 (probability sampling) 立意抽樣法 偶遇抽樣法 滾雪球抽樣 定額抽樣法 便利取樣 機率抽樣法 (probability sampling) 簡單隨機抽樣 系統隨機抽樣 分層隨機抽樣 集體抽樣法 多段抽樣法

立意抽樣法(Purposive Sampling ) 立意抽樣是根據研究員的主觀判斷以及研究目的而決定的,選取研究者認為最典型的個案。 例如跑到某班國文的課堂中,挑選我們認為最具代表性的學生,調查他們對於公益彩券的看法。樣本是否能具代表性,視乎研究員的主觀判斷是否正確。

偶遇抽樣法 Accidental Sampling 也稱為便利抽樣法(convenience sampling) 純粹以方便為基本著眼點的抽樣方法,樣本之選擇只考慮是否容易得到或容易觀察。 如研究者在街道上,或是其他場所來抽下路人做訪問的工作,雖說這種方式常被使用,但並不是一種適切的抽樣方法,若此項研究的目的,是要了解在某特定時間內,通過某一特定地方的路人特質為何,這種研究方法才具有合理性。選取一些偶然遇見的個案做為樣本。例如在上課教室門口,只要是要進入教室上課的人,我們就進行研究,直至完成所需的樣本數為止。這種抽樣方法很容易進行,但樣本的代表性卻值得懷疑,因為偶然遇見的人和沒有遇到的人可能有所不同。

滾雪球抽樣 Snowballing Sampling 也有些人認為此種抽樣方式其實是偶遇抽樣法的應用。 滾雪球抽樣是在特定母群體中成員難以找到時,最適合採取的抽樣方式。這種抽樣的程序是先蒐集目標母群體的少數成員,同時再向這些成員徵詢資訊,以找出他們剛巧認識的母群體成員。所謂滾雪球,指的是研究對象建議找出其他研究對象的累積過程。由於這種程序會找出代表性成疑的樣本,通常都用於試探性的目的。

定額抽樣法 Quota Sampling 定額抽樣是根據按照母群體的特性,先選定幾個具代表性的類別(如性別、年齡等),從各類別當中先獲知其占母群體的比率,再用偶遇或立意的方式取樣,使該樣本各類型的比例能反應出母群體的特徵。 此種抽樣方式要先從建立一個母群體特質的矩陣開始。例如我們必須知道修習知識管理學程的學生中不同學院、性別、年級等的比例為何,然後用立意或偶遇的方式,從學院、性別、年級等抽取固定比例的個案樣本,合起來可以達到我們的樣本數目即可。定額抽樣法由於包括了各組的個案,其代表性高於立意抽樣或偶遇抽樣。

志願對象抽樣 Volunteer Subjects Sampling 這種抽樣方式和偶遇取樣類似,完全是基於個人的意願接受調查或訪問,如電視或電台節目的「Call in」即是一種典型。

機率抽樣

簡單隨機抽樣 Simple random Sampling 這是最基本,最簡單的的機率抽樣方法。 每個個案被選取的機會是相同的。就好像把各個個案的名字寫在大小相同的紙上,放到一個箱子中,由我們抽取,每個個案都有被抽到的可能,而且機會相同。如平日常見的摸彩或搖獎,在數學上則會利用亂數表來抽取樣本。

系統隨機抽樣 Systematic random Sampling 此種抽樣方式是遵循一個固定規則的取樣方式。通常要先決定樣本的數量(n),然後按母群體的規模(N),來決定抽樣的間距(R=N/n)。將全部的個案排列起來,開始抽樣時,先用隨機的方式來決定起始點(K),抽取第一個樣本,然後將抽得的號碼逐次加上R,即可求得其餘的樣本號碼。K, K+1R, K+2R, ..........., K+(N-1)R。

分層隨機抽樣 Stratified random Sampling 選擇使用此種抽樣方法的理由如下 利用此種方式抽到的樣本,不僅能反映母群體本身的情形,同時還可以反映母群體中次分類或次團體的差異,有助於研究者了解次團體; 此種抽樣方法比簡單隨機抽樣較具有統計精確度。

分層隨機抽樣 分層抽樣方式的特點,乃是由母群體內同質的次集合中取出適當數目的樣本,而非單純地由母群體中取出樣本。 若母體中個體,異質性很高,而且分布不均勻,為使樣本能反應母體的特性,最好利用分層抽樣。分層之後,各層可以有獨立的抽樣設計,或在各層當中隨機抽取若干個體作為樣本。 在分層過程中,側重於選擇重要的「性質」作為分層標準。其原則是「層」與「層」之間要盡可能互斥,或具異質性;但「層」內部所包含的個體應儘可能相似,即層外為異質性,層內為同質性。舉例而言,若我們想對修習知識管理學程的大學生進行分層抽樣,我們可以先依年級加以分類,然後再分別由一年級、二年級、三年級、四年級中,抽出適當數目的樣本。

分層隨機抽樣 又分為兩種 定比分層抽樣法(proportionate stratified random sampling) 採用相同的比例來抽樣 異比分層隨機抽樣(disproportionate stratified random sampling) 則是不同的比例。定比分層抽樣法,將母群體按某些標準分組,然後在每組中按照相同的比例用簡單隨機或系統隨機抽樣法選取個案。異比分層隨機抽樣,即在不同組中用不同的比例來抽樣。所選用的分組標準與研究目的的相關越強越好。換言之,分組以後,要使組與組之間的差別很大,組內的差別則很小。

分層隨機抽樣

集群抽樣法 Cluster Sampling 樣本的選取是以「群」為單位能使樣本較為集中,節省調查或訪問的時間與金錢。分群抽樣的目的和分層抽樣類似,是為了反應母群體結構。 如果母群體中的個案可分為很多集群,我們可以用集群隨機抽樣法,即隨機地抽取若干集群,然後以它們所包括的個案作為研究的樣本。 選取集群時,可用簡單隨機抽樣法,也可以將集群分組以後才隨機抽取,以後者所犯的抽樣誤差比較小。

集群抽樣法 集群抽樣的好處是成本較小,特別適用於大規模的抽樣調查。 以集群抽樣作為抽樣的單位,所犯的抽樣誤差會較大,樣本的代表性通常是比不上用簡單隨機抽樣或分層隨機抽樣法。若每個集群內的個案差異大,而各個集群間差異小,則抽樣誤差會較小。 和分層抽樣最大的不同,在於分群抽樣所產生的「群」具有同質性,而每個群則包括異質性高的個體在內,就像母體的縮影。

集群抽樣法

多段抽樣法 Multi-stage Sampling 上述的各種隨機抽樣法,是可以結合運用的。 先抽取若干集體,然後從所選取的集體中再抽取若干較小的單位。

多段抽樣法 例如調查台北市高中生上網的情形,抽樣時可以分成幾個階段進行: 第一步是先選台北市的某個高中 第二步是選文組、理組的組別 第三步是選擇年級 第四步是選取若干班級 第五步再從各個班級中選取若干個人 在每個階段的抽樣時,可以用簡單隨機抽樣,也可以採用分層隨機抽樣法,在大規模的抽樣調查中,採用多段抽樣可以節省很多研究代價,包括人力、資金和時間。但是,每一個階段的抽樣都會有誤差,經過多個階段才抽出來的樣本,抽差誤差會隨之變大。

Q & A