大眾媒體研究導論 Chapter 4 抽樣 第一部分 研究程序 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。 Copyright © 2008 Thomson Asia Pte. Ltd. All rights reserved.
母體與樣本 母體也就是一組或是某一種類的受試者、變數、概念或現象。 對母體的每一成員進行檢測的過程稱為普查(census)。 樣本(sample)就是母體的子群,而且可以代表整個母體。樣本最重要的就是代表性的問題。 理論上,當對母體進行調查時,僅有測量誤差(measurement error)(在研究中由測量工具產生的不一致性)的產生。從母體中抽取樣本時,就有可能產生抽樣誤差(sampling error,即樣本與母體的差異程度)。
母體與樣本
機率與非機率樣本 機率樣本(probability sample)是根據數學機率法來選取樣本,每個單位被選擇的機率是已知的。 非機率樣本(nonprobability sample)的樣本並非經由數學機率法抽樣而來。 機率樣本的抽樣誤差是無法計算的。
機率與非機率樣本 當決定採用機率或非機率樣本時,研究者應該考慮下列四點: 1.研究目的。 2.費用與價值。 3.時間限制。 4.可容忍的誤差範圍。
機率與非機率樣本 非機率樣本的類型 一個現成樣本(available sample)(亦即所知的方便樣本 [convenience sample]),就是為了研究之便,而使用一些容易接近的受試者進行調查。 自願樣本(volunteer sample)也是由非機率樣本組成的,因為個體並非按照數學機率法選出的。在所有的研究領域中都有人願意參與研究計畫,但這些人與非自願者有極大的不同,因此研究結果會有誤差產生。
機率與非機率樣本 自願性樣本不適合在科學研究中使用,但是媒介廣播電台、電視台及電視網舉行不同的民意調查卻是讓自願樣本正當化。 立意樣本(purposive sample)就是故意選擇能夠呈現母體的樣本。主要的目的,是要選出能代表母體中某個特定部分的樣本。
機率與非機率樣本 配額樣本(quota sample)是另一個類似的方法,受試者是在特定或已知的比例下被選出來的。 偶遇抽樣是另一類型的非機率抽樣,主要是依照外觀、方便性或是必須符合某項需求(例如,在研究過程中,受試者看起來符合研究的條件)
機率與非機率樣本 機率樣本的類型 簡單隨機樣本(random sample),母體中的每個受試者及單位都有相同被抽中的機會。研究者經常透過亂數表進行簡單隨機抽樣,如表4.1。
機率與非機率樣本
機率與非機率樣本 簡單隨機樣本使用在電話調查中的過程,稱為隨機撥號(random digit dialing, RDD)。
機率與非機率樣本
機率與非機率樣本
機率與非機率樣本 系統隨機抽樣(systematic random sampling),亦即從母體中每隔第n個就抽出一個受試者或是單位。 精確性有賴於抽樣架構(sampling frame)的適當性。 週期(periodicity)。亦即母體中成員的排列方式及順序會在選取過程造成偏差的產生。
機率與非機率樣本 分層樣本(stratified sample)是要將母體中的次樣本適當地表現出來。次樣本的特性(階層或部分)可以包括所有的變數:年齡、性別、 宗教等。 每分層一次,次樣本的規模就越小,發生率就越低。
機率與非機率樣本
機率與非機率樣本 分層抽樣又分為比例分層抽樣和非比例分層抽樣。 比例分層抽樣(proportionate stratified sampling),其分層的依據是以其在母體中所占的比例而定。這種抽樣方式母體中的每一個人都有同樣被選中的機會。 非比例分層抽樣(disproportionate stratified sampling),某一種特殊階層被過度抽樣或呈現。採用此方式基本上是因為這個階層被認為在行銷、廣告等非常重要。
機率與非機率樣本 集群抽樣(cluster sampling)避免這種問題的產生,亦即根據不同的社群或類別抽樣。 1.一是來自原來集群的誤差。 2.另一是集群抽樣產生的誤差。
機率與非機率樣本 「多階抽樣」(multistage sampling),它是一種集群抽樣,對個人或家戶進行抽樣(而非團體)。圖4.2及表4.2可說明此分層的方式。
機率與非機率樣本 「多階抽樣」
機率與非機率樣本
機率與非機率樣本 雪球抽樣(snowball sampling)。 研究者(研究公司或專業領域服務)隨機地和一些合格的受訪者聯繫,並且問他們所知的朋友、親人或熟人的名字,這些人也可以使研究合格。
樣本數量 1.決定樣本數量時,必須先考慮使用的研究方法。 2.研究者經常從每個團體中(例如18-24歲年齡層的成年人)抽出50、75、100 個受試者做為樣本。 3.可使用的經費及時間會決定樣本大小。 4.多變數的研究比單變數的研究需要較大的樣本數,因為牽涉到多種資料的分析(對同一受試者進行數種測量)。
樣本數量 5.對固定連續樣本研究、定點測試、焦點團體及先行招募受訪者的計畫,研究者應選取比實際需要的樣本數更多的樣本。 6.已發表的研究中,會有一些與樣本數量有關的資訊。 7.一般來說,樣本數越大越好。
抽樣誤差 抽樣誤差,是指由樣本推估而來,與由母體測量結果不符,二者之間的差距就是抽樣誤差。 只有在機率樣本中,才必須計算抽樣誤差。 中央極限定理(central limit theorem)的概念為基礎,亦即大量隨機分布,而自變數的抽樣分布(sampling distributions)會接近於常態分布(normal distributions)。 這種分布是呈「鐘型曲線」或是「常態曲線」(normal curve)。
抽樣誤差 信心水準及信賴區間 研究計畫進行後,研究者需估計研究結果在某一信心水準下的精確性,亦即研究結果落在某一特定區間中。 研究者會使用不同的信賴區間。使用較高的標準時,如95%,研究結果就具有越大的信賴度。
抽樣誤差 在每一個常態分布中,標準差的定義為,中間點與其他各點間距離的標準單位,此間隔單位(數值)可用來建立能被接受的信賴區間。 標準差亦能顯示出標準誤的數量。(一個標準差;參閱圖4.3)
抽樣誤差
抽樣誤差 計算標準誤 期望值是有關抽樣分布的平均數。而標準誤就是抽樣分布的標準差。有幾種方式可以計算標準誤(抽樣)。
抽樣誤差 有關樣本百分比的估計或是標準誤為SE(p),公式: 為連結信心水準(associated confidence level) ◎表4.3及4.4為計算過後的例子。
抽樣誤差
表4.3 樣本比例為20的誤差率
表4.4 95%和99%區間的信心水準抽樣誤差
表4.4(續)
抽樣誤差 標準誤與樣本數有關。當樣本數增加時,誤差就會減少,而樣本數減少,誤差就會增加。
抽樣誤差 有限母體校正因子 如果抽樣在小的母體群中,沒有更換樣本就直接進行了,需要藉由有限母體校正因子(Finite Population Correction Factor, FPCF)修正預估的抽樣誤差。
抽樣誤差 用來預估有限母體校正因子的公式(N=母體;n=樣本數量): ◎網路上找尋更多有關於「有線母體校正因子」 (“finite population correction factor”)
抽樣誤差 樣本加權(weighting) 當某一類型受試者的總數未能達到母體比例時,將受試者答案加倍處理(加權),以彌補差額。 受試者加權,具有爭議的操弄方法,特別是對廣播電視的收聽率。 ◎可在網路上搜尋「樣本加權」步驟(“sample weighting procedures)和「樣本加權」方法(“sample weighting” methods)。
摘要 普查就是對母體的每個成員進行調查。但對每項研究都使用普查是很不實際的做法,研究者必須有替代方法。最常被使用的替代方法就是從母體選出隨機樣本加以檢測,並做出能推論母體的預測。 隨機抽樣方式有許多種可以定義隨機樣本的項目。 研究者應判斷投入時間及成本與研究結果的關係。 研究結果並非僅針對特定樣本,亦即研究研究結果並不只侷限在所使用的樣本身上。