抽樣 母體與樣本 隨機與非隨機 抽樣誤差
你不必吃完整頭牛 才知道肉是老的!!
母體與樣本 科學研究之目的在於描述母體的特性 母體是一組或某一種類的受測者變數概念或現象,是我們希望求取資訊的整個範圍。 普查:母體的所有單位集合 抽樣:母體的子集合 樣本:母體的一部份,我們蒐集其資訊以便對整個母體做某些結論。 樣本須具有代表性,否則即便數量再大都研究結果無法普及化(外在效度)。 抽樣理論的主要目標在於從容易計算的樣本統計量(statistic)中來提供未知參數值(parameter)的正確估計。 統計量:是描述樣本的數字,不同的樣本統計量的值就可能改變 參數值:描述母體的數字,為一固定數字,但我們實際上無法知道參數的值
抽樣概念 民意調查—探詢人民對某些議題的意見 母體:20歲以上的台灣合格選民 樣本:從母體中選出、經由電話訪談的人,其人數在1000人至1500人之間。 市場調查—了解消費者的喜好及產品使用情況。 e.g. A.C. Nelson的電視收視率調查服務。 母體:所有九千五百萬戶有電視機的美國住戶。 樣本:約5000個住戶,住戶同意使用個人收視記錄器來紀錄該戶中每個人收視的節目。
為何要抽樣而不普查?? 普查既費時又費錢 政府才有能力負擔 缺乏時效性 失業率及其他許多變數的及時資料 精確性 產品測試 清點庫存量
母體與樣本 抽樣方法的誤差 測量誤差:測量工具所產生的不一致 抽樣誤差:樣本與母體的差異程度 E.g. 1936年美國總統大選
抽樣的考量依據 研究目的 費用與價值 時間限制 可容忍的誤差範圍
非隨機抽樣 樣本並非由數學的機率法則而來母體中每個單位被選中的機率不相同 現成樣本(方便樣本) 自願樣本 立意抽樣:故意選擇能呈現母體的樣本 無法代表母體缺乏外在效度 對於問卷前測或初探性研究有幫助 自願樣本 受試者自願參與研究計劃 可能會使研究結果產生嚴重偏差(biased) 廣播電視的Call in or TV poll; Internet poll 立意抽樣:故意選擇能呈現母體的樣本 選擇能代表母體中某特定部份的樣本 常用於廣告研究
非隨機抽樣 配額抽樣 滾雪球抽樣 偶遇抽樣 以人為方式盡可能選定一個與母體相似比例的樣本反應母體的特色 將具有顯而易見的個體納入樣本中 使用網絡來選擇樣本的過程 適合用於對研究的團體或組織所知有限的情況;溝通型態決策或團體中知識的的傳播等議題;不適用於母群體很大的研究 偶遇抽樣 基於與抽樣母體接近的便利性 常用於市場調查或新聞報導中
隨機抽樣 系統隨機抽樣 母體中每個受測者或單位被選為樣本的機率相同 簡單隨機抽樣:透過亂碼表進行 重覆隨機抽樣:被選中的受測者或單位重新放回母體有再次被選中的機會 非重覆隨機抽樣:被選中的受測者或單位不再放回母體 系統隨機抽樣 抽樣架構被切成數個等距分段 精確性有賴於 “抽樣架構”的適當性 週期問題會造成研究偏差
隨機抽樣 分層隨機抽樣:將研究母群體中特質較為相同的分為一層,分層基礎需與“變數”有關,每層不得少於10個樣本單位 比例隨機抽樣:按母體比例分來抽選應有的樣本單位 非比例隨機抽樣:無需考慮分層大小與所佔母群體的比例,根據研究需求來選擇每一層的樣本規模,常用於行銷廣告的研究 集群抽樣:在無法取得母體完整名單時可用,根據不同的社群或類別抽樣集群選擇可用簡單或分層隨機 適用於母群體很大的研究,例如:城市.州.國家等
Biased /Unbiased “如果可以重來一次 你要孩子嗎?” 專欄作家問讀者,在接到近一萬份答覆中 幾乎有70%說: NO! 每日新聞做了一個全美的SRS專業調查,調查中包含了1373位父母 其中91%答案為:Yes! 自發性回應的偏差非常顯著 SRS的不偏與精確性高
自發性回應的偏差非常顯著 SRS的不偏與精確性高