Ch06 抽樣設計
普查 Census 母體小 元素間同質性低
抽樣定義 自母體中選取部分元素為樣本 並據以推估母體特性之過程 母體 Population: 研究者選定研究對象之集合體 樣本 Sample: 研究者自母體中抽選出元素 之集合體 母體 Population 樣本 Sample
抽樣理論 母體 Population N 統計量 母數 抽樣 Sampling: 如何最能代表母體特性 樣本 Sample n 推論 Inferences: 強調精確度,信賴度(區間) 母數
抽樣重要性 成本較低 研究執行較快 結果較精準
抽樣優點 以節約資源著眼,有效達成統計觀測目的 → 抽樣設計 調查迅速,資料較為有效 能用於普查不易實施之場合 普查求全,抽樣取精 樣本推估母數有誤差 抽樣須有母體代表性
抽樣類型 方便性 v.s. 代表性 針對一抽樣 可併用計畫與隨機原則 但方法不能混用 計畫抽樣:依研究者主觀標準之抽樣 隨機抽樣:依隨機原則之抽樣 針對一抽樣 可併用計畫與隨機原則 但方法不能混用
抽樣設計 樣本選擇 非機率抽樣 機率抽樣 未限制 簡便抽樣 簡便隨機抽樣 限制 立意抽樣 系統抽樣 配額抽樣 分層抽樣 滾雪球抽樣 集群抽樣 雙重抽樣
非機率抽樣 簡便抽樣 Convenience 立意(判斷)抽樣 Purposive/Judgment 配額抽樣 Quota 滾雪球抽樣 Snowball
簡便抽樣 隨研究者方便選用之抽樣法 如街頭訪查,徵求受試者
立意抽樣 依研究者主觀認定選用之抽樣法 如特定群體聚焦討論或專家訪談
配額抽樣 研究者設定「控制特徵」 母體依「控制特徵」區分若干子體 研究者決定各子體選擇樣本大小 於各子體內隨機抽樣
滾雪球抽樣 研究者先找若干「初始」樣本 隨初始樣本特徵發展樣本大小
隨機抽樣 簡單隨機抽樣 Simple random sampling 系統(間隔)抽樣 Systematic sampling 分層抽樣 Stratifies sampling 群集抽樣 Cluster sampling
簡單隨機抽樣 抽籤、摸彩、亂數表 為統計隨機理論基礎 對母體均質性要求高
系統抽樣 母體依序排列 (N) 區分間隔 (n),各間隔個數 k=N/n 自第一間隔隨機選一為起始點
分層抽樣 母體依某標準區分類層 於各類層中隨機抽取若干樣本 於層間差異大、層內差異小之狀況使用 樣本代表性強 比例分配 非比例分配
比例分層抽樣 ni =n ( ) 樣本抽樣個數與母體各層大小成比例 母體各層差異性不大時 樣本代表性強 母體 N,分成 k 層:N1, N2, … Nk 樣本 n ,自母體各層抽樣個數 ni 為 Ni N ni =n ( ) i = 1,2,…,k
母體層次中,同質性較高者抽樣比例宜小, 反之亦然 非比例分層抽樣 母體層次中,同質性較高者抽樣比例宜小, 反之亦然 如母體各層之標準差為 i 則樣本 n ,自母體各層抽樣個數 ni 為 Ni i Ni i ni = n ( ) i = 1,2,…,k 由上式可知 ni 與 Ni 、 i成正比,即母體某層個數多,標準差大,則抽樣個數可多;如各層標準差未知,可賦予一估計值計算
分層抽樣習作 設對一大型企業執行問卷調查,並欲區分該企業內員工、管理、及決策階層對問卷之反應。今該企業員工、管理、決策等階層人數分別為25,000 、 20,000 及 5,000 人;又初步分析各階層估計標準差值分別為 2.5, 1.5 及 2.0。 現欲抽樣 300 人,試以 1). 比例抽樣法 2). 非比例配置抽樣法 決定各層抽樣樣本數各為多少 ?
群集抽樣 程序與分層抽樣法類似,但要求條件不同 要求於層間差異小但層內差異大之狀況使用
雙重抽樣 或稱序列或多段抽樣法 依據母體特徵區分若干次群體 隨機選擇次群體 依據次群體特徵選擇樣本 可視為分層與群集抽樣法之再隨機化
抽樣法選擇考量 研究目的 母體特徵 成本:隨機 〉計畫 時間:隨機 〉計畫
影響抽樣分配因素 母體分配:母體為點二項分配,樣本和之抽樣分配為二項分配;若母體為常態分配,樣本和之抽樣分配為常態分配 樣本大小:如點二項分配母體之抽樣,n 很小時,樣本和之抽樣分配為二項分配;但如n 夠大時 ( 30),樣本和之抽樣分配趨向常態分配 樣本統計量:常態分配母體,樣本均數 X 與樣本變異數 S2 之抽樣分配不同
常態抽樣分配 Normal Distribution y ~ N (, 2) y 為均值 , 變異數 2 之常態分配變項 如設 Z = (y - ) / Z~N (0, 1) 為均值 0, 變異數 1 標準常態分配 Z 又可稱為 y 常態分配變項之標準化統計量
卡方抽樣分配 2 Chi-square Distribution 如 Z1, Z2,…, Zk ~ NID (0.1) 運用: SS 2 (yi - y)2 = ~ n-1 2 卡方分配以樣本平方和估計與檢定母數 2
t 抽樣分配 Student t Distribution 如令 Z tk = k / k 則 tk 為自由度為 k 之 t 分配 運用: 2 則 tk 為自由度為 k 之 t 分配 運用: y - S / n = t dof = n-1 t 分配用以推論母體均數 或均數差 1 - 2
F 抽樣分配 F Distribution 如令 u / u Fu,v = v / v 2 Fu,v = 則 F u,v 為自由度為 u, v 之 F 分配 運用: S1 S2 2 ~ Fn1-1, n2-1 F 分配用以推論母體變異數差異 (ANOVA)
中央極限定理 Central Limit Theorem 設一機率函數 f (x),其均數為 ,變異數為 ,由 其中抽取樣本大小 n 之樣本,得樣本均數 X 令 2 X - / n Z = 則當 n 時,Z 之分配以標準常態分配為其極限 亦即: 不論母體為何種分配,當取樣數目夠大時 (> 30),樣本均數 X (樣本和、均數和差等亦然)之抽樣分配均以常態分配為其極限