第 7 章 抽樣與抽樣分配.

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第 9 章 估計的介紹.
第二單元之一: 統計估計-點估計.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
第 8 章 一組樣本 單變項推論方法.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
抽樣與抽樣分配 7.1 抽樣問題 7.2 簡單隨機抽樣 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配 7.6 的抽樣分配
17 類別資料的分析  學習目的.
認識倍數(一) 設計者:建功國小 盧建宏.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
估計.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
信賴區間估計 (一) Estimation with Confidence Intervals
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
假設檢定.
Sampling Theory and Some Important Sampling Distributions
第3章 資料的整理與表現- 統計表與統計圖.
大眾媒體研究導論 Chapter 4 抽樣 第一部分 研究程序
第 7 章 抽樣與抽樣分配 Part B ( ).
第 9 章 簡單隨機抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
Sampling Methods and the Central Limit Theorem
統計學(上)-常態分配 開南大學 教師:陳裕達 博士.
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
第五章 抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part A ( ).
第一章 直角坐標系 1-1 數系的發展.
第8章 估計 點估計 區間估計與信賴區間.
大數據與我 4A 陳駿榜.
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
統計應用 與 Microsoft Excel 簡介
統計學 指導老師: 郭燿禎 Date: 2/14/12.
信心水準與信賴區間的解讀.
第一章 直角坐標系 1-3 函數圖形.
第一章 緒論 1.1 統計學的意義 統計學(statistics)是一種科學方法與原理,其包括資料的蒐集,資料的整理,陳示,分析與解釋,並獲得結論,以幫助做更有效的決策。 統計學包含敘述統計學(descriptive statistics)與推論統計學(inferential statistics)。
數學 近似值 有效數值.
第 7 章 推論方法.
估計與假設檢定.
第七章 抽樣與抽樣分配.
Definition of Trace Function
小學四年級數學科 8.最大公因數.
第 5 章 資料的蒐集和抽樣.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Some Important Probability Distributions
商用統計學 Chapter 6 抽樣與抽樣分配.
MicroSim pspice.
Ch06 抽樣設計.
Parameter Estimation and Statistical Inference
MiRanda Java Interface v1.0的使用方法
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
抽樣設計的重點 「抽樣」(smapling)是自母群體中選取部份元素/基本單位(elements)為樣本,並且認為從選取的樣本可得知母群體的特徵。 1.有那些機率抽樣方法?特性為何? 2.有那些非機率抽樣方法?特性為何? 3.抽樣時應考慮那些要素? *
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
Introduction to Basic Statistics
第一章 直角坐標系 1-3 函數及其圖形.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第 7 章 抽樣與抽樣分配

本章內容 7.1 Electronics Associates 7.2 抽選樣本的抽樣問題 7.3 點估計 7.4 抽樣分配簡介 7.2 抽選樣本的抽樣問題 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配數 7.6 的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法

統計推論 元素:蒐集到的資料。 母體:特定研究興趣下的所有元素的集合。 樣本:母體的部分集合。 抽樣的母體 (sampled population) 是選取的樣本所 來自的母體。 底冊 (frame) 是供抽選樣本用的項目列表。 第7章 抽樣與抽樣分配 第254-255頁

統計推論 選取樣本的理由是蒐集資料以進行推論,並回答有 關母體的研究問題。 樣本結果只是母體某些特徵值的估計值。 理由是樣本只是母體的一部分。 透過適當的抽樣方法,抽樣結果可以提供母體特性 的「良好」估計值。 第7章 抽樣與抽樣分配 第255頁

7.2抽選樣本 有限母體抽樣 無限母體抽樣 第7章 抽樣與抽樣分配 第256-259頁

有限母體抽樣 有限母體通常被定義如下: 從大小為 N 的有限母體,抽出大小為 n 的簡單隨機 樣本的定義如下。 組織成員名單 信用卡帳戶號碼 庫存產品編號 從大小為 N 的有限母體,抽出大小為 n 的簡單隨機 樣本的定義如下。 某一大小為 N 的有限母體中,抽出樣本大小為 n 的簡單隨 機樣本 (simple random sample),意指大小為 n 的每個可 能樣本被抽出的機率皆相同。 第7章 抽樣與抽樣分配 第256頁

有限母體抽樣 在執行樣本挑選程序時,可利用電腦來產生亂數, Excel 有內建函數,可在工作表中產生亂數。 為了閱讀的方便,亂數表中的數字以 5 個為一組。 表 7.1 中第 1 列的每個數字,6, 3, 2, ...,是具有相 同出現機率的隨機數字。 第7章 抽樣與抽樣分配 第254-255頁

有限母體抽樣 第7章 抽樣與抽樣分配 第257頁

有限母體抽樣 進行簡單隨機抽樣時,某些亂數可能在整個樣本抽 選完畢之前即重複出現。因為我們希望每位主管的 資料只出現一次,所以任何已出現過的亂數將忽略 不計,因為這個號碼所對應的主管資料已在樣本中 。這種抽樣方式,我們稱為不歸還抽樣 (sampling without replacement)。 若在選取樣本時,允許已被抽中的主管的資料可以 在樣本中現兩次甚至更多,則此種抽樣方式稱為歸 還抽樣 (sampling with replacement)。 第7章 抽樣與抽樣分配 第257頁

無限母體抽樣 有時我們想要自母體選取樣本,但母體無限大,或 者母體元素是由持續不斷的過程所產生,所以元素 的數目沒有限制。 我們不可能建立包含母體所有元素的名冊。 我們無法由無限母體來抽選簡單隨機樣本。 第7章 抽樣與抽樣分配 第257頁

無限母體抽樣 有些情況的母體為無限,或者母體過大而必須視為 無限。 從無限母體抽出一個大小為 n 的隨機樣本 (random sample) 必須滿足下列條件: 每一個元素皆抽自相同的母體。 每一個元素皆可獨立抽出。 第7章 抽樣與抽樣分配 第258頁

無限母體抽樣 無限母體的抽樣常與持續進行的程序有關。 以下每個例子皆可視為自無限母體產生元素的過程 生產線上製造的零件 實驗室中重複的實驗 銀行中的交易 技術支援中心的來電 光臨商店的顧客 只要抽樣元素來自相同母體,而且是獨立被選出, 此樣本即可視為來自無限母體的隨機樣本。 第7章 抽樣與抽樣分配 第259頁

評註 我們在本節謹慎地定義兩種樣本:來自有限母體的簡單隨機樣 本,以及來自無限母體的隨機樣本。接下來的章節裡,將通稱 兩種樣本為隨機樣本或僅稱為樣本。除非習題或是討論的必要 ,我們將不再區分樣本是「簡單」隨機樣本。 專長自有限母體進行樣本調查的統計學家會運用能取得機率樣 本的抽樣方法。機率樣本是指每個可能樣本的選取機率已知, 而且是以隨機方式選出樣本中的元素。簡單隨機抽樣是方法之 一。7.8 節將介紹其他機率抽樣法:分層隨機抽樣、叢式抽樣 及系統抽樣。簡單隨機抽樣中的「簡單」是闡明此種機率抽樣 法確保大小為 n 的每個樣本都有相同機率被選中。 第7章 抽樣與抽樣分配 第259頁

評註 從一大小為 N 的有限母體,抽出大小為 n 的樣本 ,可能的簡單隨機樣本數是 我們在第 4 章討論過的階乘函數公式中的 EAI 問題 的 N = 2500 且 n = 30,所以,要從 2500 名主 管中抽選出 30 名,共有 2.75 × 1069 種不同的簡 單隨機樣本 第7章 抽樣與抽樣分配 第259頁

7.3 點估計 點估計是統計推論的方式之一。 在點估計中我們利用樣本平均數 算出樣本統計 量,以作為母體平均數 μ 的某一個參數的估計值。 在點估計中我們利用樣本平均數 算出樣本統計 量,以作為母體平均數 μ 的某一個參數的估計值。 用點估計的術語來說,我們稱 是母體平均數 μ 的點估計量(point estimator) 。 樣本標準差 s 是母體標準差 σ 的點估計量。 樣本比例 乃是母體比例 p 的點估計量。 第7章 抽樣與抽樣分配 第261-262頁

點估計實例 假設隨機抽出 30 位主管,其年薪和受訓資料詳列 如表 7.2 所示。 第7章 抽樣與抽樣分配 第261頁

點估計實例 表 7.3 整理各項母體參數值及其對應的點估計值。 如表7 .3 所示,點估計值與對應的母體參數監都有 些不同,此項差異是意料中之事,因為我們只是應 用樣本而非普查整個母體來進行點估計。下一章將 介紹區間估計,區間估計可以讓我們瞭解點估計值 與母體參數的接近程度。。 第7章 抽樣與抽樣分配 第262頁

實務建議 根據樣本來推論母體時,重要的是抽樣的母體與目 標母體間要有緊密對應 。 目標母體 (target population) 是我們想進行推論的 母體,抽樣母體是我們實際從中抽取樣本的母體。 只要樣本是用來推論母體,我們就應該確認研究設 計使得抽樣母體及目標母體是接近一致的。 第7章 抽樣與抽樣分配 第262頁

實務建議 考慮以下情況:主題樂園由顧客中抽出一組樣本,以 瞭解諸如遊客年紀或遊園時間等特性。 假設所有樣本元素皆是在主題樂園只開放給某家公司 員工的某天抽出的,那麼構成樣本母體的將是該公司 員工及眷屬。 假如想推論的目標母體是某個典型的夏天裡典型的遊 園客人,我們將面對的是抽樣母體與目標母體間的重 大差異。 此種情況下,我們將質疑點估計的有效性。 主題公園的管理當局最能瞭解在某個特殊營業日抽選 的樣本是否可能代表目標母體。 第7章 抽樣與抽樣分配 第262頁

7.4 抽樣分配簡介 假設我們重複同樣的抽樣程序,每次抽出 30 位主 管為樣本,並計算 與 值。 假設我們重複同樣的抽樣程序,每次抽出 30 位主 管為樣本,並計算 與 值。 表 7.4 是 500 組簡單隨機樣本的部分資料。 表 7.5 列出這 500 組 值的平均年薪的相對次數分 配,圖 7.1 為 值的相對次數直方圖。 第7章 抽樣與抽樣分配 第264頁

抽樣分配簡介 第7章 抽樣與抽樣分配 第265頁

抽樣分配簡介 第7章 抽樣與抽樣分配 第265頁

抽樣分配簡介 由於 的各種可能值是由不同的簡單隨機樣本而來 ,因此 的機率分配也就稱為 的抽樣分配 (sampling distribution) 。瞭解抽樣分配和其各項特 性可以讓我們針對樣本平均數 對母體平均數 μ 的 接近程度做出機率陳述。 從圖 7.1 這個近似圖中我們可以發現分配圖形呈鐘 形。 第7章 抽樣與抽樣分配 第264頁

抽樣分配簡介 第7章 抽樣與抽樣分配 第265頁

抽樣分配簡介 圖 7.2 則是 500 組 EAI 主管抽樣比例的 值之相對 次數直方圖,和 的情況相同, 也是隨機變數。 如果抽出所有可能的30 位主管的樣本,並計算每 組樣本的 值,得到的機率分配就是 的抽樣分配 。 圖7.2 是500 組樣本的 值之相對次數直方圖,可 以讓我們大致瞭解 的抽樣分配圖形。 第7章 抽樣與抽樣分配 第266頁

抽樣分配簡介 第7章 抽樣與抽樣分配 第266頁

7.5 的抽樣分配 的期望值 的標準差 抽樣分配的形狀 EAI 問題的 抽樣分配 抽樣分配的實務價值 樣本大小與 抽樣分配的關係 7.5  的抽樣分配 的期望值 的標準差 抽樣分配的形狀 EAI 問題的 抽樣分配 抽樣分配的實務價值 樣本大小與 抽樣分配的關係 第7章 抽樣與抽樣分配 第266-273頁

的抽樣分配 統計推論的過程 母體平均數 m = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 m 值 用樣本資料計算 用 值 推論 m 值 用樣本資料計算 樣本平均數 第7章 抽樣與抽樣分配 第266頁

的抽樣分配 的抽樣分配 的抽樣分配為樣本平均數 x 的所有可能值的機率 分配。 第7章 抽樣與抽樣分配 第266頁

的期望值 由各簡單隨機樣本所產生的所有 可能值之平均數, 也就是 的期望值 的期望值 其中 μ = 母體平均數 由各簡單隨機樣本所產生的所有 可能值之平均數, 也就是 的期望值 的期望值 其中 μ = 母體平均數 第7章 抽樣與抽樣分配 第267頁

的標準差 的標準差 有限母體 無限母體 若 n/N ≤ 0.05 則稱為有限母體。 通常被稱為有限母體校正因子        通常被稱為有限母體校正因子 (finite population correction factor)。 為平均數的標準誤 (standard error)。 第7章 抽樣與抽樣分配 第267-268頁

抽樣分配的形狀 母體為常態分配:很多情況下,我們可以合理地假 設母體為常態分配。如果母體是常態分配,無論樣 本大小, 的抽樣分配也是常態分配。 母體不是常態分配:如果母體不是常態分配,中央 極限定理 (central limit theorem)可以幫助我們決定 抽樣分配的形狀。 第7章 抽樣與抽樣分配 第268頁

中央極限定理 中央極限定理 由母體中抽出樣本大小為 n 的隨機樣本,當樣本大小 n 夠 大時,樣本平均數 的抽樣分配將趨近常態分配。 圖 7.3 顯示中央極限定理適用於三個不同母體的情 形,每一欄代表一種母體。圖形的最上列顯示每個 母體都不是常態分配。 第7章 抽樣與抽樣分配 第269頁

中央極限定理 第7章 抽樣與抽樣分配 第269頁

中央極限定理 第7章 抽樣與抽樣分配 第269頁

EAI 問題的 抽樣分配 第7章 抽樣與抽樣270頁

抽樣分配的實務價值 假設人事經理認為,如果年薪的樣本平均數落在母 體平均數 ±$500 的範圍內,就可以接受這個估計值 。然而,我們不可能保證樣本平均數必定落在母體 平均數 ±$500 的範圍內。事實上,表 7.5 和圖 7.1 顯示,500 個樣本平均數中的確有部分與母體平均 數的差距大於 $2000 。所以,我們必須以機率的角 度來思考人事經理的要求,也就是說該人事經理關 切的問題是:樣本平均數落在母體平均數 ±$500 範 圍內的機率是多少? 第7章 抽樣與抽樣分配 第270-271頁

抽樣分配的實務價值 圖 7.5是 的抽樣分配,母體平均數為 $51,800 的 情況下,人事經理想知道的是樣本平均數落在 $51,300 到 $52,300 間的機率。如果 值介於這個 區間,則 值會落在母體平均數 ±$500 的範圍內。 這個機率就是圖 7.5 的陰影區域。由於這個抽樣分 配是常態分配,平均數是 51,800,平均數的標準誤 為 730.3,我們可以查標準常態分配表得到此區域 的機率值。 第7章 抽樣與抽樣分配 第271頁

抽樣分配的實務價值 當 =52,300時, 參考常態機率分配表,得到累積機率(z = 0.68以左的面積) 為 0.7517。 當 =52,300時, 參考常態機率分配表,得到累積機率(z = 0.68以左的面積) 為 0.7517。 當 =51,300時, 得到累積機率 (z = −0.68以左的面積) 為0.2483。因此, P(51,300 ≤ ≤ 52,300) = P(z ≤ 0.68) – P(z < − 0.68) = 0.7517 − 0.2483 = 0.5034。 第7章 抽樣與抽樣分配 第271頁

抽樣分配的實務價值 第7章 抽樣與抽樣分配 第271頁

抽樣分配的實務價值 上述的計算過程顯示一個樣本大小為 30 的 EAI 主 管的簡單隨機樣本,其樣本平均數 會落在母體平 均數 ±$500 範圍內的機率為 0.5034,也就是有 1 – 0.5034=0.4966 的機率會使樣本平均數超過 和 μ =$51,800 範圍。換言之,樣本平均數有一半的機 率會落在此範圍內,但有一半的機率不會。或許我 們應該考慮更大樣本的情形,以下將探討樣本大小 與 抽樣分配之間的關係。 第7章 抽樣與抽樣分配 第271頁

樣本大小與 抽樣分配的關係 在 EAI 問題中,當 n=30,標準誤為 730.3,而當 n =100時,則標準誤降為 n=30 與 n=100 的 抽樣分配如圖 7.6。由於 n = 100 的抽樣分配有較小的標準誤,因此其 值的變 異較小,比起 n=30, 值也比較接近母體平均數 。 第7章 抽樣與抽樣分配 第272頁

樣本大小與 抽樣分配的關係 第7章 抽樣與抽樣分配 第272頁

樣本大小與 抽樣分配的關係 我們也可以利用抽樣分配計算在 n=100 時,100 位 EAI 主管簡單隨機樣本的平均數 會落在母體平 均數 ± $500範圍內的機率。因為抽樣分配為常態, 且其平均數為 51,800,標準差為 400,我們可以利 用標準常態分配表獲得面積或機率值。 在 =52,300時 (見圖7.7),我們得到 查標準常態分配表可以發現對應 z=1.25 的機率為 0.8944。 第7章 抽樣與抽樣分配 第272頁

樣本大小與 抽樣分配的關係 同樣的,在 =51,300 時,也可計算出介於 z=0 到 z=–1.25 的機率為 0.1056。因此樣本平均數落在 51,300 和 52,300 之間的機率為 0.8944 – 0.1056= 0.7888。所以,當樣本大小由 30 增加為 100 時, 樣本平均數落在母體平均數 ±$500 內的機率由 0.5034 增為0.7888。 第7章 抽樣與抽樣分配 第272頁

樣本大小與 抽樣分配的關係 第7章 抽樣與抽樣分配 271頁

評註 在 EAI 問題之 x 抽樣分配的說明中,我們假設母 體平均數 μ = 51,800 和母體標準差 σ = 4000 為 已知。但一般而言,母體平均數 μ 與母體標準差 σ 在抽樣分配時通常未知。在第 8 章中,我們將 會討論在 μ 和 σ 未知時,如何運用樣本平均數 x 和樣本標準差 s。 中央極限定理的理論證明須假設樣本內的觀察值 是獨立的,這在無限母體與歸還抽樣下的有限母 體情況下是成立的。雖然中央極限定理並不能直 接應用在不歸還抽樣下之有限母體,但實務的運 用上認為只要樣本夠大,這樣的情況也可應用中 央極限定理。 第7章 抽樣與抽樣分配 第273頁

7.6 的抽樣分配 的期望值 的標準差 抽樣分配的形狀 抽樣分配的實務價值 第7章 抽樣與抽樣分配 第276-279頁

的抽樣分配 母體比例 從母體抽取 n 個元素 p = ? 為一簡單隨機樣本 用樣本資料計算 母體比例 用 值 推論 μ 值 用 值 推論 μ 值 用樣本資料計算 母體比例 第7章 抽樣與抽樣分配 第276頁

的抽樣分配 的抽樣分配是所有樣本比例  值的機率分配。 的期望值 其中 p = 母體比例 第7章 抽樣與抽樣分配 第276頁

的抽樣分配 的標準差 是母體的標準誤 有限母體 無限母體 第7章 抽樣與抽樣分配 第277頁

的抽樣分配 一般而言,我們使用標準誤來表示點估計量的標準 差,因此也用比例的標準誤表示 的標準差。 一般而言,我們使用標準誤來表示點估計量的標準 差,因此也用比例的標準誤表示 的標準差。 回到 EAI 的例子,以 30 位主管的簡單隨機樣本, 求其樣本比例的標準誤。在 EAI 一例中,參加管理 課程的主管的比例為 p=0.60,由於 n/N = 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母 體校正因子,若樣本數為 30 位主管,則 第7章 抽樣與抽樣分配 第277頁

抽樣分配的形狀 樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本 大小必須滿足以下兩個條件: 且 樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本 大小必須滿足以下兩個條件: 且 第7章 抽樣與抽樣分配 第277頁

抽樣分配的形狀 當 np ≥ 5 及 n(1-p) ≥ 5,可以利用常態分配來近似 的抽樣分配。 在EAI 例子中有參加管理訓練課程的主管的母體比 例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此, 抽樣分配可以 趨近常態分配,如圖 7.8 所示。 第7章 抽樣與抽樣分配 第278頁

抽樣分配的形狀 第7章 抽樣與抽樣分配 第278頁

抽樣分配的實務價值 如果 EAI 問題的人事經理想要知道樣本比例 值落在 母體比例 ±0.05 範圍內的機率;也就是樣本比例 值落 在 0.55 到 0.65 間的機率。 圖 7.9 的陰影部分就是此機率。我們已知 抽樣分配可 以用常態分配來近似,平均數為 0.60,標準誤 = 0.0894,則 = 0.65 所對應的標準常態 z 值= (0.65−0.60)/0.0894 = 0.56,由標準常態分配表可知, 對應於 z = 0.56 的累積機率是 0.7123。同樣地,在 = 0.55時, z 值= (0.55 − 0.60)/0.0894 =−0.56。由標 準常態分配表可知,對應於 z =−0.56的累積機率是 0.2877 。因此,樣本比例 p 值落在母體比例 值 ±0.05 的機率為0.7123 − 0.2877 = 0.4246 第7章 抽樣與抽樣分配 第278頁

抽樣分配的實務價值 第7章 抽樣與抽樣分配 第279頁

抽樣分配的實務價值 如果我們增加樣本數到 n=100,則比例的標準誤變為 樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比 例 值落在母體比例 p 值 ±0.05 的機率值。因抽樣分配近似常態, 且平均數為 0.60,標準差為 0.049,利用標準常態分配表就可以 計算所要的面積或機率。 當 =0.65 時,z=(0.65 – 0.60)/0.049=1.02,由標準常態分配表 得知,對應於 z=1.02 的累積機率為 0.8461。同樣地,當 = 0.55 時, z=(0.55 – 0.60)/0.049=-1.02。由標準常態分配表得知, 對應於 z=-1.02 的累積機率是 0.1539,因此,若樣本大小由 30 增加為 100 ,樣本比例 值落在母體比例 值 ±0.05 的機率為 0.8461 – 0.1539=0.6922。 第7章 抽樣與抽樣分配 第278-279頁

7.7點估計量的性質 不偏性 有效性 一致性 第7章 抽樣與抽樣分配 第281-283頁

點估計量的性質 注意: θ = 母體參數 = 樣本統計量或 θ 的點估計量 θ 是希臘字母,發音是 theta, 則讀做“ theta-hat”。 一般而言,θ 代表任何母體參數,例如,母體平均數、 母體標準差及母體比例等; 則代表對應的樣本統計 量,例如,樣本平均數、樣本標準差及樣本比例。 第7章 抽樣與抽樣分配 第281頁

點估計量的性質 良好點估計量的性質有: 不偏性 有效性 一致性 第7章 抽樣與抽樣分配 第281頁

不偏性 如果樣本統計量的期望值等於要估計的母體參數之 期望值,則此樣本統計量就是母體參數的不偏估計 量 (unbiased estimator) 。 不偏性 樣本統計量 是母體參數 θ 的不偏估計量,如果 其中 =樣本統計量 的期望值 第7章 抽樣與抽樣分配 第281-282頁

不偏性 第7章 抽樣與抽樣分配 第282頁

有效性 假定有 n 個元素的簡單隨機樣本可以提供同個母體 參數兩個不偏估計量。此種情況下,我們會使用標 準差較小的點估計量,因為它可以提供更接近母體 參數的估計值。標準差較小的點估計量相對於其他 點估計量,有更高的相對有效性(relative efficiency) 。 第7章 抽樣與抽樣分配 第282頁

有效性 第7章 抽樣與抽樣分配 第283頁

一致性 優良點估計量的第三個特性是一致性(consistency) 。簡單來說,當樣本變大,點估計量的數值變得更 接近母體參數時,就稱點估計量是一致的。換言之 ,大樣本比小樣本能提供更好的點估計值。 第7章 抽樣與抽樣分配 第283頁

評註 我們在第 3 章說過,平均數與中位數都是集中位置 的量數。本章只討論平均數,理由是常態母體的母 體平均數等於母體中位數,而中位數的標準誤則約 比平均數的標準誤大 25%。EAI 問題的n =30,樣 本平均數的標準誤是 = 730.3,中位數的標準誤 則大概是 1.25 × (730.3) = 913。因此,樣本平均數 更有效,且有更大的機率接近母體平均數。 第7章 抽樣與抽樣分配 第283頁

7.8其他抽樣方法 分層隨機抽樣 叢集抽樣 系統抽樣 便利抽樣 判斷抽樣 第7章 抽樣與抽樣分配 第284-285頁

分層隨機抽樣 在分層隨機抽樣 (stratified random sampling) 中, 母體的所有元素先被區隔成數群,稱為層 (strata) 。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖 7.12 是一個母體被分成 H 個層的示意圖。 第7章 抽樣與抽樣分配 第284頁

分層隨機抽樣 第7章 抽樣與抽樣分配 第284頁

分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽 樣,利用公式可將各分層的樣本資訊整合成我們感 興趣的母體參數估計值。 分層抽樣品質的好壞端視資料層內元素的同質性程 度,如果同質性高 (元素都很相近),則層內的變異 將減少,只要少量的抽樣資料就可以得到整個資料 層的良好估計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣 本總數較少的簡單隨機抽樣相同。 第7章 抽樣與抽樣分配 第284頁

叢集抽樣 在叢集抽樣(cluster sampling) 中,首先將母體分成 幾群,稱為叢集 (clusters) 。 理想的情況下,每個叢集都可代表整個母體,就像 是母體的縮小版。 叢集抽樣的價值視所用的叢集是否足以代表母體而 定。 如果每個叢集都能代表母體,則只抽出少數的叢集 做樣本就可得到母體參數的良好估計值。 第7章 抽樣與抽樣分配 第284頁

叢集抽樣 第7章 抽樣與抽樣分配 第284頁

叢式抽樣 叢集抽樣主要的應用之一是地區抽樣,每一叢集可 以是城市的某個區域或其他定義清楚的地區。 優點:叢集抽樣可以讓我們在比較低的成本下,取 得較大的樣本 (如:可在短時間內蒐集許多樣本觀 察值) 。 缺點:此抽樣方法通常抽取的樣本數會比簡單隨機 抽樣和分層隨機抽樣來得多。 第7章 抽樣與抽樣分配 第284-285頁

系統抽樣 例如,要在 5000 個元素的母體中抽出 50 個當作樣 本,可以從每 5000/50 = 100 個元素中抽出一個元 素。 假設我們已將母體元素依序排列。這個程序是先從 前 100 個元素隨機抽出一個元素,由這個被抽中的 元素開始,每隔 100 個元素,就抽出 1 個,直到抽 出 50 個元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當 母體元素呈隨機排序時,由於第一個被抽出的元素 是隨機決定的,系統抽樣通常也被假設為具有簡單 隨機抽樣的特性。 第7章 抽樣與抽樣分配 第285頁

系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個元素,就抽出 1 個。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個元素,就抽出 1 個。 第7章 抽樣與抽樣分配 第285頁

便利抽樣 便利抽樣 (convenience sampling) 是非機率抽樣 (nonprobability sampling) 方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣 本中的元素被抽中的機率。 例如,教授可能以自願參與實驗的學生為樣本,因 為學生是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能 以樣本的代表性來評估樣本的「適合度」 (goodness) 。 第7章 抽樣與抽樣分配 第285頁

判斷抽樣 使用判斷抽樣(judgment sampling) 的研究者必須 非常瞭解研究對象,選出他認為最能代表母體的樣 本。 例如,一名記者選出他認為最能反映全體參議員看 法的兩或三位參議員進行採訪。 第7章 抽樣與抽樣分配 第285頁

判斷抽樣 優點:樣本抽選相當簡便。 缺點:樣本的品質端視研究者的判斷而定。利用此 法做統計推論時,也要特別小心。 第7章 抽樣與抽樣分配 第285頁

評註 由有限母體抽樣時,我們推薦的機率抽樣方法有: 簡單隨機抽樣、分層隨機抽樣、叢集抽樣或系統抽 樣。欲知這些方法所抽出的樣本統計量是否接近母 體參數,可以用公式來評估其「適合度」。便利抽 樣和判斷抽樣並不能做適合度分析,因此在解釋非 機率抽樣方法得到的結果時,必須非常小心。 第7章 抽樣與抽樣分配 第286頁

End of Chapter 7