第 7 章 抽樣與抽樣分配 Part B (7.6-7.8).

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
單元九:單因子變異數分析.
第 9 章 估計的介紹.
第二單元之一: 統計估計-點估計.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
第 6 章 連續機率分配.
第 8 章 一組樣本 單變項推論方法.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
抽樣與抽樣分配 7.1 抽樣問題 7.2 簡單隨機抽樣 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配 7.6 的抽樣分配
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
估計.
信賴區間估計 (一) Estimation with Confidence Intervals
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
Sampling Theory and Some Important Sampling Distributions
一、緒論 1. Introduction.
第 13 章 抽樣.
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配.
第 9 章 簡單隨機抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
第 13 章 抽樣.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
Sampling Methods and the Central Limit Theorem
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統計學(上)-常態分配 開南大學 教師:陳裕達 博士.
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
第五章 抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part A ( ).
第 9 章 假設檢定 Part B ( ).
第一章 直角坐標系 1-1 數系的發展.
第8章 估計 點估計 區間估計與信賴區間.
大數據與我 4A 陳駿榜.
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
統計應用 與 Microsoft Excel 簡介
統計學 指導老師: 郭燿禎 Date: 2/14/12.
信心水準與信賴區間的解讀.
第一章 緒論 1.1 統計學的意義 統計學(statistics)是一種科學方法與原理,其包括資料的蒐集,資料的整理,陳示,分析與解釋,並獲得結論,以幫助做更有效的決策。 統計學包含敘述統計學(descriptive statistics)與推論統計學(inferential statistics)。
第十章補充 允收抽樣.
第 7 章 推論方法.
估計與假設檢定.
Chapter 6 常態分配.
Definition of Trace Function
小學四年級數學科 8.最大公因數.
第 5 章 資料的蒐集和抽樣.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Some Important Probability Distributions
商用統計學 Chapter 6 抽樣與抽樣分配.
Chapter 7 信賴區間.
Review of Statistics.
Ch06 抽樣設計.
Parameter Estimation and Statistical Inference
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
抽樣設計的重點 「抽樣」(smapling)是自母群體中選取部份元素/基本單位(elements)為樣本,並且認為從選取的樣本可得知母群體的特徵。 1.有那些機率抽樣方法?特性為何? 2.有那些非機率抽樣方法?特性為何? 3.抽樣時應考慮那些要素? *
Introduction to Basic Statistics
1-1 二元一次式運算.
信賴區間估計 (三) Estimation with Confidence Intervals
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第一章 直角坐標系 1-3 函數及其圖形.
非負矩陣分解法介紹 報告者:李建德.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
品管七大手法 Class 4 健行科技大學工業管理系 助理教授 李水彬 健行科技大學工業管理系 2019/10/18.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第 7 章 抽樣與抽樣分配 Part B (7.6-7.8)

7.6 的抽樣分配 樣本比例 統計推論的過程 母體比例 從母體抽取 n 個元素 p = ? 為一簡單隨機樣本 用樣本資料計算 用 值 7.6 的抽樣分配 樣本比例 統計推論的過程 母體比例 p = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 P 值 用樣本資料計算 樣本比例 第7章 抽樣與抽樣分配 Part B (7.6-7.8)

的抽樣分配 的抽樣分配是所有樣本比例 值的機率分配。 的期望值 其中 p = 母體比例 的抽樣分配是所有樣本比例  值的機率分配。 的期望值 其中 p = 母體比例 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第278頁

的抽樣分配  的標準差 有限母體 無限母體 是母體的標準誤 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁

的抽樣分配 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 回到 EAI 的例子,以 30 位主管的簡單隨機樣本,求其樣本比例的標準誤。在 EAI 一例中,參加管理課程的主管的比例為 p=0.60,由於 n/N = 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母體校正因子,若樣本數為 30 位主管,則 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁

抽樣分配的形狀 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下兩個條件: 當樣本數夠大時, 的抽樣分配可近似為常態分配。 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下兩個條件: np ≥ 5 且 n(1 – p) ≥ 5 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第279頁

的抽樣分配的形狀 當 np ≥ 5及 n(1-p) ≥ 5, 的抽樣分配可以利用常態分配來近似。 在 EAI 一例中,有參加管理訓練課程的主管的母體比例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此, 抽樣分配可以趨近常態分配,如圖 7.8 所示。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.8

抽樣分配的實務價值 假設人事經理想要知道樣本比例 值落在母體比例±0.05 範圍內的機率;也就是樣本比例 值落在 0.55 到 0.65 間的機率。 圖 7.9的陰影部分就是此機率。我們已知 抽樣分配可以用常態分配來近似,平均數為 0.60,標準誤 =0.0894,則 =0.65 所對應的標準常態 z 值=(0.65-0.60)/0.0894=0.56,查標準常態分配表可知,對應於 z=0.56 的累積機率為 0.7123;同樣地,在 =0.55 時, z 值=(0.55 –0.60)/0.0894=-0.56。標準常態分配表可知,對應於 z= -0.56 的累積機率為 0.2877,因此,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.7123 – 0.2877=0.4246。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.9

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280-281頁 抽樣分配的實務價值 如果我們增加樣本數到 n=100,則比例的標準誤變為 樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比例 值落在母體比例 p 值±0.05 的機率值。因抽樣分配近似常態,且平均數為 0.60,標準差為0.049,利用標準常態分配表就可以計算所要的面積或機率。 當 =0.65 時,z=(0.65 – 0.60)/0.049=1.02,查標準常態分配表得知介於 z=1.02 的累積機率為 0.8461;同樣地,當 =0.55 時, z=(0.55 – 0.60)/0.049=-1.02。 介於 z=-1.02 間的面積為 0.1539,因此,若樣本大小由 30 增加為 100 時,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.8461 – 0.1539=0.6922。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280-281頁

7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 7.7 點估計量的性質 注意: θ = 母體參數 =樣本統計量或 θ 的點估計量 θ 是希臘字母,發音是theta, 則唸做 theta-hat。 一般而言,θ 代表任何母體參數,例如母體平均數、母體標準差及母體比例等; 則代表對應的樣本統計量,例如樣本平均數、樣本標準差及樣本比例。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-285頁 7.7 點估計量的性質 良好點估計量的性質有: 不偏性 有效性 一致性 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-285頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-284頁 不偏性 如果樣本統計量的期望值等於要估計的母體參數之期望值,則此樣本統計量就是母體參數的不偏估計量 (unbiased estimator)。 不偏性 樣本統計量 是母體參數 θ 的不偏估計量,如果 其中 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第283-284頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第284頁 圖7.10

有效性 假定有 n 個元素的簡單隨機樣本可以提供同一個母體參數兩個不偏估計量。此種情況下,我們會使用標準差較小的點估計量,因為它可以提供更接近母體參數的估計值。標準差較小的點估計量相對於其他點估計量,有更高的相對有效性 (relative efficiency)。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第284頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁 圖7.11

一致性 優良點估計量的另一個特性是一致性(consistency)。簡單來說,當樣本變大,點估計量的數值變得更接近母體參數時,就稱點估計量是一致的。換言之,大樣本比小樣本能提供更好的點估計值。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁

評註 我們在第 3 章說過,平均數與中位數都是集中趨勢的量數。本章只討論平均數的理由是,常態母體的母體平均數及母體中位數是相同的。而自常態母體抽樣,中位數的標準誤比平均數的標準誤大了 25%。以 EAI 問題為例,n=30,樣本平均數的標準誤是 = 730.3,中位數的標準誤則大概是 1.25(730.3) =913。因此,樣本平均數是更有效的,且有更大的機率更接近母體平均數。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第285頁

分層隨機抽樣 在分層隨機抽樣(stratified random sampling)中,母體的所有元素先被區隔成數群,稱為層(strata)。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖 7.12 是一個母體被分成 H 個層的示意圖。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁 圖7.12

分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽樣,利用公式可將各分層的樣本資訊整合成我們感興趣的母體參數估計值。 分層抽樣品質的好壞端視資料層內元素的同質性程度,如果同質性高 (元素都很相近),則層內的變異將減少,只要少量的抽樣資料就可以得到整個資料層的良好估計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣本數較少的簡單隨機抽樣相同。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

叢式抽樣 在叢式抽樣 ( cluster sampling) 中,母體首先被分出幾群,稱為叢體(clusters) 。 在理想的情況下,每一個叢體都可代表一整個母體,就像是母體的縮小版。 叢式抽樣的好壞評斷標準在於所用的叢體對母體是否有代表性。 如果每個叢體都能代表母體,則只抽出少數的叢體做樣本就可得到母體參數的良好估計值。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286頁 圖7.13

第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286-287頁 叢式抽樣 叢式抽樣主要的應用之一是地區抽樣,每一叢體可以是城市的某個區域或其他定義清楚的地區。 優點:可以達到增加樣本數,減少成本優點(如:可在短時間內蒐集許多樣本觀察值)。 缺點:此抽樣方法通常抽取的樣本數會比簡單隨機抽樣和分層隨機抽樣來得多。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第286-287頁

系統抽樣 例如,在 5000 個元素的母體中我們要抽出 50 個當作樣本,可以從每 5000/50=100 個元素中抽出一個元素。 假設我們已將母體元素依序排列。這個程序是先從前 100 個元素隨機抽出一個元素,由這個被抽中的元素開始,每隔 100 個元素,就抽出 1 個,直到抽出 50 個元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當母體元素呈隨機排序時,由於第一個被抽出的元素是隨機決定的,系統抽樣通常也被假設為具有簡單隨機抽樣的特性。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁

系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100 個元素,就抽出1 個。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁

便利抽樣 便利抽樣 (convenience sampling) 是屬於非機率抽樣 (nonprobability sampling)方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣本中的元素被抽中的機率。 例如,教授可能以自願參與實驗的學生為樣本,因為學生是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能以樣本的代表性來評估樣本的「適合度」(goodness) 。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁

判斷抽樣 使用判斷抽樣(judgment sampling)的研究者必須非常瞭解研究對象,選出他認為最能代表母體的樣本。 不能作為適合度分析。 例如一名記者可能會選出他認為最能反映全體參議員看法的兩位或三位參議員來採訪。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁

判斷抽樣 優點:樣本抽選相當簡便。 缺點:選出的樣本品質端視研究者的判斷而定 。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第287頁

評註 我們在本章推薦使用的機率抽樣方法共有:簡單隨機抽樣、分層隨機抽樣、叢式抽樣或系統抽樣,欲知這些方法所抽出的樣本統計量是否接近母體參數,我們可以用某些公式來評估其「適合度」。便利抽樣和判斷抽樣並不能做適合度分析,因此,在解釋非機率抽樣方法得到的結果時,必須非常小心。 第7章 抽樣與抽樣分配 Part B (7.6-7.8) 第288頁

End of Chapter 7, Part B