信賴區間估計 (一) Estimation with Confidence Intervals

Slides:



Advertisements
Similar presentations
20-Opening 統計學 授課教師:楊維寧 10Simple-R-Commands.
Advertisements

Sampling 抽樣 中央大學. 資訊管理系 范錚強 mailto: updated 11.
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
單元九:單因子變異數分析.
第 9 章 估計的介紹.
信賴區間與信心水準 內容說明: 以信賴區間與信心水準的定義來解讀 調查數據.
估計的基本概念 估計量之性質 估計之方法 區間估計之基本概念 平均數之區間估計 樣本大小.
第二單元之一: 統計估計-點估計.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
第 8 章 一組樣本 單變項推論方法.
第三章 参数估计 Parametric Estimation
抽樣與抽樣分配 7.1 抽樣問題 7.2 簡單隨機抽樣 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配 7.6 的抽樣分配
17 類別資料的分析  學習目的.
估計.
假設檢定.
Population proportion and sample proportion
Sampling Theory and Some Important Sampling Distributions
8.2 参数估计 §8.2.1 基本概念 一、估计量 估计值 人们往往知道随机变量(总体)的分布类型,但确切的函数形式并不知道,即总体的参数未知。参数估计就是要根据样本来估计出总体的未知参数。
一、緒論 1. Introduction.
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
第 7 章 抽樣與抽樣分配.
第 9 章 簡單隨機抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
第 7 章 抽樣與抽樣分配 Part B ( ).
Simple Linear Regression -4
Sampling Theory and Some Important Sampling Distributions
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
第11章 抽樣設計 本章的學習主題 1.抽樣的基本概念 2.抽樣的程序 3.機率抽樣 4.非機率抽樣 5.電話抽樣
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
第五章 抽樣與抽樣分配.
Interval Estimation區間估計
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
Workshop on Statistical Analysis
第8章 估計 點估計 區間估計與信賴區間.
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第二次電腦實習課 說明者:吳東陽 2003/10/07.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第 9 章 估 計.
信心水準與信賴區間的解讀.
第一章 緒論 1.1 統計學的意義 統計學(statistics)是一種科學方法與原理,其包括資料的蒐集,資料的整理,陳示,分析與解釋,並獲得結論,以幫助做更有效的決策。 統計學包含敘述統計學(descriptive statistics)與推論統計學(inferential statistics)。
Introduction to Basic Statistics
抽樣分配 Sampling Distributions
相關統計觀念復習 Review II.
第 7 章 推論方法.
估計與假設檢定.
Introduction to Basic Statistics
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
小學四年級數學科 8.最大公因數.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Some Important Probability Distributions
Chapter 7 信賴區間.
商用統計學 Chapter 7 估計.
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
第一章.
Introduction to Basic Statistics
Parameter Estimation and Statistical Inference
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
Introduction to Basic Statistics
信賴區間估計 (三) Estimation with Confidence Intervals
第 6 章 统计量及其抽样分布 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第七章 计量资料的统计分析.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

信賴區間估計 (一) Estimation with Confidence Intervals

動動腦想一想 假設你想知道銘傳大學一年級學生一星期平均用多少零用金。 你該怎麼辦呢?

釐清問題 1. 母體為何? 所有銘傳大學一年級學生一星期的平均零用金所成的集合

釐清問題 2. 希望了解的母體特性是甚麼? 是銘傳大學一年級學生一星期的平均零用金? 還是所有銘傳大學一年級學生一星期的平均零用金的總平均? 前者為隨機變數,是我們希望收集資訊的對象, 它的所有可能值形成母體。 後者為母體平均,是我們希望了解的對象。

統計方法 3. 如何從母體抽樣? 簡單隨機抽樣 決定抽樣誤差的範圍,例如不超過$20 決定估計的準確度,例如95%的準確度 決定樣本數,例如抽400位一年級學生

統計方法 4. 如何收集、整理、分析與解釋樣本資料? 敘述統計學 所抽出的一年級學生一星期的平均零用金為$910 所抽出的一年級學生一星期平均零用金的標準差為$255

統計方法 5. 如何從樣本統計量推論到母體參數? 推論統計學,分為估計與假設檢定 銘傳一年級學生一星期的平均零用金為$910 銘傳一年級學生一星期的平均零用金的標準差為$255 有95%信心相信所有銘傳大學一年級學生一星期的平均零用金的總平均介於$885與$935之間

寫報告 6. 如何寫報告? 摘要 研究的動機與目的 研究的基本假設 資料的來源與抽樣的方法 資料分析的結果 結論

信賴區間估計(一) 學習目標 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) As a result of this class, you will be able to ...

信賴區間估計(二) 學習目標 1. 母體平均數的估計(小樣本) 母體百分比的估計 3. 樣本數的決定 4. 有限母體的抽樣校正 1. 母體平均數的估計(小樣本) 母體百分比的估計 3. 樣本數的決定 4. 有限母體的抽樣校正 As a result of this class, you will be able to ...

信賴區間估計(三) 學習目標 估計在查帳的應用 母體的分位與百分位 母體分位的估計 As a result of this class, you will be able to ...

信賴區間估計(一) 學習目標 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) As a result of this class, you will be able to ...

估計的意義 Introduction to Estimation 9 4

統計方法的分類 估計 5

估計的過程 Estimation Process 母體平均數, , 未知 母體Population Sample  9

估計的過程 Estimation Process 隨機樣本 Random Sample Mean X= 910  母體平均數, , 未知 母體Population Sample  9

估計的過程 Estimation Process 隨機樣本 Random Sample Mean X= $910  母體平均數, , 未知 母體Population Sample  我有95%的信心在$885與$935之間 I am 95% confident that  is between $885 & $935. 9

估計母體的未知參數 使用 估計Estimate 母體參數 樣本統計 Mean   x Proportion p p Variance  ^ Proportion p p 2 2 Variance  s Differences  -   x -  x 1 2 1 2

估計的方法 Estimation Methods Point Interval Estimation Estimation 點估計 14

點估計 Point Estimation 點估計式 (Point Estimator) 是一個公式,告訴我們如何用樣本資料來計算未知母體參數的估計值 (Estimate) 。 點估計式是一個隨機變數,其值隨樣本而變。

點估計 Point Estimation 3. 例如樣本平均x 是一個母體平均數  的點估計式。若x = $910則$910是母體平均數  的點估計值。 4. 點估計式依據的基礎為抽樣分配理論

點估計式的評估標準 1. 不偏性 ( Unbiasedness ) 抽樣分配的平均數等於母體的平均數

不偏性 ( Unbiasedness ) Unbiased Biased 

點估計式的評估標準 2. 有效性 ( Efficiency ) 最小變異不偏性 抽樣分配的標準差相較於其他估計式的標準差為小 具有最小變異數的不偏點估計式

Sampling distribution of mean Sampling distribution of median 有效性 ( Efficiency ) Sampling distribution of mean Sampling distribution of median 

點估計式的評估標準 4. 一致性 ( Consistency ) 抽樣分配的標準差會隨著樣本數的增大而減小

一致性 ( Consistency ) Larger sample size Smaller sample size 

樣本平均數的性質 1. 具有不偏性 2. 具有有效性 具有最小變異不偏性 4. 具有一致性 抽樣分配的平均數等於母體的平均數 1. 具有不偏性 抽樣分配的平均數等於母體的平均數 2. 具有有效性 如抽樣分配的標準差比樣本中位數的標準差小 具有最小變異不偏性 為具有最小變異數的不偏點估計式 4. 具有一致性 抽樣分配的標準差會隨著樣本數的增大而減小

評估估計式應注意的事項 不偏性為一個平均的性質

不偏性 ( Unbiasedness ) Unbiased Biased 

評估估計式應注意的事項 2. 一致性為大樣本的性質 3. 最小變異不偏性具實用性 4. 評估標準以何者較為重要尚無定論 2. 一致性為大樣本的性質 3. 最小變異不偏性具實用性 絕對有效的估計式通常不存在或不易找到 最小變異不偏估計事經常存在且可找到 4. 評估標準以何者較為重要尚無定論 如不偏性重要還是有有效性重要?

不偏性 ( Unbiasedness ) Unbiased Biased 

點估計的觀念 提供未知母體參數位置、大小的約略估計。只知道估計值靠近未知的母體參數,但有多靠近並無法得知。 1. 根據從母體中抽出的樣本觀察值,用點估計式計算一值以作為母體參數的估計。 提供未知母體參數位置、大小的約略估計。只知道估計值靠近未知的母體參數,但有多靠近並無法得知。

動動腦想一想 一郵寄購物公司的統計學家,希望估計上星期五由包裝部門負責包裝的客戶的郵購物品,究竟有多少件包裝有問題。他由當天所包裝的包裹中隨機抽出2%的包裹拆開檢查,發現有20件包裹的包裝有問題。這位統計學家於是報告在星期五有1,000件郵購的物品包裝有問題。這位統計學家用的是甚麼方法?

解答 這位統計學家用的是點估計。

估計的方法 Estimation Methods Point Interval Estimation Estimation 區間估計 14

區間估計 Interval Estimation 未知母體參數的區間估計式是一個公式,告訴我們如何利用樣本觀察值計算一個區間的上界與下界,稱為信賴界限,使得在重複抽取樣本時,未知參數落在計算的信賴界限的比例達到需要的準確度,稱為信賴水準。 信賴界限的值隨樣本而變,是一組隨機變數,因此形成的區間是隨機區間。

區間估計 Interval Estimation 3. 例如 信賴區間 信賴水準

區間估計 Interval Estimation 當抽取隨機樣本後,可以根據事先選定的信賴水準,如0.95或95% ,再利用區間估計式計算信賴界限,如下界為$885,上界為$935。 對於上面的計算結果,我們的解釋為: 有 95%的信心相信未知母體的平均數介於$885與$935之間。

區間估計的觀念 1. 根據樣本觀察值計算出一區間範圍以作為估計Provides range of values:Based on observations from 1 sample 2. 給予未知母體參數估計的準確性(信賴水準) 以機率作為敘述基礎Stated in terms of probability 如要確知其機率,必需知道未知的母體參數 Knowing exact closeness requires knowing unknown population parameter 3. 例如:有 95%的信心相信未知母體的平均數介於$885與$935之間

下信賴界限Confidence limit (lower) 上信賴界限Confidence limit (upper) 區間估計的觀念(二) 母體參數落在此區間的機率:A probability that the population parameter falls somewhere within the interval. 信賴區間 Confidence interval 樣本統計量 Sample statistic (point estimate) 下信賴界限Confidence limit (lower) 上信賴界限Confidence limit (upper) 26

母體平均數的區間估計 為了方便說明區間估計的觀念起見,不防暫時假設母體分配符合常態分配。因此樣本平均數x 的抽樣分配也符合常態分配。

標準化樣本平均數抽樣分配 Sampling Distribution

標準化樣本平均數抽樣分配 Sampling Distribution Standardized Normal Distribution

標準化樣本平均數抽樣分配 Sampling Distribution Standardized Normal Distribution

母體平均數的信賴界限 Confidence Limits for Population Mean Parameter = Statistic ?Error 上面的誤差為估計誤差 若沒有非抽樣誤差,則估計的 誤差就是抽樣誤差 27

母體平均數的信賴界限 Confidence Limits for Population Mean Parameter = Statistic ?Error 27

區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x 90% Samples 95% Samples 99% Samples 33

區間估計式與信賴水準

區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x 90% Samples 95% Samples 99% Samples 33

區間估計式與信賴水準

區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x 90% Samples 95% Samples 99% Samples 33

區間估計式與信賴水準

區間估計式與信賴水準

區間估計式與信賴水準 信賴區間 信賴水準

信賴水準 Confidence Level 1. 未知母體參數落在信賴界限所形成信賴區間的機率 1. 未知母體參數落在信賴界限所形成信賴區間的機率 2. 機率1 -  通常以 百分數100(1 - 表示 為未知母體參數不落在信賴區間的可能性(換言之即估計錯誤的機率) 3. 常用的信賴水準為:99%, 95%, 90%

信賴水準與區間的關連Intervals & Confidence Level 樣本平均數的抽樣分配Sampling Distribution of Mean Notice that the interval width is determined by 1- in the sampling distribution. 各次樣本形成的信賴區間 intervals extend from X - ZX to X + ZX 100(1 - ) % 的區間包含 而100  % 的區間則未包含 做了許許多多次的信賴區間 Large number of intervals 35

區間估計的意義 機率的觀點 假設我們在相同的環境、信賴水準、與 樣本數下, 不停從母體重複的抽取樣本 , 並利用區間估計式計算信賴區間。 在這些計算的區間中有100(1 - ) % 的 區間包含 ,而100  % 的區間則不包 含 。

區間估計的意義 實際的觀點 在實際的情況中, 通常只在取定的信賴水準與樣本數下,抽一個樣本來計算信賴區間。因為這個區間是固定的,未知的母體參數落在區間的真正機率是 0 或 1 , 不是取定的100(1 - ) % 。 因為這個區間是由區間估計式計算得來,由前面的機率觀點,我們有信心相信這個區間是在重複抽樣下, 100(1 - ) % 個包含母體參數的區間中的一個。

影響信賴區間寬度的因素Factors Affecting Interval Width 1. 母體資料的散佈情形 影響 值 2. 樣本數Sample size X =  / n 3. 信賴水準 100(1 - )% 影響 Z值 Intervals extend from X - ZX toX + ZX Have students explain why each of these occurs. Level of confidence can be seen in the sampling distribution.

估計的種類與意義 總結 1. 估計的方法分為點估計與區間估計 2. 點估計式 3.區間估計 無法知道估計的準確性 評斷的標準有 : 不偏性、有效性、最小變異不偏性、一致性 3.區間估計 給予未知母體參數估計的準確性 信賴水準的機率觀點 : 重複取樣時的準確度 信賴水準的實際觀點 : 估計時的信心 As a result of this class, you will be able to ...

動動腦想一想 1. 平均數信賴區間的寬度會 (a) 99%的信賴區間比95%的區間窄 (b) 樣本數100的信賴區間比樣本數50的區間寬 1. 平均數信賴區間的寬度會 (a) 99%的信賴區間比95%的區間窄 (b) 樣本數100的信賴區間比樣本數50的區間寬 (c) 90%的信賴區間比95%的區間窄 (d) 樣本平均數100的信賴區間比樣本平均數50的區間寬

解答 (a) 99%的信賴區間會比95%的區間寬 (b) 樣本數100的信賴區間比樣本數50的區間窄(假設統計量相差不多) (c) 90%的信賴區間比95%的區間窄 (d) 樣本平均數100的信賴區間與樣本平均數50的區間一樣寬 答案為(c)

動動腦想想看 一個99%的區間估計的解釋為 若抽出所有可能的樣本並計算其信賴區間,則99%的區間包含真正的母體參數 我們有99%的信心相信我們所抽的樣本計算的區間包含母體參數 以上皆是 以上皆非

解答 從機率的觀點解釋區間估計 從實際的觀點解釋區間估計 因此答案為 (c) 以上皆是

動動腦想一想 3. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算97%信賴區間為($90,000, $120,000) 。 下列的解釋何者正確? 97% 所抽到的經理每月的平均收入介於$90,000 與 $120,000 之間 。 我們有97%信心相信所抽到的經理每月的平均收入介於$90,000 與 $120,000 之間 。

動動腦想一想 (c) 台北市97%從事服務業的經理每月的平均收入介於$90,000 與 $120,000 之間 。 (d) 我們有97%信心相信台北市從事服務業的經理每月的平均收入的總平均介於$90,000 與 $120,000 之間 。

解答 答案為 (d)

動動腦想一想 4. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算97%信賴區間為 ($90,000, $120,000) 。 根據上述的區間,你相信台北市從事服務業的經理每月的平均收入高於 $100,000 嗎? 是的, 我有97% 的信心。 是的, 我有78% 的信心。

動動腦想一想 (c) 我們有97%信心相信台北市從事服務業的經理每月的平均收入為$100,000。 (d) 在97%的信心水準下,我們無法作出台北市從事服務業的經理每月的平均收入高於 $100,000 的結論。

解答 答案為 (d)

動動腦想一想 5. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算其97%信賴區間為($90,000, $120,000) 。一位台北市從事服務業的經理聲稱他每月的平均收入為$150,000。試問我們該如何回應? 我們有97%信心相信這位經理的聲明不對。 我們有100%信心相信這位經理的聲明不對 。 在97%的信心水準下,這位經理的聲明不對。 在上面的資訊下,我們無法評估這位經理的聲明。

解答 答案為 (d)

動動腦想一想 6. 設母體平均數的95%信賴區間為(52,75) 。解釋“95%的信心”的意思。 當重複抽樣時,母體的平均數有95%的機會落在這個區間。 有95%的母體觀察值會落在這個區間。 有95%的樣本觀察值會落在這個區間。 當重複抽樣時,所計算的區間有95%會包含母體的平均數。

解答 答案為 (d)

動動腦想一想 7. 設母體平均數的95%信賴區間為(52,75) 。為了從資料中得到更有用的推論, 希望能減少信賴區間的寬度。下列何者能達到這個目的? 增加樣本數。 降低信賴水準。 增加樣本數且降低信賴水準。 以上皆是。

解答 答案為 (d) 但是在(a)與(c)的情況有個重要的前提: 新樣本的統計量與舊樣本差不多。

動動腦想一想 8. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算其97%信賴區間為 ($90,000, $120,000) 。 根據上述的區間,台北市從事服務業的經理每月的平均收入的點估計為何? $105,000 $107,304 $116735 以上皆非

解答 答案為 (a) 因為信賴區間的中點為樣本平均數。

關於本課程... 請你靜下來想一想: 1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? 1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? As a result of this class, you will be able to... 70