Presentation is loading. Please wait.

Presentation is loading. Please wait.

信賴區間估計 (一) Estimation with Confidence Intervals

Similar presentations


Presentation on theme: "信賴區間估計 (一) Estimation with Confidence Intervals"— Presentation transcript:

1 信賴區間估計 (一) Estimation with Confidence Intervals

2 動動腦想一想 假設你想知道銘傳大學一年級學生一星期平均用多少零用金。 你該怎麼辦呢?

3 釐清問題 1. 母體為何? 所有銘傳大學一年級學生一星期的平均零用金所成的集合

4 釐清問題 2. 希望了解的母體特性是甚麼? 是銘傳大學一年級學生一星期的平均零用金? 還是所有銘傳大學一年級學生一星期的平均零用金的總平均?
前者為隨機變數,是我們希望收集資訊的對象, 它的所有可能值形成母體。 後者為母體平均,是我們希望了解的對象。

5 統計方法 3. 如何從母體抽樣? 簡單隨機抽樣 決定抽樣誤差的範圍,例如不超過$20 決定估計的準確度,例如95%的準確度
決定樣本數,例如抽400位一年級學生

6 統計方法 4. 如何收集、整理、分析與解釋樣本資料? 敘述統計學 所抽出的一年級學生一星期的平均零用金為$910
所抽出的一年級學生一星期平均零用金的標準差為$255

7 統計方法 5. 如何從樣本統計量推論到母體參數? 推論統計學,分為估計與假設檢定 銘傳一年級學生一星期的平均零用金為$910
銘傳一年級學生一星期的平均零用金的標準差為$255 有95%信心相信所有銘傳大學一年級學生一星期的平均零用金的總平均介於$885與$935之間

8 寫報告 6. 如何寫報告? 摘要 研究的動機與目的 研究的基本假設 資料的來源與抽樣的方法 資料分析的結果 結論

9 信賴區間估計(一) 學習目標 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本)
1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) As a result of this class, you will be able to ...

10 信賴區間估計(二) 學習目標 1. 母體平均數的估計(小樣本) 母體百分比的估計 3. 樣本數的決定 4. 有限母體的抽樣校正
1. 母體平均數的估計(小樣本) 母體百分比的估計 3. 樣本數的決定 4. 有限母體的抽樣校正 As a result of this class, you will be able to ...

11 信賴區間估計(三) 學習目標 估計在查帳的應用 母體的分位與百分位 母體分位的估計
As a result of this class, you will be able to ...

12 信賴區間估計(一) 學習目標 1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本)
1. 估計的意義 2. 點估計與區間估計的差異 區間估計的意義 母體平均數的估計(大樣本) As a result of this class, you will be able to ...

13 估計的意義 Introduction to Estimation
9 4

14 統計方法的分類 估計 5

15 估計的過程 Estimation Process
母體平均數, , 未知 母體Population Sample 9

16 估計的過程 Estimation Process
隨機樣本 Random Sample Mean X= 910 母體平均數, , 未知 母體Population Sample 9

17 估計的過程 Estimation Process
隨機樣本 Random Sample Mean X= $910 母體平均數, , 未知 母體Population Sample 我有95%的信心在$885與$935之間 I am 95% confident that  is between $885 & $935. 9

18 估計母體的未知參數 使用 估計Estimate 母體參數 樣本統計 Mean   x Proportion p p Variance 
^ Proportion p p 2 2 Variance s Differences -  x - x 1 2 1 2

19 估計的方法 Estimation Methods
Point Interval Estimation Estimation 點估計 14

20 點估計 Point Estimation 點估計式 (Point Estimator) 是一個公式,告訴我們如何用樣本資料來計算未知母體參數的估計值 (Estimate) 。 點估計式是一個隨機變數,其值隨樣本而變。

21 點估計 Point Estimation 3. 例如樣本平均x 是一個母體平均數  的點估計式。若x = $910則$910是母體平均數  的點估計值。 4. 點估計式依據的基礎為抽樣分配理論

22 點估計式的評估標準 1. 不偏性 ( Unbiasedness ) 抽樣分配的平均數等於母體的平均數

23 不偏性 ( Unbiasedness ) Unbiased Biased

24 點估計式的評估標準 2. 有效性 ( Efficiency ) 最小變異不偏性 抽樣分配的標準差相較於其他估計式的標準差為小
具有最小變異數的不偏點估計式

25 Sampling distribution of mean Sampling distribution of median
有效性 ( Efficiency ) Sampling distribution of mean Sampling distribution of median

26 點估計式的評估標準 4. 一致性 ( Consistency ) 抽樣分配的標準差會隨著樣本數的增大而減小

27 一致性 ( Consistency ) Larger sample size Smaller sample size

28 樣本平均數的性質 1. 具有不偏性 2. 具有有效性 具有最小變異不偏性 4. 具有一致性 抽樣分配的平均數等於母體的平均數
1. 具有不偏性 抽樣分配的平均數等於母體的平均數 2. 具有有效性 如抽樣分配的標準差比樣本中位數的標準差小 具有最小變異不偏性 為具有最小變異數的不偏點估計式 4. 具有一致性 抽樣分配的標準差會隨著樣本數的增大而減小

29 評估估計式應注意的事項 不偏性為一個平均的性質

30 不偏性 ( Unbiasedness ) Unbiased Biased

31 評估估計式應注意的事項 2. 一致性為大樣本的性質 3. 最小變異不偏性具實用性 4. 評估標準以何者較為重要尚無定論
2. 一致性為大樣本的性質 3. 最小變異不偏性具實用性 絕對有效的估計式通常不存在或不易找到 最小變異不偏估計事經常存在且可找到 4. 評估標準以何者較為重要尚無定論 如不偏性重要還是有有效性重要?

32 不偏性 ( Unbiasedness ) Unbiased Biased

33 點估計的觀念 提供未知母體參數位置、大小的約略估計。只知道估計值靠近未知的母體參數,但有多靠近並無法得知。
1. 根據從母體中抽出的樣本觀察值,用點估計式計算一值以作為母體參數的估計。 提供未知母體參數位置、大小的約略估計。只知道估計值靠近未知的母體參數,但有多靠近並無法得知。

34 動動腦想一想 一郵寄購物公司的統計學家,希望估計上星期五由包裝部門負責包裝的客戶的郵購物品,究竟有多少件包裝有問題。他由當天所包裝的包裹中隨機抽出2%的包裹拆開檢查,發現有20件包裹的包裝有問題。這位統計學家於是報告在星期五有1,000件郵購的物品包裝有問題。這位統計學家用的是甚麼方法?

35 解答 這位統計學家用的是點估計。

36 估計的方法 Estimation Methods
Point Interval Estimation Estimation 區間估計 14

37 區間估計 Interval Estimation
未知母體參數的區間估計式是一個公式,告訴我們如何利用樣本觀察值計算一個區間的上界與下界,稱為信賴界限,使得在重複抽取樣本時,未知參數落在計算的信賴界限的比例達到需要的準確度,稱為信賴水準。 信賴界限的值隨樣本而變,是一組隨機變數,因此形成的區間是隨機區間。

38 區間估計 Interval Estimation
3. 例如 信賴區間 信賴水準

39 區間估計 Interval Estimation
當抽取隨機樣本後,可以根據事先選定的信賴水準,如0.95或95% ,再利用區間估計式計算信賴界限,如下界為$885,上界為$935。 對於上面的計算結果,我們的解釋為: 有 95%的信心相信未知母體的平均數介於$885與$935之間。

40 區間估計的觀念 1. 根據樣本觀察值計算出一區間範圍以作為估計Provides range of values:Based on observations from 1 sample 2. 給予未知母體參數估計的準確性(信賴水準) 以機率作為敘述基礎Stated in terms of probability 如要確知其機率,必需知道未知的母體參數 Knowing exact closeness requires knowing unknown population parameter 3. 例如:有 95%的信心相信未知母體的平均數介於$885與$935之間

41 下信賴界限Confidence limit (lower) 上信賴界限Confidence limit (upper)
區間估計的觀念(二) 母體參數落在此區間的機率:A probability that the population parameter falls somewhere within the interval. 信賴區間 Confidence interval 樣本統計量 Sample statistic (point estimate) 下信賴界限Confidence limit (lower) 上信賴界限Confidence limit (upper) 26

42 母體平均數的區間估計 為了方便說明區間估計的觀念起見,不防暫時假設母體分配符合常態分配。因此樣本平均數x 的抽樣分配也符合常態分配。

43 標準化樣本平均數抽樣分配 Sampling Distribution

44 標準化樣本平均數抽樣分配 Sampling Distribution Standardized Normal Distribution

45 標準化樣本平均數抽樣分配 Sampling Distribution Standardized Normal Distribution

46 母體平均數的信賴界限 Confidence Limits for Population Mean
Parameter = Statistic ?Error 上面的誤差為估計誤差 若沒有非抽樣誤差,則估計的 誤差就是抽樣誤差 27

47 母體平均數的信賴界限 Confidence Limits for Population Mean
Parameter = Statistic ?Error 27

48 區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x
90% Samples 95% Samples 99% Samples 33

49 區間估計式與信賴水準

50 區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x
90% Samples 95% Samples 99% Samples 33

51 區間估計式與信賴水準

52 區間估計式與信賴水準  x X=  ?Zx X  _ -2.58x -1.65x
90% Samples 95% Samples 99% Samples 33

53 區間估計式與信賴水準

54 區間估計式與信賴水準

55 區間估計式與信賴水準 信賴區間 信賴水準

56 信賴水準 Confidence Level 1. 未知母體參數落在信賴界限所形成信賴區間的機率
1. 未知母體參數落在信賴界限所形成信賴區間的機率 2. 機率1 -  通常以 百分數100(1 - 表示 為未知母體參數不落在信賴區間的可能性(換言之即估計錯誤的機率) 3. 常用的信賴水準為:99%, 95%, 90%

57 信賴水準與區間的關連Intervals & Confidence Level
樣本平均數的抽樣分配Sampling Distribution of Mean Notice that the interval width is determined by 1- in the sampling distribution. 各次樣本形成的信賴區間 intervals extend from X - ZX to X + ZX 100(1 - ) % 的區間包含 而100  % 的區間則未包含 做了許許多多次的信賴區間 Large number of intervals 35

58 區間估計的意義 機率的觀點 假設我們在相同的環境、信賴水準、與 樣本數下, 不停從母體重複的抽取樣本 , 並利用區間估計式計算信賴區間。 在這些計算的區間中有100(1 - ) % 的 區間包含 ,而100  % 的區間則不包 含 。

59 區間估計的意義 實際的觀點 在實際的情況中, 通常只在取定的信賴水準與樣本數下,抽一個樣本來計算信賴區間。因為這個區間是固定的,未知的母體參數落在區間的真正機率是 0 或 1 , 不是取定的100(1 - ) % 。 因為這個區間是由區間估計式計算得來,由前面的機率觀點,我們有信心相信這個區間是在重複抽樣下, 100(1 - ) % 個包含母體參數的區間中的一個。

60 影響信賴區間寬度的因素Factors Affecting Interval Width
1. 母體資料的散佈情形 影響 值 2. 樣本數Sample size X =  / n 3. 信賴水準 100(1 - )% 影響 Z值 Intervals extend from X - ZX toX + ZX Have students explain why each of these occurs. Level of confidence can be seen in the sampling distribution.

61 估計的種類與意義 總結 1. 估計的方法分為點估計與區間估計 2. 點估計式 3.區間估計 無法知道估計的準確性
評斷的標準有 : 不偏性、有效性、最小變異不偏性、一致性 3.區間估計 給予未知母體參數估計的準確性 信賴水準的機率觀點 : 重複取樣時的準確度 信賴水準的實際觀點 : 估計時的信心 As a result of this class, you will be able to ...

62 動動腦想一想 1. 平均數信賴區間的寬度會 (a) 99%的信賴區間比95%的區間窄 (b) 樣本數100的信賴區間比樣本數50的區間寬
1. 平均數信賴區間的寬度會 (a) 99%的信賴區間比95%的區間窄 (b) 樣本數100的信賴區間比樣本數50的區間寬 (c) 90%的信賴區間比95%的區間窄 (d) 樣本平均數100的信賴區間比樣本平均數50的區間寬

63 解答 (a) 99%的信賴區間會比95%的區間寬 (b) 樣本數100的信賴區間比樣本數50的區間窄(假設統計量相差不多)
(c) 90%的信賴區間比95%的區間窄 (d) 樣本平均數100的信賴區間與樣本平均數50的區間一樣寬 答案為(c)

64 動動腦想想看 一個99%的區間估計的解釋為 若抽出所有可能的樣本並計算其信賴區間,則99%的區間包含真正的母體參數
我們有99%的信心相信我們所抽的樣本計算的區間包含母體參數 以上皆是 以上皆非

65 解答 從機率的觀點解釋區間估計 從實際的觀點解釋區間估計 因此答案為 (c) 以上皆是

66 動動腦想一想 3. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算97%信賴區間為($90,000, $120,000) 。 下列的解釋何者正確? 97% 所抽到的經理每月的平均收入介於$90,000 與 $120,000 之間 。 我們有97%信心相信所抽到的經理每月的平均收入介於$90,000 與 $120,000 之間 。

67 動動腦想一想 (c) 台北市97%從事服務業的經理每月的平均收入介於$90,000 與 $120,000 之間 。
(d) 我們有97%信心相信台北市從事服務業的經理每月的平均收入的總平均介於$90,000 與 $120,000 之間 。

68 解答 答案為 (d)

69 動動腦想一想 4. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算97%信賴區間為 ($90,000, $120,000) 。 根據上述的區間,你相信台北市從事服務業的經理每月的平均收入高於 $100,000 嗎? 是的, 我有97% 的信心。 是的, 我有78% 的信心。

70 動動腦想一想 (c) 我們有97%信心相信台北市從事服務業的經理每月的平均收入為$100,000。
(d) 在97%的信心水準下,我們無法作出台北市從事服務業的經理每月的平均收入高於 $100,000 的結論。

71 解答 答案為 (d)

72 動動腦想一想 5. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算其97%信賴區間為($90,000, $120,000) 。一位台北市從事服務業的經理聲稱他每月的平均收入為$150,000。試問我們該如何回應? 我們有97%信心相信這位經理的聲明不對。 我們有100%信心相信這位經理的聲明不對 。 在97%的信心水準下,這位經理的聲明不對。 在上面的資訊下,我們無法評估這位經理的聲明。

73 解答 答案為 (d)

74 動動腦想一想 6. 設母體平均數的95%信賴區間為(52,75) 。解釋“95%的信心”的意思。
當重複抽樣時,母體的平均數有95%的機會落在這個區間。 有95%的母體觀察值會落在這個區間。 有95%的樣本觀察值會落在這個區間。 當重複抽樣時,所計算的區間有95%會包含母體的平均數。

75 解答 答案為 (d)

76 動動腦想一想 7. 設母體平均數的95%信賴區間為(52,75) 。為了從資料中得到更有用的推論, 希望能減少信賴區間的寬度。下列何者能達到這個目的? 增加樣本數。 降低信賴水準。 增加樣本數且降低信賴水準。 以上皆是。

77 解答 答案為 (d) 但是在(a)與(c)的情況有個重要的前提: 新樣本的統計量與舊樣本差不多。

78 動動腦想一想 8. 我們希望估計台北市從事服務業的經理每月的平均收入。現在隨機抽50位經理並計算其97%信賴區間為 ($90,000, $120,000) 。 根據上述的區間,台北市從事服務業的經理每月的平均收入的點估計為何? $105,000 $107,304 $116735 以上皆非

79 解答 答案為 (a) 因為信賴區間的中點為樣本平均數。

80 關於本課程... 請你靜下來想一想: 1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習?
1. 你此堂課學到的最重要的關念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? As a result of this class, you will be able to... 70


Download ppt "信賴區間估計 (一) Estimation with Confidence Intervals"

Similar presentations


Ads by Google