Presentation is loading. Please wait.

Presentation is loading. Please wait.

商用統計學 Chapter 7 估計.

Similar presentations


Presentation on theme: "商用統計學 Chapter 7 估計."— Presentation transcript:

1 商用統計學 Chapter 7 估計

2 估計 估計,是指由母體抽出樣本,而根據樣本統計量之抽樣分配的性質,對 母體母數推測的方法。包含點估計與區間估計兩項。

3 7-1統計推論的概念 統計推論的方法 當母體分配確定之後,便要利用統計推論方法對未知母數進行推 論。在統計學上,推論方法分為兩類,一為估計 ( 包括點估計與 區間估計 ),二為檢定。如以下所示:

4 7-2點估計 點估計的意義及其導出過程 所謂點估計 (Point Estimation) 或稱點推定,即是利用樣本資 料求算一個樣本統計量,用以推估母體中未知母數的方法。例如 最常見的方式,是以樣本資料求算一個平均數 來推估母體平均 數 。因本方法只對母體未知母數提供一個可能數值,亦即只推 估一點,故稱為點估計。 茲將點估計的導出過程,說明如下: 設母體分配為 ,有一未知母數 ,今從此分配中,隨機抽取 一組樣本 ,將其作成樣本統計量 , 為

5 7-2點估計 點估計的意義及其導出過程 則 是未知母數 的估計式,稱為估計量 (Estimator) 或稱推定 式。 研究者若實際將樣本資料代入估計量內,以求得一個確定的值, 則稱為估計值 (Estimate) 或推定值 。如先求 ,再來估計母 體平均數 , 即為值計量。假設抽出 ,計算 則推論 為70,70即為估計值。

6 7-2點估計 優良估計量的評判準則 由上節說明可知,點估計量可用來估計未知的母體母數。但估計 某一未知的母體母數之點估計量往往有多種形態。如欲估計母體 平均數 ,可使用算術平均數 、中位數 或眾數 等多種,到 底孰優孰劣,就必須有一些評判標準,否則無所適從。 優良估計量其評判準則,主要有二:

7 7-2點估計 優良估計量的評判準則 所謂不偏性 (Unbiasedness),是指點估計量 之期望值等於母體 母數 ,即 稱為 的不偏估計量 (Unbiased Estimator)。 若 ,即 與 之差,稱為偏誤 (bias)。如下圖所示。

8 7-2點估計 優良估計量的評判準則 在統計學上,常見的未知母體母數之不偏估計量有 ; ; ; 等。

9 例題一 設 ,抽出一組隨機樣本 ,試判斷下列何者 為 的不偏估計量,其中 。 (1) (2) (3) (4)

10 例題一 *解 (1) (2) (3) (4) (2) (3) (4) 均為的不偏估計量。

11 7-2點估計 優良估計量的評判準則 所謂有效性 (Efficiency),是指在樣本大小n固定之下,母數 的所有不偏估計量 中,具有最小變異數者,稱為有效不偏估計 量(Efficient Unbiased Estimator)。 註:變異數愈小,平均數愈有代表性,推論準確性會愈高。

12 7-2點估計 優良估計量的評判準則 由上圖可知, ,但 ( 分配較 分配 陡 ),所以 相對於 而言,為較有效的不偏估計量。一般研究 者可用相對有效性 (Relative Effi­ciency; R.E.) 來衡量兩個 不偏估計量之有效性。 若 ,則 比 有效, , 則比 有效。

13 例題二 試就上例【例題1】,說明何者為有效估計量?其中 *解 ∵ 有效估計量的前提是,樣本大小n固定且 為 的不偏估計
量,所以以 (2) (3) (4) 比較之。 (2) (3) (4) ∵  最小,∴ 為 的有效估計量。

14 7-3區間估計的概念 區間估計的意義 所謂區間估計 (Interval Estimation),是指根據抽出的樣本資 料,先求出未知母數的點估計量 ( 即樣本估計量 ),再將點估計 量作成抽樣分配,然後利用此抽樣分配建立一個未知母數的可能 範圍之方法,稱為區間估計。此可能範圍,在估計理論上,稱為 信賴區間 (Confidence Interval)。 研究者可以下列式子表示: 式中 表示區間範圍,L表示信賴區間的下限,U表示上 限, 稱為信賴水準 (Confidence Level) 或信賴係數 (Confidence Coefficent) 或信賴度 (Degree of Confidence), 一般以百分比表示。

15 例題三 設 為已知數,自其中隨機抽出n個樣本,令 為,設信賴係數 ,試求母數平均數 的信 賴區間。 *解
為,設信賴係數 ,試求母數平均數 的信 賴區間。 *解 (1) 母體分配: ,其中 為已知。 (2) 點估計量:隨機抽樣一組樣本 ,計算 ,為未知母數 之點估計量。 抽樣分配: (A) 。 (B)標準化 。

16 例題三 機率區間: 信賴區間:解機率區間之不等式,得μ之信賴區間 ( 將機率區間各項乘以 ,再減 ,再乘以 )。 (6) 結論:信賴區間 。
信賴區間:解機率區間之不等式,得μ之信賴區間 ( 將機率區間各項乘以 ,再減 ,再乘以 )。 (6) 結論:信賴區間 。 (A) 信賴區間的下限 。 (B) 信賴區間的上限 。

17 7-3區間估計的概念 信賴水準的涵義 信賴水準或信賴係數或信賴度,其涵義是指,假設抽出100組n大 小固定的樣本,作出100個信賴區間,則信賴水準或信賴係數 0.95,即表示100個信賴區間,大約有95個信賴區間,包含了未知 的母體母數,5個信賴區間,並未包含未知的母體母數。如下圖所 示:

18 7-3區間估計的概念 信賴水準的涵義

19 例題四 統一便利商店週營業額呈常態分配,其標準差為3萬,今隨機抽取36家統一便利商店,計算出其平均週營業額為16.5萬,設信賴係數為95%,試求統一便利商店週營業額之信賴區間。 *解 (萬)

20 例題四

21 例題五 今自某小販之西瓜隨機抽取125個檢查,計算出其平均重量21.5公 斤,標準差為2.3公斤,設信賴係數為97%,試求某小販之西瓜平
均重量之信賴區間。 *解 本題並未說明母體為常態分配,且標準差未知,但∵  ,依中央極限定理,仍可用Z分配解之,母體標準差以樣本標準差 取代之。

22 7-4單一母體平均數之區間估計 . . .母體為常態分配、標準差未知且小樣本 . . . . . . . . . . . .
7-4單一母體平均數之區間估計 母體為常態分配、標準差未知且小樣本 母體為常態分配、標準差未知且小樣本之 區間估計模式,其導 出過程,如下所示 ( 設信賴係數為 ): 1. 母體分配: ,其中 為未知。 2. 點估計量:隨機抽樣一組樣本 ,計算 ,S 為未知母數 , 之點估計量。 3. 抽樣分配 ( 使用t分配 ): 分配, ( 自由度 )

23 7-4單一母體平均數之區間估計 . . .母體為常態分配、標準差未知且小樣本 . . . . . . . . . . . . . . . . . .
4. 機率區間: 5. 信賴區間:解機率區間之不等式,得 之信賴區間。

24 例題六 今隨機抽取16名台北市上班族開車上班時間調查,求算出其 分, 分。假設開車上班時間為常態分配,試求台北市上班族
分, 分。假設開車上班時間為常態分配,試求台北市上班族 平均開車上班時間之90% 信賴區間。 *解 ∵ 母體為常態分配、標準差未知且小樣本,∴ 使用t分配估計。

25 例題七 全家公司宣稱,台中市全家超商每日營業額呈常態分配,今自該 市抽出10家全家超商為一隨機樣本,營業額如下 ( 單位:千 元 ):
55, 45, 30, 48, 32, 60, 54, 35, 28, 43 設信賴係數為99%,試求全家超商每日營業額之信賴區間。 *解 ∵ 母體為常態分配但母體標準差未知且小樣本,∴ 使用t分配 估計。

26 7-5兩母體平均數差之區間估計 在進行兩個母體平均數之差異的區間估計,應先決定 之抽 樣分配,其可能為Z或t分配,如下表所示: 母體分配 母體標準差 樣本大小 抽樣分配 1.兩獨立常態母體 已知 Z 2.兩獨立常態母體 3.兩獨立母體 ( 是否常態未知 ) 未知 4.兩獨立常態母體 未知但相等 t 5.兩不獨立常態母體 未知但不相等

27 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且標準差已知 . . . . . . . . . . . . . . . . . . .
兩獨立常態母體且標準差已知,則兩母體平均數 之區間估 計模式,其導出過程,如下所示 ( 設信賴係數為 ): 1. 母體分配:設有兩個相互獨立的常態母體分配: (1) 第一個母體: 為已知。 (2) 第二個母體: 為已知。 2. 點估計量: (1) 從第一個母體隨機抽樣一組樣本 ( 個樣 本 ),計算 ,為未知母數 之點估計量。 (2) 從第二個母體隨機抽樣一組樣本 ( 個樣 (3) 以 為 之點估計量; 為 之點估計量。

28 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且標準差已知 . . . . . . . . . . . . . . . . . . .
3. 抽樣分配 ( 使用Z分配 ): (1) ; (2) 標準化 4. 機率區間:

29 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且標準差已知 . . . . . . . . . . . . . . . . . . . . . . . . .
5. 信賴區間:解機率區間之不等式,得 之信賴區間 6. 注意點:若母體分配形態與標準差均未知但為大樣本 時,由中央極限定理可知, 之抽樣分配會趨近於常態 分配,可以常態分配處理。其中母體標準差 以樣本標準誤 (S)替代。

30 例題八 茲假設兩組部份抽樣資料數據如下 ( 兩組資料獨立且呈常態分 配 ): A組: 。 B組: 。 設信賴係數為95%
(1) 試求兩組資料平均數差之信賴區間。 (2) 依此結論,A組與B組平均數是否有顯著差異?

31 例題八 *解 (1) (2) 若 之信賴區間有包括0,則兩組資料無顯著差異 ( 與 可能相等 )。
(2) 若 之信賴區間有包括0,則兩組資料無顯著差異 ( 與 可能相等 )。 ∵ 本題 之信賴區間不包括0,∴ 可能有顯著差異。

32 例題九 華碩公司招考職員,在所選出的81位男性及64位女性應徵者中, 男性的平均成績80分,標準差9分,女性平均成績77分,標準差8
分,試求 (1) 男性及女性平均成績差之99% 信賴區間。 依此結論,男性及女性平均成績是否有顯著差異? *解 (1) 本題母體分配形態與標準差均未知但為大樣本 ,可用Z分配估計解之,母體標準差以樣本標準差取代。 男性: 。

33 例題九 *解 女性: 。 (2) ∵ 本題 之信賴區間包括0, ∴ 男性及女性平均成績差可能無顯著差異。

34 7-4單一母體平均數之區間估計 . . .母體為常態分配且標準差已知 . . . . . . . . . . . . . . . . . . .
母體為常態分配且標準已知之 區間估計模式,其導出過程,如 下所示 ( 設信賴係數為 ): 1. 母體分配: ,其中 為已知。 2. 點估計量:隨機抽樣一組樣本 ,計算 ,為未知母 數 之點估計量。 3. 抽樣分配 ( 使用Z分配 ): (1) 。 (2) 標準化 。

35 7-4單一母體平均數之區間估計 . . .母體為常態分配且標準差已知 . . . . . . . . . . . . . . . . . . . . . . . . .
4. 機率區間: 5. 信賴區間:解機率區間之不等式,得 之信賴區間 6. 注意點:若母體分配與標準差均未知但為大樣本 時, 由中央極限定理 ( 見6-3-3節 ) 可知, 之抽樣分配會趨近 於常態分配,可以常態分配處理。其中母體標準差 以樣本 標準誤(S)替代。

36 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且、小樣本、標準差未知但相等 . . . .
7-5兩母體平均數差之區間估計 兩獨立常態母體且、小樣本、標準差未知但相等 兩獨立常態母體、小樣本、標準差未知但相等,兩母體平均數 之區間估計模式,其導出過程,如下所示 ( 設信賴係數 為 ): 1. 母體分配:設有兩個相互獨立的常態母體分配: (1) 第一個母體: 為未知。 (2) 第二個母體: 為未知。 (3) ( 母體標準差未知但相等 )。 2. 點估計量: (1) 從第一個母體隨機抽樣一組樣本 ,計 算 ,為未知母數 之點估計量。 (2) 從第二個母體隨機抽樣一組樣本 , 計算 ,為未知母數 之點估計量。

37 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且、小樣本、標準差未知但相等 . . . .
7-5兩母體平均數差之區間估計 兩獨立常態母體且、小樣本、標準差未知但相等 3. 抽樣分配 ( 使用t分配 ): 4. 機率區間:

38 7-5兩母體平均數差之區間估計 . . .兩獨立常態母體且、小樣本、標準差未知但相等 . . . . . . . . . . .
7-5兩母體平均數差之區間估計 兩獨立常態母體且、小樣本、標準差未知但相等 5. 信賴區間:解機率區間之不等式,得 之信賴區間。

39 7-4單一母體平均數之區間估計 一個母體平均數的區間估計,要使用到的抽樣分配,與母體分配 型態、標準差、樣本大小有關,茲先整理如下: 母體分配 母體標準差 樣本大小 抽樣分配 常態 已知 Z 未知 t

40 例題十 茲假設兩組部份抽樣資料數據如下 ( 兩組資料獨立,呈常態分 配,母體標準差未知但相等 ): A組: 。 B組: 。
設信賴係數為95%,試求兩組資料平均數差之信賴區間。 *解 ∵ 兩母體為獨立常態分配、標準差未知但相等、小樣本,∴  使用t分配估計。 (1) (2) :

41 例題十 (3)

42 例題十

43 例題十一 欲比較甲乙兩家公司員工薪資之差異,今自甲公司抽取26人為隨 機樣本,平均每月薪水 $30,000元,標準差為3,500元,自乙公司
抽16人為隨機樣本,平均每個月薪資為32,500元,標準差為3,000 元。設信賴係數為95%,兩家公司員工薪資呈常態分配,且變異數 相等,試以信賴區間方法,驗證甲公司之員工薪資與乙公司之員 工薪資是否有顯著不一樣? *解 甲公司: 。 乙公司: 。

44 例題十一 (1) (3)

45 例題十二 設A、B兩家玩具工廠每日生產量呈常態分配,且變異數相等,今 自兩家玩具工廠抽出部分天數,其生產量如下表所示,設信賴係
*解 ; ; ; ;   ( 請參考【例題7】之計算公式 ) (1)

46 例題十二 (2) (3)

47 7-5兩母體平均數差之區間估計 . . .兩不獨立常態母體、小樣本、標準差未知. . . . . . . . . . . . . . . .
7-5兩母體平均數差之區間估計 兩不獨立常態母體、小樣本、標準差未知 兩不獨立常態母體、小樣本、標準差未知,兩母體平均數 之區間估計模式,其導出過程,如下所示 ( 設信賴係數為 ): 1.母體分配:設有兩個不獨立的常態母體分配: (1) 第一個母體: 為未知。 (2) 第二個母體: 為未知。 (3) 設 。 2.點估計量:隨機成對抽取 ,計算:

48 7-5兩母體平均數差之區間估計 . . .兩不獨立常態母體、小樣本、標準差未知. . . . . . . . . . . . . . . .
7-5兩母體平均數差之區間估計 兩不獨立常態母體、小樣本、標準差未知 (1) ( 成對差的樣本平均數 ); ( 成對差的樣本變異數 ); ( 成對差的樣本 標準差 ) (2) 以 為 之點估計量; 為 之點估計量。 3. 抽樣分配 ( 使用t分配 ): ; ;

49 7-5兩母體平均數差之區間估計 . . .兩不獨立常態母體、小樣本、標準差未知. . . . . . . . . . . . . . . .
7-5兩母體平均數差之區間估計 兩不獨立常態母體、小樣本、標準差未知 4. 機率區間: 5. 信賴區間:解機率區間之不等式,得 之信賴區間

50 例題十三 下表為十家OK便利商店,在廣告A計畫實施前後之週營業額,茲設 週營業額呈常態分配,設信賴係數為95%,十家OK便利商店在廣告
*解 便利商店 1 2 3 4 5 6 7 8 9 10 實施前 40 47 50 45 42 46 48 實施後 41 43 38 44 便利商店 1 2 3 4 5 6 7 8 9 10 實施前 40 47 50 45 42 46 48 實施後 41 43 38 44 D -1 -3 -2

51 例題十三 (2) ∵ 區間包括0,∴ 廣告A計畫實施前後週營業額無明顯改變。

52 例題十三

53 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 單一母體比率P之區間估計模式 ( 設為大樣本情況 ),其導出過 程,如下所示 ( 設信賴係數為 ): 1.母體分配:點二項分配 ; ; 2.點估計量:隨機抽樣一組樣本 ( 設為大樣本,當 且 成立時,依中央極限定理, 分配趨近 常態分配 ),計算 ( 表示成功的次數 ),以 為未知母數P之點估計量。

54 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 3. 抽樣分配 ( 使用Z分配 ): (1) 。 標準化 。 4. 機率區間:

55 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 5. 信賴區間:解機率區間之不等式,得P之信賴區間。 6. 注意點:若為大樣本,而母體比率P未知,則以 取代。

56 7-4單一母體平均數之區間估計 在統計學上,所要探討的區間估計,大略如下表所示:

57 例題十四 彰化銀行從2,000件放款案件中,發現有300件為逾期放款。設信 賴係數為95%,試求彰化銀行逾期放款比例之信賴區間。 *解

58 例題十四

59 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 兩獨立母體 比率差之區間估計 ( 設為大樣本情況 ),其導 出過程,如下所示 ( 設信賴係數為 ): 1. 母體分配:設有兩個相互獨立的點二項分配: (1) 第一個母體 : ; (2) 第二個母體: ; ; 2. 點估計量: (1) 從第一個母體隨機抽樣一組樣本 ,計算 ( 表示成功的次數 )。 (2) 從第二個母體隨機抽樣一組樣本 ,計算 (3) 以 為 之點估計量。

60 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 3. 抽樣分配 ( 使用Z分配 ): (1) 。 (2) 標準化 。 4. 機率區間:

61 7-6母體比率之區間估計 . . .單一母體比率之區間估計(設為大樣本情況) . . . . . . . .
7-6母體比率之區間估計 單一母體比率之區間估計(設為大樣本情況) 信賴區間:解機率區間之不等式,得 之信賴區間。 6. 注意點:若為為大樣本 ( 比照7-6-1大樣本之說明 ),而母體比率P未知,則以 取代。

62 例題十五 為了解Nokia手機在甲乙兩地的使用率,乃自甲地抽出300人,有
兩地使用比率差之95% 信賴區間。 *解 ∵ 為大樣本,∴ 以 代替P。 ; ;

63 例題十五 *解 ∵ 為大樣本,∴ 以 代替P。 ; ;

64 例題十五

65 7-7樣本大小的準定 . . .估計母體平均數 之樣本大小 . . . . . . . . . . . . . . . . . . . . . . . . .
研究者以點估計量來估計母體母數,必然會有誤差產生,除非點估 計量剛好等於未知母數。誤差之大小,以點估計量與母數二者差之 絕對值表示。在 的信賴係數下,以樣本平均數 來估計母體未 知母數 ,其估計誤差為 ,如下圖所示:

66 7-7樣本大小的準定 . . .估計母體平均數 之樣本大小 . . . . . . . . . . . . . . . . . . . . . . . . .
由上圖可知,估計誤差 ,經等號兩邊平方可推得

67 例題十六 統一便利商店年營業額呈常態分配,該公司欲估計年營業額希望 誤差小於3萬的機率為95%,試求就下列各別情況,應取多少樣 本?
(1) 根據過去資料顯示,年營業額標準差為30萬。 (2) 設母體標準差未知,先抽出30家便利商店,計算標準差25萬。 *解 (1)

68 例題十六 (2) ≒267 ( 需再抽出237家便利商店 )

69 7-7樣本大小的準定 . . .估計母體比例P之樣本大小 . . . . . . . . . . . . . . . . . . . . . . . . . . .
設在 之信賴係數下,以樣本比例 來估計母體未知母體比例 P,其估計誤差以 表示,如下圖所示:

70 7-7樣本大小的準定 . . .估計母體比例P之樣本大小 . . . . . . . . . . . . . . . . . . . .
由上圖可知,估計誤差 ,經等號兩邊平方 可推得 在上式中 1. 當母體比率P為已知時,直接以P代入該式。 2. 當P未知時,以樣本比率 取代P或以 代替 ( 保守作 法 )。

71 例題十七 華碩電腦公司想了解在台灣地區使用該公司品牌的比例。若該公 司希望估計誤差小於5% 的機率為97%,試求就下列個別情況,應
取多少樣本? (1) 根據過去資料顯示,台灣地區使用華碩電腦為15%。 (2) 先抽出50人,計算其使用華碩電腦為12%。 (3) 假設台灣地區使用華碩電腦品牌的比例未知。 *解 (1)

72 例題十七 ≒199 ( 需再抽出149人 )

73 例題十七 ≒471 由以上可知此, 乃以極大值去估計樣本n,是最保守的作法 ( 樣本數471最大 )。


Download ppt "商用統計學 Chapter 7 估計."

Similar presentations


Ads by Google