Download presentation
Presentation is loading. Please wait.
1
第 9 章 估計的介紹
2
先前已討論過… 第6與第7章:二項實驗、卜瓦松機率分配、常態分配與指數分配,讓我們為計算X(母體的構成元素)的機率做好準備。
我們需要以下的參數 二項實驗:p 卜瓦松機率分配:µ 常態分配:µ 和 σ 指數分配:λ 或 µ 第章 估計的介紹 第232頁
3
先前已討論過… 第8章:抽樣分配讓我們為計算統計量的機率做好準備。 我們需要以下的參數 樣本平均數:µ 和 σ 樣本比例:p
兩樣本平均數間的差異:µ1、σ1和µ2、σ2 第8章 估計的介紹 第300頁
4
接下來要討論的是… 然而,在現實中母體通常是未知的。 我們將使用抽樣分配來推論未知的母體參數。 第10章 估計的介紹 第300頁 10.4
5
統計推論 統計推論(statistical inference)是我們從樣本中獲得關於母體的資訊並且從中推導出結論的程序。
為了做推論, 我們需要敘述統計、機率分配及抽樣分配的技術和知識。 資料 統計 資訊 母體 樣本 推論 統計量 參數 第9章 估計的介紹 第232頁
6
估計的概念 有兩種對母體做推論的通用程序:估計(estimation) 與假設檢定(hypothesis testing);我們首先介紹估計的概念與基礎。 估計的目的是在樣本統計量的基礎上,決定一個母體參數的近似值。 例如: 樣本平均數( )是用來估計母體平均數()。 第9章 估計的介紹 第232頁
7
估計的概念 有兩種估計的類型: 點估計量 (point estimator) 區間估計量 (interval estimator)
第9章 估計的介紹 第 頁
8
點估計量 一個點估計量(point estimator) 藉著一個單一數值或點來估計母體的未知參數,以對母體進行推論。 先前看到連續分配的點機率幾乎是0。同樣地,我們期望點估計量會依樣本量的增加而更接近參數值。但是,點估計量沒有能力反映較大樣本的效果。因此,我們將使用區間估計量(interval estimator)估計母體參數。 第9章 估計的介紹 第 頁
9
區間估計量 一個區間估計量(interval estimator)使用一個區間來估計母體未知參數的值,以對母體進行推論。 這就是我們所說的 (有某些 ___% 的確定性) 所關注的母體參數在下限及上限的範圍之間。 第9章 估計的介紹 第233頁
10
點估計量與區間估計量 假設一位統計學教授想要估計其商學院二年學生的平均暑期收入。隨機選出25 位學生(n = 25), 計算的樣本平均週薪是$400。 點估計量 區間估計量 另一種說法: 二年級商學院學生暑期的平均週薪是介於$380 與$420 之間。 第9章 估計的介紹 第233頁
11
估計量品質 估計量品質包括不偏性 (unbiasedness)、一致性(consistency)、相對有效性(relative efficiency): 一個母體參數的不偏估計量(unbiased estimator) 是一個期望值會等於參數的估計量。 一個不偏估計量被稱為是一致的(consistent),假如隨著樣本大小的變大,估計量與參數間的差異會隨之變小。 如果一個參數有兩個不偏估計量,變異數比較小的那一個被稱為是相對有效性(relatively more efficient)。 第9章 估計的介紹 第 頁
12
不偏估計量 一個母體參數的不偏估計量(unbiased estimator) 是一個期望值會等於參數的估計量。 例:樣本平均數 是母體平均數 µ 的不偏估計量。我們敘述: E(X) = µ 第9章 估計的介紹 第 頁
13
一致性 一個不偏估計量被稱為是一致的(consistent),假如隨著樣本大小的變大,估計量與參數間的差異會隨之變小。 例: 是 µ 的一個一致性估計量,因為: 這表示當 n 增大, 的變異數會變得較小。 第9章 估計的介紹 第234頁
14
相對有效性 如果一個參數有兩個不偏估計量,變異數比較小的那一個被稱為是相對有效性(relatively more efficient)。 我們已經了解樣本平均數是母體平均數的不偏估計量,並且其變異數是2/n。樣本中位數是母體平均數的另一個估計量。統計學家已經證明樣本中位數是一個不偏估計量,但是其變異數大於樣本平均數的變異數(當母體是常態時)。 因此,當估計母體平均數時,樣本平均數相對於樣本中位數是比較有效的。 第9章 估計的介紹 第235頁
15
在母體標準差已知下估計母體平均數 在8.1節中,我們曾發展下列與樣本平均數有關的機率敘述: 以及第9章中 的抽樣分配隨著平均數 µ 與標準差 近似常態。 因此 是(近似的)標準常態分配。 第9章 估計的介紹 第236頁
16
在母體標準差已知下估計母體平均數 因此,以 Z 代入公式得到 第9.1節中(使用一些代數),我們曾發展下列與平均數的抽樣分配有關的機率敘述: 使用類似的代數運算,我們可以用稍微不同的形式表達這個機率: 第9章 估計的介紹 第236頁
17
在母體標準差已知下估計母體平均數 這項公式: 仍然是有關 的機率描述。 它也是 µ 的信賴區間估計量(confidence interval estimator of ) 。 第9章 估計的介紹 第 頁
18
在母體標準差已知下估計母體平均數 區間可以表示成 信賴下限 (Lower confidence limit) = 信賴上限 (Upper confidence limit) = 機率1 – α 是信賴水準 ,為測量區間實際包含 µ 的機率。 第9章 估計的介紹 第237頁 10.18
19
範例9.1 Doll 電腦公司 Xm10-01 Doll 電腦公司製造其專屬電腦並且直接運送給透過網路下訂單的顧客。 為了達到速度的目標,Doll 製造五種最暢銷的電腦並將其運送到全國各處的倉庫。通常只花一天的時間就可以將存放在倉庫中的電腦運送到顧客的手中。 這項策略需要高的庫存標準,而高庫存標準會增加大量的成本。 第9章 估計的介紹 第238頁
20
範例9.1 Doll 電腦公司 為了降低成本,作業經理想要使用一個存貨模型。他注意到每日的需求量與前置時間都是隨機變數。他的結論是前置時間的需求量服從常態分配,並且他必須知道平均數以計算最佳的存貨標準。 他觀察了25 段前置期間,並記錄每一次的需求量。這位經理想要一個前置期間平均需求量的95%信賴區間估計值。這位經理知道標準差是75 部電腦。 第9章 估計的介紹 第238頁
21
範例9.1 Doll 電腦公司 第9章 估計的介紹 第239頁
22
範例9.1 Doll 電腦公司 辨識方法 為了決定最佳的存貨標準,這位經理必須知道前置期間的平均需求量。 因此,要估計的參數是母體平均數: μ 所以,我們的信賴區間估計量將是: 第9章 估計的介紹 第239頁
23
範例9.1 Doll 電腦公司 計算 我們需要 4 個數值以建立 μ 的信賴區間估計值。 因此: 信賴下限與信賴上限分別是 LCL=340.76與 UCL=399.56。 370.16 1.96 75 n 25 計算數據 已給定 第9章 估計的介紹 第239頁
24
範例9.1 Doll 電腦公司 詮釋 這位作業經理估計前置期間的平均需求量介於 與 之間。在發展存貨策略時,他可以使用這個估計值當做輸入。 我們估計前置期間的平均需求量介於340.76與399.56之間,並且這類的估計量有95%正確的機會。意思就是說估計量有5%的機會是不正確的。 附帶一提,媒體通常指稱95%的數據是「20 次中的19 次」,它強調信賴水準的長期觀點。 第9章 估計的介紹 第239頁
25
詮釋信賴區間估計值 有些人錯誤地詮釋範例10.1的信賴區間估計值為:有95% 的機率母體平均數會落在340.76與 之間。 這項詮釋是不正確的,因為它暗示著母體平均數是一個變數從而我們可以對它做機率的描述。 事實上,母體平均數是一個固定但未知的數量。因此,我們不能詮釋 µ 的信賴區間估計值為 µ 的一個機率描述。 第9章 估計的介紹 第240頁
26
詮釋信賴區間估計值 為了適當地解說信賴區間估計值,我們必須記住信賴區間估計量是由樣本平均數的抽樣分配所導出。 我們使用抽樣分配對樣本平均數做機率的描述。 雖然公式已經改變,信賴區間估計量也是樣本平均數的一個機率描述。 第9章 估計的介紹 第240頁
27
詮釋信賴區間估計值 它說明有 1 ‒ α 的機率,樣本平均數將會等於一個數值,使得 到 的區間會包括母體平均數。一旦樣本平均數被計算出來,該區間成為母體平均數的區間估計值的下限與上限。 第9章 估計的介紹 第240頁
28
詮釋信賴區間估計值 舉例而言,假設我們想要從投擲一顆公正骰子的結果,估計其分配的平均值。 因為我們知道它的分配,我們也知道 µ = 3.5 和 σ = 1.71。 假設現在我們只知道 σ = 1.71,而 µ 是未知的,而且我們想要估計它的值。 第9章 估計的介紹 第240頁
29
詮釋信賴區間估計值 為了估計 μ,我們選取樣本大小 n = 100 並且計算 。μ 的信賴區間估計量是 90% 的信賴區間估計量是
第9章 估計的介紹 第240頁
30
詮釋信賴區間估計值 這個符號的意思是,如果我們從母體中重複選取大小為 100 的樣本, 90% 的 值將使得 μ 被包含在 與 而 10% 的 值將產生不包括 μ 的區間。 現在,想像我們抽出 40 個各含100 個觀測值的樣本。 的值與所得到的 μ 的信賴區間估計值呈現在表 10.2。 第9章 估計的介紹 第240頁
31
資訊與區間寬度 一個寬的區間提供很少的資訊 例如,我們以 95% 的信心估計會計師的平均起薪介於$15,000 與 $100,000之間。 與此相比較:以 95% 信賴區間估計會計師平均起薪介於$52,000 與 $55,000之間。 第二個估計窄了很多,可提供會計系學生有關平均起薪更精確的資訊。 第9章 估計的介紹 第243頁
32
資訊與區間寬度 信賴區間估計值的寬度是信賴水準(confidence level) 、母體標準差(population standard deviation)與樣本大小(sample size)的函數。 較大的信賴水準,意味著 較寬的信賴區間。 第9章 估計的介紹 第243頁
33
資訊與區間寬度 信賴區間估計值的寬度是信賴水準(confidence level) 、母體標準差(population standard deviation)與樣本大小(sample size)的函數。 較高的σ (信賴水準) 意味著 較寬的信賴區間。 第9章 估計的介紹 第243頁
34
資訊與區間寬度 信賴區間估計值的寬度是信賴水準(confidence level) 、母體標準差(population standard deviation)與樣本大小(sample size)的函數。 當信賴水準保持不變,增加樣本大小會縮減區間的寬度。 注意:增加樣本大小會增加抽樣成本。 第10章 估計的介紹 第244頁
35
選擇樣本大小 第 4 章中, 我們指出抽樣誤差為一個估計量和一個參數之間的差異。 我們也定義這種差異為估計誤差(error of estimation)。 在本章中,這種差異可以被表達為 和 μ 之間的差異。 第9章 估計的介紹 第245頁
36
選擇樣本大小 估計誤差的界限(bound on the error of estimation) 使用一些代數我們得到樣本大小用以估計平均值。 我們可以對公式中的 n 求解,如果母體標準差 σ、信賴水準1 - ,以及估計誤差的界限 B 皆為已知。為了對 n 求解,我們產生 第9章 估計的介紹 第246頁
37
選擇樣本大小 為了說明,假設在範例9.1 中,在蒐集資料之前,這位經理決定他必須將前置期間平均需求量的估計值控制在母體平均數的 16 個單位之內,此為估計誤差的界限。 我們也有 1 – α = .95 與 σ = 75。計算出 第9章 估計的介紹 第246頁
38
選擇樣本大小 因為 n 必須是整數,而且我們想要估計誤差的界線必須不超過 16 ,所以任何非整數的值必須無條件進位。 因此, n 進位之後的數值為 85,其意義是為了要有 95% 的信心去說我們的估計誤差將不會大過 16 ,我們必須隨機抽樣 85 個前置期間。 第9章 估計的介紹 第246頁
39
範例9.2 決定估計樹木平均直徑的樣本大小 一家木材公司獲得含有數千棵樹的廣大土地開採權。
範例9.2 決定估計樹木平均直徑的樣本大小 一家木材公司獲得含有數千棵樹的廣大土地開採權。 木材公司需估計在開採土地上所能收穫的木材量,以決定他們是否能夠獲取利潤。因此,他們必須估計這些樹的平均直徑。既定的決策是參數估計的準確度必須在1 吋之內,且有90% 的信心。 第9章 估計的介紹 第247頁
40
範例9.2 決定估計樹木平均直徑的樣本大小 一位熟悉該土地範圍的林務員推測這些樹的直徑服從具有標準差6 吋的常態分配。使用第326 頁的公式,他決定應該抽樣98 棵樹。在取樣98 棵樹之後,這位林務員計算的樣本平均數是25 吋。假設在他完成抽樣與計算之後,他發現實際的標準差是12 吋。對此結果,他會滿意嗎? 第9章 估計的介紹 第247頁
41
範例9.2 決定估計樹木平均直徑的樣本大小 在抽樣之前,這位林務員決定的樣本大小如下。
範例9.2 決定估計樹木平均直徑的樣本大小 在抽樣之前,這位林務員決定的樣本大小如下。 估計誤差的界限是B = 1。信賴水準是90% (1 - = .90)。因此,Z/2 = .10 且/2 = .05。接著可得到Z /2 = 1.645。母體標準差被假設為= 6。因此, 它進位之後是98 棵樹。 第9章 估計的介紹 第247頁
42
範例9.2 決定估計樹木平均直徑的樣本大小 但是,抽樣之後,林務員發現 = 12。90% 信賴區間估計值為
範例9.2 決定估計樹木平均直徑的樣本大小 但是,抽樣之後,林務員發現 = 12。90% 信賴區間估計值為 如你所見,估計誤差的界限是2 而不是1。區間是原來計畫的兩倍寬。因此得到的估計值將不會滿足所需要的精確度。 第9章 估計的介紹 第247頁
Similar presentations