估計的基本概念 估計量之性質 估計之方法 區間估計之基本概念 平均數之區間估計 樣本大小
兩個母體平均數差之區間估計 變異數之區間估計 兩母體變異數比之區間估計 比例值之區間估計 兩母體比例值差之區間估計 容差界限 結論
9.1 估計的基本概念 9.2 估計量之性質 (1) 為 之點估計量 (1)絕對有效性(absolute efficiency) (一)不偏性(unbiased) (1) 為 之點估計量 (2) 為 之不偏估計量 (二)有效性(efficiency) (1)絕對有效性(absolute efficiency) (2)相對有效性(relative efficiency) (三)一致性(consistency) (四)充分性(sufficiency)
9.1 估計的基本概念 以樣本統計量估計母體參數的兩種方式: (一)點估計(point estimation) 利用樣本資料求得一個樣本統計量來推估母體參數的統 計方法。若母體參數以 表示,則以 表示用來估計母 體參數之樣本統計量,此樣本統計量稱為 的點估計量。 (二)區間估計(interval estimation) 利用點估計量 建構一區間 來推估母體參數 , 使得 包含於 為一特定之機率值,如95%、 90% 等。
9.2 估計量之性質(1/6) (一)不偏性(unbiased) 所謂不偏性即 的長期預期結果(期望值) 所謂不偏性即 的長期預期結果(期望值) 為 ,即 ,此時稱 為 之不偏估計量 (unbiased estimator)。 (1)若 為 之點估計量,則 稱之為 之 偏誤(bias)。 (2)若 為 之不偏估計量,則 更進一步地,若 為 之不偏估計量 則 。 參見例9.1
9.2 估計量之性質(2/6) 例題 9.1 且令 ,請問以 估計平均數 時,何者具有不偏性? 【解】 因此, 具有不偏性,而 不具不偏性。 一母體具有平均數 ,從中隨機抽取一組樣本 , 且令 ,請問以 估計平均數 時,何者具有不偏性? 【解】 因此, 具有不偏性,而 不具不偏性。
9.2 估計量之性質(3/6) (二)有效性(efficiency) (1)絕對有效性(absolute efficiency):在母體參數 的所有 估計量中,具有最小均方差之估計量 稱為 之絕對 有效性估計量。 (2)相對有效性(relative efficiency):若 、 均為 之估 計量且 ,則稱 比 具有相對有 效性。 參見例9.4
9.2 估計量之性質(4/6) 例題 9.4 承例9.2, 及 何者較具有效性? 【解】 因為 均為 之不偏估計量,所以 承例9.2, 及 何者較具有效性? 【解】 因為 均為 之不偏估計量,所以 所以, 比 具相對有效性。
9.2 估計量之性質(5/6) (三) 一致性(consistency) 若 ,則稱 為 之一致估計量。
9.2 估計量之性質(6/6) (四)充分性(sufficiency) 若 為 之點估計量,且 能充分利用樣本資 若 為 之點估計量,且 能充分利用樣本資 料的訊息,則 稱為 之充分估計量。例如, 為樣本平均數,因此 充分利用樣本中的每 一個資料,故 估計 時具有充分性。
9.3 估計之方法 9.3.1最大概似法 9.3.2 動差法 (一)概似函數(likelihood function) (二)最大概似估計量(maximum likelihood estimator) 9.3.2 動差法
9.3.1最大概似法(1/2) (一)概似函數(likelihood function) 若 為取自於具有機率函數(或機率密度函 若 為取自於具有機率函數(或機率密度函 數) 之母體之隨機樣本,其中 為此機率函 數之一參數,則 稱之為 之概似函數。 (二)最大概似估計量(maximum likelihood estimator) 參數 之最大概似估計量 為使其概似函數 最大之 值,即 參見例9.5
9.3.1最大概似法(2/2) 例題 9.5 若 取自於具有卜松分配 之母體,請問參數 之 最大概似估計量 為何? 【解】 同取ln 若 取自於具有卜松分配 之母體,請問參數 之 最大概似估計量 為何? 【解】 同取ln 使 最大時,即
若 取自於具有機率函數(或機率密度函數) 之母體之隨機樣本,其中 9.3.2 動差法(1/2) 動差法估計量 若 取自於具有機率函數(或機率密度函數) 之母體之隨機樣本,其中 為 個待估計之母體參數。令 則上式 個聯立方程式之解即為 之動差法估計量(moment estimator)。 參見例9.6
9.3.2 動差法(2/2) 例題 9.6 之動差法估計量為何? 【解】 之樣本平均數為 之動差法估計量 若 取自於具有卜松分配 之母體,請問 之動差法估計量為何? 【解】 之樣本平均數為 之動差法估計量
9.4 區間估計之基本概念 以一點估計量 為中心,再依據 之抽樣分配建構一個 估計之區間 ,使其包含母體參數為一特定之機 率值。 信賴區間 以一點估計量 為中心,再依據 之抽樣分配建構一個 估計之區間 ,使其包含母體參數為一特定之機 率值。 信賴區間 以 估計母體參數 ,若 則稱 為參數 之 之信賴區間。
9.5 平均數之區間估計 (1)母體平均數 之信賴區間 (一) 常態母體且 已知 (二) 常態母體且 未知 (三) 大樣本、 已知 (一) 常態母體且 已知 (1)母體平均數 之信賴區間 (2)估計誤差 (二) 常態母體且 未知 (三) 大樣本、 已知 (1)中央極限定理 (2)母體平均數 之信賴區間 (四) 大樣本、 未知 (2)母體平均數 之信賴區間
(1)母體平均數 之信賴區間:由變異數 之常態母體隨 9.5 平均數之區間估計(1/9) 以母體的型態及 已知與否分別探討平均數之區 間估計。 (一) 常態母體且 已知 (1)母體平均數 之信賴區間:由變異數 之常態母體隨 機抽取一組樣本個數為 之樣本,令 為其樣本平均 數,則母體平均數 之 信賴區間為
9.5 平均數之區間估計(2/9) (2)估計誤差:由變異數 之常態母體隨機抽取一組樣 本個數為 之樣本,令 為其樣本平均數,則當我 (2)估計誤差:由變異數 之常態母體隨機抽取一組樣 本個數為 之樣本,令 為其樣本平均數,則當我 們以 估計母體平均數 時,在 的信 賴水準下,其抽樣誤差不超過 。 參見例9.8
9.5 平均數之區間估計(3/9) 例題 9.8 產品重量的標準差為5公克,隨機抽取16件產品,其平均重量 為60公克。此產品平均重量之95%及99%信賴區間為何?且以 樣本平均數估計母體平均數之最大誤差為何? 【解】 (1)95%信賴區間為 估計 之最大誤差為 (2)99%信賴區間為 估計 之最大誤差為
9.5 平均數之區間估計(4/9) 母體平均數 之區間估計:若由一未知變異數之常態 (二) 常態母體且 未知 (二) 常態母體且 未知 母體平均數 之區間估計:若由一未知變異數之常態 母體隨機抽取一組樣本個數為 n 之樣本,令 、 分 別為其平均數與標準差,則母體平均數 之 信賴區間為 參見例9.9
9.5 平均數之區間估計(5/9) 例題 9.9 隨機抽取9瓶飲料作檢查,其內容量分別為98、101、102、104 、99、98、100、102及96公克,請問飲料平均內容量之信賴區 間為何?且以樣本平均數估計母體平均數之最大誤差為何? 【解】 95%信賴區間為 以 估計 之最大誤差為
9.5 平均數之區間估計(6/9) (1)中央極限定理: (三) 大樣本、 已知 (2)母體平均數 之信賴區間:若由一已知變異數 之 (三) 大樣本、 已知 (1)中央極限定理: (2)母體平均數 之信賴區間:若由一已知變異數 之 母體隨機抽取一組樣本個數為 之樣本,令 為其樣 本平均數,則當 時,母體平均數 之 信賴區間為 參見例9.10
9.5 平均數之區間估計(7/9) 例題 9.10 樣本個數64為大樣本,因此 之抽樣分配近似於常態分配 母體平均數之95%信賴區間為何? 樣本平均數為50,母體變異數為100,樣本個數為64。問其 母體平均數之95%信賴區間為何? 【解】 樣本個數64為大樣本,因此 之抽樣分配近似於常態分配 。由此可知,其母體平均數 之95%信賴區間為
9.5 平均數之區間估計(8/9) (1)中央極限定理: (四)大樣本、 未知 (2)母體平均數 之信賴區間:若由一未知變異數之母 (四)大樣本、 未知 (1)中央極限定理: (2)母體平均數 之信賴區間:若由一未知變異數之母 體隨機抽取一組樣本個數為 n 之樣本,令 、 分 別為其樣本平均數與標準差,則當 時,母體 平均數 之 信賴區間為 參見例9.11
9.5 平均數之區間估計(9/9) 例題 9.11 已知某隨機樣本之樣本平均數為30、樣本變異數為25。 (1)若此樣本之樣本個數為49,求其母體平均數之95%信賴區間。 (2)若此樣本之樣本個數為100,求其母體平均數之95%信賴區間。 【解】 (1)母體平均數之95%信賴區間為 (2)母體平均數之95%信賴區間為
9.6 樣本大小(1/3) 在大樣本條件下,可以樣本變異數 取代母體變異數 以大樣本考量,根據中央極限定理, (一) 已知 因此 即 或 。 (一) 已知 以大樣本考量,根據中央極限定理, 因此 即 或 。 (二) 未知 在大樣本條件下,可以樣本變異數 取代母體變異數 ,當樣本個數 時,我們具有95%之信心水 準 (或機率) 使得 。 參見例9.12 參見例9.13
9.6 樣本大小(2/3) 例題 9.12 若某公司產品重量之標準差為6公克,請問要取多少樣本 數方能使樣本平均數與母體平均數之差的絕對值小於或 等於1公克的機率達95%? 【解】 因此至少需139個。
9.6 樣本大小(3/3) 例題 9.13 若某保險公司欲知全體保險人之平均年齡,今隨機抽取36位 投保人得平均年齡為35歲,標準差為5歲。請問需再抽取多 少樣本數才使得樣本平均數與母體平均數差不超過1歲之機 率大於或等於95%? 【解】 共需97個樣本,然而已抽取36個樣本,因此仍需97-36= 61個樣本。
9.7 兩個母體平均數差之區間估計 (一) 獨立樣本(independent sample) (二) 成對樣本(paired sample) (1)常態母體且 、 已知 (2)常態母體且 或 未知 (3)大樣本 (二) 成對樣本(paired sample) (1)若母體為常態、 已知 (2)若母體為常態、 未知 (3)若樣本為大樣本、 已知 (4)若樣本為大樣本、 未知
9.7 兩個母體平均數差之區間估計(1/10) 兩樣本平均數差抽樣分配可以獨立樣本與成對樣本來 探討: (一)獨立樣本(independent sample) 將受測之資料分成兩群,然後再分別獨立地由此不同 的兩個群體抽取不同的樣本。以下就兩母體是否為常 態及其變異數已知與否加以探討: (1)常態母體且 、 已知:若 、 分別為取自於已知變 異數 、 之兩常態母體之獨立樣本之平均數(樣本大小 分別為 、 ),則兩母體平均數差 之 信賴區間為 參見例9.14
9.7 兩個母體平均數差之區間估計(2/10) 例題 9.14 工廠兩條生產線生產產品長度近常態,其標準差分別為6公分及 5公分。由第一條生產線抽取產品30件,第二條抽取產品20件, 得平均長度為165及163公分。請問此兩條生產線之產品平均長 度差之95%信賴區間為何?且以樣本平均數差估計兩母體平均 數差之最大誤差為何? 【解】 之95%信賴區間為 估計 之最大誤差為
9.7 兩個母體平均數差之區間估計(3/10) 時:若 、 、 、 分別為取自於未知變異數之兩常態母體之獨立樣本之平均數與變異數(樣本大 (2)常態母體且 或 未知: 時:若 、 、 、 分別為取自於未知變異數之兩常態母體之獨立樣本之平均數與變異數(樣本大 小分別為 、 ),且已知變異數 ,則兩母體平均 數差 之 信賴區間為 其中 。
9.7 兩個母體平均數差之區間估計(4/10) 時:若 、 、 、 分別為取自於未知變異 時:若 、 、 、 分別為取自於未知變異 數之兩常態母體之獨立樣本之平均數與變異數(樣本大小 分別為 、 ),則兩母體平均數差 之 信賴區間為 其中 參見例9.15
9.7 兩個母體平均數差之區間估計(5/10) 例題 9.15 隨機抽取A、B兩種產品各15件得其平均重量分別為26及25公克, 且樣本標準差分別為4及3公克,分別考慮兩母體變異數相等及兩 母體變異數不相等來計算此兩種產品平均重量差之95%信賴區間。 【解】 其95%信賴區間為 (2) 其95%信賴區間為
9.7 兩個母體平均數差之區間估計(6/10) (3)大樣本:若 、 、 、 分別為取自於兩不同母體之獨立樣本之平均數與變異數(樣本大小分別為 、 ),且兩樣本均為大樣本(即 ),則 當 、 已知時,兩母體平均數差 之 信賴 區間為 當 、 未知時:兩母體平均數差 之 信賴 、 參見例9.16
9.7 兩個母體平均數差之區間估計(7/10) 例題 9.16 調查大學學歷與碩士學歷之社會新鮮人之薪資所得之差異,隨機 抽取有大學學歷與碩士學歷之社會新鮮人各100人做調查,得其平 均薪資所得分別為30000及35000元、標準差分別為3000及2000元, 請問以此估計兩者平均薪資所得之結果為何?(考慮95%信賴水準) 【解】 其95%信賴區間為 95%信賴水準下,其平均薪資所得差為5000元,誤差 元
9.7 兩個母體平均數差之區間估計(8/10) (二)成對樣本(paired sample) 將受測之資料分成兩群,每次資料的抽取均分別由此兩個 不同之群體之相同對象各抽取一個 。 令 為一組成對樣本,且 、 分別表 樣本資料差 之平均數與變異數,則兩 母體平均數差 之 信賴區間如下: (1)若母體為常態、 已知: (2)若母體為常態、 未知: (3)若樣本為大樣本、 已知: (4)若樣本為大樣本、 未知: 參見例9.17
9.7 兩個母體平均數差之區間估計(9/10) 例題 9.17 公司瘦身者做測量,發現其三個月瘦身前後之體重如下: 某瘦身公司想瞭解其顧客瘦身的效果,於是隨機抽出15位該 公司瘦身者做測量,發現其三個月瘦身前後之體重如下: 假設瘦身前後體重差具有常態分配,求此公司顧客平均瘦身重量之95%信賴區間。 前 70 70 82 76 66 76 62 68 72 54 60 92 58 65 74 後 68 62 72 70 48 66 58 42 54 62 57 60 62 65 64
9.7 兩個母體平均數差之區間估計(10/10) 承上頁, 【解】 令 表第 個資料瘦身後減去瘦身前之體重差,則 其95%信賴區間為 令 表第 個資料瘦身後減去瘦身前之體重差,則 其95%信賴區間為 在95%信賴水準下,此瘦身公司之顧客三個月平均可瘦身3~15 公斤。
9.8 變異數之區間估計 (一)母體變異數之信賴區間 (二)母體標準差之信賴區間
9.8 變異數之區間估計(1/3) 利用抽樣分配來建立之信賴區間: (一)母體變異數之信賴區間 若 為取自於一常態母體之樣本變異數且其樣本個數 為 ,則其母體變異數 之 信賴區間為 (二)母體標準差之信賴區間 為 ,則其母體標準差 之 信賴區間為 參見例9.18 參見例9.19
9.8 變異數之區間估計(2/3) 例題 9.18 若某公司想估計產品之變異數,隨機抽取該公司所生產之產 品20件,發現此20個產品之平均重量為70公克,標準差5公 克。假設此公司生產之產品重量具有常態分配,問此公司產 品重量變異數之90%信賴區間為何? 【解】 其90%信賴區間為
9.8 變異數之區間估計(3/3) 例題 9.1 9 由例9.18得 之90%信賴區間為[15.76, 46.95],因此 承例9.18,求產品重量標準差之90%信賴區間。 【解】 由例9.18得 之90%信賴區間為[15.76, 46.95],因此 其標準差之90%信賴區間為 在90%信心水準下,其標準差介於3.97公克至6.85公克 之間。
9.9 兩母體變異數比之區間估計 9.10 比例值之區間估計 9.11 兩母體比例值差之區間估計 9.12 容差界限 9.13 結論 9.9 兩母體變異數比之區間估計 9.10 比例值之區間估計 (一)母體比例值之信賴區間 (二)母體比例值估計之誤差 (三)母體比例值估計之樣本個數 9.11 兩母體比例值差之區間估計 9.12 容差界限 9.13 結論
9.9 兩母體變異數比之區間估計(1/2) 兩母體變異數比 之信賴區間 當兩組獨立之隨機樣本取自於兩常態母體且樣本個數分 兩母體變異數比 之信賴區間 當兩組獨立之隨機樣本取自於兩常態母體且樣本個數分 別為 n 及 m 時,令 、 分別為其樣本變異數,則此 兩母體變異數比 之 信賴區間為 參見例9.20
9.9 兩母體變異數比之區間估計(2/2) 例題 9.20 某公司欲比較二條不同生產線之產品穩定性,今隨機抽取第一條 生產線25件及第二條生產線16件產品檢查,發現第一條生產線生 產之25件產品重量之變異數為36,第二條生產線之16件產品重量 之變異數為30。問此兩條生產線變異數比之90%信賴區間為何? 在90%信心水準下,兩母體變異數是否有顯著地差異? (假設兩生 產線相互獨立且所生產之產品重量均具有常態分配) 【解】 其90%信賴區間為 可能為1,無法看出兩條生產線所生產產品重量之變異數有 顯著差異。
9.10 比例值之區間估計(1/5) (一)母體比例值之信賴區間 若 表 次二項試驗中事件成功之比例值,當 若 表 次二項試驗中事件成功之比例值,當 時,則其母體比例值 之 信賴區間為 (二)母體比例值估計之誤差 若 表 次二項試驗中事件成功之比例值,則當我們 以 來估計其母體比例值 時,我們有 之 信賴水準使得估計誤差不超過 參見例9.21 參見例9.22
9.10 比例值之區間估計(2/5) 例題 9.21 某民意調查機構欲瞭解某次選舉各候選人之支持度,隨機抽取 300位選民作調查,發現支持林市長者有75位,問實際支持林 市長之比例值之95%信賴區間為何? 【解】 林市長實際支持度之95%信賴區間為 即在95%之信心水準下,林市長之民意支持度為25%,誤差 為
9.10 比例值之區間估計(3/5) 例題 9.22 某公司欲估計其生產線產品之不良率,今隨機抽取50個產品, 發現有5個不良品,請問需再抽取幾個產品作檢查,方可使得 估計誤差不超過0.05?(在95%之信賴水準條件下) 【解】 樣本個數至少要需 因此總抽樣個數至少需139,即需再抽樣139-50=89 個。
9.10 比例值之區間估計(4/5) (1)取 。 (三)母體比例值估計之樣本個數 在 信心水準下,以 估計 時,最大誤差 在 信心水準下,以 估計 時,最大誤差 不超過 所需樣本個數 的計算方式有下列兩種方式: (1)取 。 (2)採二階段抽樣,第一階段先隨機抽較少數的樣本 (至少 30個樣本),並計算樣本比例值 ( 表第一階段抽 樣之成功個數),再計算總共所需樣本 則 即為第二階段所需樣本。 參見例9.23
9.10 比例值之區間估計(5/5) 例題 9.23 在一次市政府之滿意度調查中,若想以樣本比例值來估計 市政府之滿意度,請問在95%信心水準下,欲使誤差在 之內,至少需抽取多少位市民作調查? 【解】 可代 得樣本個數 即需調查1068位市民。
9.11 兩母體比例值差之區間估計(1/2) 兩母體比例值差之信賴區間 若 及 分別為兩個母體比例值之點估計量且 若 及 分別為兩個母體比例值之點估計量且 其樣本個數分別為 、 ,則兩母體比例值差 之 信賴區間為 參見例9.24
9.11 兩母體比例值差之區間估計(2/2) 例題 9.24 承例9.21,若在另外之獨立樣本中得蔡市長候選人在300位受訪 者中有72位表示支持,請問林市長與蔡市長候選人實際支持度 差之95%信賴區間為何? 【解】 由已知條件得知 兩者實際支持度差之95%信賴區間為 在95%信心水準下,兩者實際支持度並無顯著差異。
9.12 容差界限(1/2) 若 及 分別為取自於一未知平均數與變異數之 常態母體之一組隨機樣本之平均數與變異數(樣本 若 及 分別為取自於一未知平均數與變異數之 常態母體之一組隨機樣本之平均數與變異數(樣本 大小為 ),則我們有 的信心水準, 使得 之資料值介於 其中 決定於樣本個數 、 及 值。而此區間 稱之為此母體之容差界限(tolerance limits)。 參見例9.25
9.12 容差界限(2/2) 例題 9.25 假設某一機器製造一電子零件,今隨機由此機器所製造之零 件中取10個樣本作檢查,發現其平均厚度為1.05mm,標準差 為0.05mm。請問99%信心水準包含95%此電子零件厚度之容 差界限為何? 【解】 由容差界限表 可得 因此其容差界限為
9.13 結論(1/5) 本章介紹了點估計與區間估計,其中區間估計需建立 在點估計之基礎上,而一優良之點估計量主要需包含 不偏性、有效性、一致性及充分性。另外,尋找估計 量之方法主要有兩種:最大概似法及動差法兩種。至 於在區間估計中,我們介紹了母體平均數、母體變異 數與母體比例值之區間估計,而單一母體平均數之區 間估計需視其樣本平均數之抽樣分配來建立信賴區間 ,主要可分為以下四種情形:
9.13 結論(2/5) (1)常態母體且 已知,則 之 信賴區間為 (2)常態母體且 已知,則 之 信賴區間為 (1)常態母體且 已知,則 之 信賴區間為 (2)常態母體且 已知,則 之 信賴區間為 (3)大樣本、 已知,則 之 信賴區間為 (4)大樣本、 未知,則 之 信賴區間為
9.13 結論(3/5) 兩母體平均數差之區間估計需視樣本為「成對樣本」 或「獨立樣本」而定。 (1)成對樣本:可視為單一母體平均數之區間估計。 (2)獨立樣本:視兩母體是否為常態分配、樣本是否為大樣本及變異數已知與否,利用兩樣本平均數差之抽樣分配(常態分配或 分配)來建立其信賴區間。
9.13 結論(4/5) 在變異數之區間估計中,當母體具有常態分配時,則 之 信賴區間為 在變異數之區間估計中,當母體具有常態分配時,則 之 信賴區間為 在兩變異數比之信賴區間中,在兩母體具有常態分配條件下, 之 之信賴區間為 在比例值之區間估計中,當樣本個數 且 不近 似於0時, 之 之信賴區間為
9.13 結論(5/5) 在兩比例值之區間估計中,當樣本個數 且 不近似於 0 時, 之 信賴區間為