第 7 章 抽樣與抽樣分配 Part A (7.1-7.5)
統計實例 MeadWestvaco公司是一家多角 化的紙製品、辦公室用品及特 殊化學品的製造商;公司的產 品有紙、紙漿、木材、厚紙板 和飲料的包裝紙等。 MeadWestvaco公司擁有很大的林地以提供生產時所需的原料。 公司主管需要正確地瞭解林地的相關資訊,以評估公司符合未來原料需求的能力。 這些資訊包括目前的森林數量、過去森林的成長數量、未來森林的成長率等。有了這些重要資訊,MeadWestvaco 的主管就能夠發展培育和砍伐森林的長期計畫。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第254頁
抽樣與抽樣分配 Part A 7.1 Electronics Associates的抽樣問題 7.2 簡單隨機抽樣 7.3 點估計 7.2 簡單隨機抽樣 7.3 點估計 7.4 抽樣分配簡介 7.5 的抽樣分配 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第253頁
統計推論 統計推論的目的是, 建立估計值以及利用樣本資訊來檢定母體的假設。 母體:特定研究的所有元素所組成的集合。 樣本:母體的部分集合。 抽樣調查: 隨機自母體中抽出少量個體作為樣本,再以此組 樣本進行統計分析與推論未知母體的性質。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第254頁
統計推論 為什麼要進行「抽樣」? 抽樣的結果只是母體某些特徵值的估計值。 透過適當的抽樣方法,抽樣結果可以提供對 母體特性的「良好」估計值。 樣本平均數提供了母體平均數的估計值,樣本比例則 提供了母體比例的估計。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第255頁
7.1 Electronics Associates的抽樣問題 一般而言,由樣本蒐集資訊的成本遠低於自母體蒐集資訊所需的成本。 特別是必須進行人員面談以蒐集資料時。 EAI的人事主管被指派要建立該公司2500位主管的資料檔,資料包括主管的平均年薪與完成管理訓練課程的比例 現在假設EAI公司的資料庫不完整,且成本與時間有限,人事主管如何利用(抽樣)樣本資料來取得母體參數的估計值。 假設由2500位主管中如何抽出30位主管的資料 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第255頁
7.2 簡單隨機抽樣:有限母體抽樣 從大小為 N 的有限母體,抽出大小為 n 的簡單隨機樣本的定義如下: 7.2 簡單隨機抽樣:有限母體抽樣 從大小為 N 的有限母體,抽出大小為 n 的簡單隨機樣本的定義如下: 某一大小為 N 的有限母體中,抽出樣本大小為 n 的簡單隨機樣本,意指大小為 n 的每個可能樣本被抽出的機率皆相同。 由有限母體抽取簡單隨機樣本的方法之一是在母體中每次抽出一個元素,這樣一來,仍在母體中的每個元素被抽出的機率皆相同,連續抽出的 n 個元素即為自有限母體抽出的簡單隨機樣本。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第256頁
簡單隨機抽樣:有限母體抽樣 在執行樣本挑選程序時,可利用電腦來產生亂數,Excel有內建函數,可在工作表中產生亂數。 為了閱讀的方便,亂數表中的數字以 5 個為一組。 參考表 7.1 第一列的每一個數字,6, 3, 2, ...,具有相同的出現機率。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第256頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第257頁 表7.1 表7.1 亂數表 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第257頁 表7.1
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第256-257頁 簡單隨機抽樣:有限母體抽樣 不歸還抽樣 (sampling without replacement)。 進行簡單隨機抽樣時,某些亂數可能重複出現。 EAI例子:因為我們希望每位主管的資料只出現一次,所以任何已出現過的亂數我們將忽略不計,因為這個號碼所對應的主管資料已在樣本中。 歸還抽樣 (sampling with replacement)。 若在選取樣本時,允許已被抽中的主管的資料可以在樣本中出現兩次甚至更多。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第256-257頁
簡單隨機抽樣:無限母體抽樣 有些情況的母體為無限,或者母體過大而必須視為無限。 從無限母體抽出一個簡單隨機樣本必須滿足下列條件: 每一個元素皆抽自相同的母體。 每一個元素皆可獨立抽出。 無限母體常與持續進行的程序有關。此種狀況下,有創意的抽樣程序可確保沒有抽樣偏誤的狀況,而且樣本中的每個元素都是被獨立選出的。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第257頁
練習 4,8
7.3 點估計 估計: 依據抽樣分配的原理,用樣本中的統計量來推論 預測母體中未知參數的方法稱之。 點估計: 7.3 點估計 估計: 依據抽樣分配的原理,用樣本中的統計量來推論 預測母體中未知參數的方法稱之。 點估計: 從樣本資料中求算出估計值,並以此估計值來 推論未知母體參數的方法。 用點估計的術語來說,我們稱 是母體平均數 μ 的點 估計量(point estimator) ; s 是母體標準差 σ 的點估計量; 乃是母體比例 p 的點估計量 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第261頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第260頁 表7.2 點估計 假設隨機抽出 30 位主管,其年薪和受訓資料詳列如表 7.2 所示 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第260頁 表7.2
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第261頁 表7.3 點估計 表 7.3 整理各項母體參數值及其對應的點估計值 沒有任何一項點估計值會恰好等於對應的母體參數,此項差異是意料中之事,因為我們只是應用樣本而非整個母體普查來進行點估計。 下一章將介紹區間估計,區間估計可以讓我們瞭解點估計值與母體參數的接近程度。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第261頁 表7.3
練習 13、14
7.4 抽樣分配簡介 抽樣分配 母體分配:由所有母體所構成之 樣本分配:由母體中一組樣本所構成 由母體中每次抽取一些個體為一組樣本,每組樣本可求得一特定之樣本統計量,則所有各組樣本之統計量可構成一特定的統計量之分配稱之。 例如 假設x-bar為一隨機變數,由於x-bar和其它隨機變數一樣,有平均數、標準差和機率分配,而x-bar的個種可能值是由不同的簡單隨機樣本而且,所以x-bar的機率分配就是x-bar的抽樣分配 母體分配:由所有母體所構成之 樣本分配:由母體中一組樣本所構成
7.4 抽樣分配簡介 假設我們重複同樣的抽樣程序,每次抽出 30 位主管為樣本,並計算 與 值。 假設我們重複同樣的抽樣程序,每次抽出 30 位主管為樣本,並計算 與 值。 表 7.4 是 500 個簡單隨機樣本的部分資料。 表 7.5 列出這 500 組 值的平均年薪的相對次數分配,圖 7.1 為 值的相對次數直方圖。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263頁 表7.4 抽樣分配簡介 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263頁 表7.4
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263頁 表7.5 抽樣分配簡介 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263頁 表7.5
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263-264頁 抽樣分配簡介 由於 的各種可能值是由不同的簡單隨機樣本而來,因此 的機率分配也就稱為 的抽樣分配 (sampling distribution),瞭解抽樣分配和其各項特性可以讓我們針對樣本平均數 對母體平均數 μ 的接近程度做出機率陳述。 從圖 7.1 這個近似圖中我們可以發現分配圖形呈鐘形。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第263-264頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第164頁 圖7.1 抽樣分配簡介 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第164頁 圖7.1
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第264頁 圖7.2 抽樣分配簡介 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第264頁 圖7.2
7.5 的抽樣分配 統計推論的過程 母體平均數 m = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 m 值 用樣本資料計算 7.5 的抽樣分配 統計推論的過程 母體平均數 m = ? 從母體抽取 n 個元素 為一簡單隨機樣本 用 值 推論 m 值 用樣本資料計算 樣本平均數 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第265頁
的抽樣分配 簡單隨機樣本所產生的所有 可能值之平均數,也就是 的期望值 的期望值 其中: E( x ) = 的期望值 μ= 母體平均數 簡單隨機樣本所產生的所有 可能值之平均數,也就是 的期望值 的期望值 其中: E( x ) = 的期望值 μ= 母體平均數 x-bar是母體平均數之不偏估計量 E( ) = μ 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第265頁
的抽樣分配 的標準差 有限母體 無限母體 若 n/N ≤ 0.05 則稱為有限母體 通常被稱為有限母體校正因子(finite population correction factor)。 為平均數的標準誤 (standard error) 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第266頁
的抽樣分配 母體不是常態分配:如果母體不是常態分配,中央極 限定理(central limit theorem)可以幫助我們決定 抽樣 分配的形狀。 母體為常態分配:很多情況下,我們可以合理地假設 母體為常態分配。如果母體是常態分配,無論樣本 大小, 的抽樣分配也是常態分配。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第267頁
中央極限定理 中央極限定理 圖 7.3 三個不同母體以中央極限定理的應用,每一欄代表一種母體。 由母體中抽出樣本大小為 n 的簡單隨機樣本,當樣本大小 n 夠大時,樣本平均數 的抽樣分配將趨近於常態分配。 何謂大樣本? 圖 7.3 三個不同母體以中央極限定理的應用,每一欄代表一種母體。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第267頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268頁 圖7.3 中央極限定理 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268頁 圖7.3
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268頁 圖7.3 中央極限定理 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268頁 圖7.3
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第269頁 圖7.4 EAI問題的 抽樣分配 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第269頁 圖7.4
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268-269頁 抽樣分配的實際值(例子) 假設人事經理認為,如果年薪的樣本平均數落在母體平均數±$500 的範圍內,就可以接受這個估計值。 人事經理關切的問題是:樣本平均數落在母體平均數±$500 範圍內的機率為何? 假設已知母體平均數為 $51,800 的情況下,樣本平均數落在 $51,300 到 $52,300 間的機率為何? 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第268-269頁
抽樣分配的實際值 圖 7.5,它是 的抽樣分配。人事經理想知道的就是母體平均數為 $51,800 的情況下,樣本平均數落在 $51,300 到 $52,300 間的機率。 第7章抽樣與抽樣分配 Part A (7.1~7.5) 第269頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第269-270頁 抽樣分配的實際值 上述的計算過程顯示一個樣本大小為 30 的 EAI 主管的簡單隨機樣本,其樣本平均數 會落在母體平均數±$500 範圍內的機率為 0.5034,也就是說,有 1-0.5034=0.4966 的機率會使樣本平均數超過 和 μ =$51,800 範圍。換句話說,樣本平均數有一半的機率會落在此範圍內,但有一半的機率不會。或許我們應該考慮更大樣本的情形,以下將探討樣本大小與 抽樣分配之間的關係。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第269-270頁
樣本大小與 抽樣分配的關係 在 EAI 問題中,當 n=30,標準誤為 730.3,而當 n=100時,則標準誤降為 n=30 與 n=100 下之 抽樣分配如圖 7.6。由於 n=100 的抽樣分配有較小的標準誤,因此其 值的變異較小,比起 n=30, 值也比較接近母體平均數。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第270頁
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第270頁 圖7.6 樣本大小與 抽樣分配的關係 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第270頁 圖7.6
第7章抽樣與抽樣分配 Part A (7.1-7.5) 第271頁 圖7.7 樣本大小與 抽樣分配的關係 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第271頁 圖7.7
練習 19、24
評註 在 EAI 問題之 抽樣分配的說明中,我們假設母體平均數 μ =51800 和母體標準差 σ =4000 為已知。但一般而言,母體平均數 μ 與母體標準差 σ 在抽樣分配時通常未知。在第 8 章中我們將會討論在 μ 和 σ 未知時,如何運用樣本平均數 x 和樣本標準差 s。 中央極限定理的理論證明須假設樣本內的觀察值是獨立的,這在無限母體與取出放回下的有限母體情況下是成立的。雖然中央極限定理並不能直接應用在取出不放回下之有限母體,但實務的運用上認為只要樣本夠大,這樣的情況也可應用中央極限定理。 第7章抽樣與抽樣分配 Part A (7.1-7.5) 第271頁
End of Chapter 7, Part A