Keller: Stats for Mgmt & Econ, 7th Ed 抽樣分配 2019年4月23日星期二 第 9 章 抽樣分配 Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.
抽樣分配 一個抽樣分配(sampling distribution)是由抽樣所產 生。 我們根據機率法則以及期望值與變異數法則導出 抽樣分配。 例如,(細想)投擲一顆以及兩顆骰子… 第9章 抽樣分配 第321頁
平均數的抽樣分配 母體是藉由投擲一顆公正的骰子無限多次產生, 隨機變數 X 是指任何一次投擲骰子所出現的點數。 母體平均數與變異數的計算為: 第9章 抽樣分配 第321頁
平均數的抽樣分配 一個抽樣分配是藉著觀察所有樣本量為2(例,兩個骰子)的樣本與其平均數所產生的。 一共有36 種不同的大小為2 的可能樣本; 只能有11種不同的可能數值,某些特定的數值(例, =3.5)出現的頻率比其他的數值(例, =1)多。 第9章 抽樣分配 第322頁 表9.1
兩顆骰子平均點數的抽樣分配 抽樣分配結果如下: 第9章 抽樣分配 第323頁表9.2 & 圖9.2
辨別 辨別X的分配 與樣本抽樣的 。 所以可以得知: 第9章 抽樣分配 第323-324頁
推論… 為了產生 X 分配,我們從母體中重複抽出大小為 n= 2 的樣本,並且計算每一個樣本的 x。因此,平 均數以符號 表示,並且變異數以符號 表示: 但是使用其他的 n 值,我們會產生一些不同的 X 抽 樣分配: 抽樣分配的標準差被稱為平均數的標準誤(standard error of the mean)。 第9章 抽樣分配 第324頁
中央極限定理 自任何母體中隨機抽取的樣本,其平均數的抽樣分配,在樣本大小足夠大時會趨近於常態。 樣本越大,X 的抽樣分配將會越近似常態分配。 第9章 抽樣分配 第326頁
中央極限定理 如果母體是常態的,則對所有的n 值,X 是常態分配。 如果母體為非常態的,只有在n 值比較大的情況下,X 才會近似常態分配。 第9章 抽樣分配 第326頁
任何母體平均數的抽樣分配 我們可以將我們已有的發現延伸到所有無限大的母體。但是,如果母體是有限的,則標準誤是: 其中 N 是母體大小並且 為有限母體校正因子( finite population correction factor)。 第9章 抽樣分配 第326頁
任何母體平均數的抽樣分配 如果母體大小相對於樣本大小是夠大的,則有限母體校正因子會接近於 l,可以忽略它。 我們將視至少比樣本大 20 倍的任何母體為大母體。 在實務中,大部分應用所涉及的母體都符合大母體的條件。 結果 ,有限母體校正因子通常被省略掉 。 第9章 抽樣分配 第326頁
樣本平均數的抽樣分配 1. 2. 3. 如果 X 是常態,則 X 是常態。如果 X 為非常態, X 在樣本是「足夠大」的情況下,近似於常態分 定。 第9章 抽樣分配 第327頁
範例9.1(a) 一間製瓶工廠的領班觀察到每一個32 盎司瓶子中汽水的總量實際上是一個具有平均數32.2 盎司以及標準差.3 盎司的常態分配隨機變數。 如果有一位顧客買一瓶汽水,這瓶的容量超過32 盎司的機率為何? 第9章 抽樣分配 第329頁
範例9.1(a) 我們想要找出P(X > 32),其中 X 是常態分配, µ = 32.2 且σ =.3, “一瓶汽水的容量超過32 盎司的機率為75%” 第9章 抽樣分配 第330頁
範例9.1(b) 一間製瓶工廠的領班觀察到每一個32 盎司瓶子中汽水的總量實際上是一個具有平均數32.2 盎司以及標準差.3 盎司的常態分配隨機變數。 如果有一位顧客買一箱裝四瓶的汽水,這四瓶的平均容量會大於32盎司的機率為何? 第9章 抽樣分配 第329頁
範例9.1(b) 現在我們想要找出P(X > 32),其中 X 是常態分配 ,µ = 32.2 且σ =.3。 我們知道: 第9章 抽樣分配 第330頁
“四瓶汽水的平均容量會大於32盎司的機率為91%” 範例9.1(b) 如果有一位顧客買一箱裝四瓶的汽水,這四瓶的平均容量會大於32盎司的機率為何? “四瓶汽水的平均容量會大於32盎司的機率為91%” 第9章 抽樣分配 第330頁
圖9.4 X 分配與X 的抽樣分配 平均數=32.2 容量超過32 盎司的機率為何? 四瓶的平均容量會大於32盎司的機率為何? 第9章 抽樣分配 第330頁 圖9.4
開章範例 商學院畢業生的薪資 在一所大型大學的廣告中,商學院的院長宣稱其學院的畢業生在畢業一年之後的平均週薪是$800 且標準差是$100。 一位商學院二年級剛修完一門統計課的學生想要檢視院長所宣稱的平均數是否正確。 第9章 抽樣分配 第320頁
開章範例 商學院畢業生的薪資 他調查了25 位一年前畢業的人並記錄他們的週薪。 他發現樣本平均數是$750。 為了詮釋他的發現,他必須計算當母體平均數是$800 且標準差是$100 時,一個25位畢業生的樣本會得到樣本平均數$750 或更小的機率。 計算這個機率之後,他必須導出一些結論。 第9章 抽樣分配 第320頁
開章範例 我們想要找出樣本平均數少於$750的機率。因此,我們尋找 X 的分配,也就是週薪的分配,很可能是正偏的,但又不足以讓 分配為非常態。因此,我們可以假設 是常態的,具有平均數 且標準差 第9章 抽樣分配 第331頁
開章範例 因此, 當母體平均數是$800 時,觀察到一個樣本平均數如同$750 一樣低的機率是極為低的。因為這個事件不大可能發生,我們將結論這位院長的宣稱是不被證實的。 第9章 抽樣分配 第331頁
樣本平均數的抽樣分配 樣本平均數的抽樣分配可表達如下所示: 第9章 抽樣分配第332頁
使用抽樣分配進行推論 我們可以代數的符號表達為 P(−1.96 < Z < 1.96) = .95 使用一點簡單的代數處理,我們得到 第9章 抽樣分配 第332頁
使用抽樣分配進行推論 回到本章開章範例,其中 µ = 800, σ = 100,並且 n = 25,我們計算 因此我們可以說 這告訴我們有95%的機率,一個樣本平均數會落在760.8 和839.2 之間。因為計算的樣本平均數是$750,我們將結論該院長的宣稱不被樣本統計量所支持的。 第9章 抽樣分配 第332-333頁
使用抽樣分配進行推論 將機率從.95 改變成.90 ,則機率的描述改變為 第9章 抽樣分配 第333頁
使用抽樣分配進行推論 我們也可以產生這個描述的一般式: 在此公式中 ( 希臘字母alpha) 是X 不落在區間內的機率。 為了應用此一公式,我們必須做的只是代入, , n 和。 第9章 抽樣分配 第333頁
使用抽樣分配進行推論 例如,以µ = 800, σ = 100, n = 25 與α = .01,我們可以得到 第9章 抽樣分配 第333頁
比例的抽樣分配 母體成功比例的估計值是樣本比例。也就是,我們計數在一個樣本中成功的次數並計算: ( 的讀法是 “p-hat”). 其中 X 是成功的次數,而 n 是樣本大小。 第9章 抽樣分配 第335頁
常態近似二項分配 n = 20 與p = .5 的二項分配且常態近似疊上 ( =10 與 =2.24) ( =10 與 =2.24) 第9章 抽樣分配 第337頁 圖9.8
常態近似二項分配 n = 20 與p = .5 的二項分配且常態近似疊上 ( =10 and =2.24) 如何得知這兩個數值? 在7.4 節中我們指出: 因此: 且 第9章 抽樣分配 第337頁 圖9.8
其中Y 是近似二項隨機變數X 的常態隨機變數。 常態近似二項分配 為了使用常態分配來計算機率,我們需要找出常態曲線下方介於9.5 與10.5 之間的面積。 P(X = 10) ≈ P(9.5 < Y < 10.5) 其中Y 是近似二項隨機變數X 的常態隨機變數。 第9章 抽樣分配 第337頁 圖9.8
其中Y 是近似二項隨機變數 X 的常態隨機變數。 常態近似二項分配 X等於10的實際機率是: P(X = 10) = .1762 當 P(9.5 < Y < 10.5) = .1742 這近似值是相當好的。 P(X = 10) ≈ P(9.5 < Y < 10.5) 其中Y 是近似二項隨機變數 X 的常態隨機變數。 第9章 抽樣分配 第337.338頁 圖9.8
一個樣本比例的抽樣分配 使用期望值與變異數法則,我們能夠得到 的平均數、變異數與標準差。 使用期望值與變異數法則,我們能夠得到 的平均數、變異數與標準差。 [ 的標準差被稱為比例的標準誤(standard error of the proportion)] 使用此公式,樣本比例可以被標準成標準常態分配 : 第9章 抽樣分配 第341頁
範例9.2 在上次的選舉,一位州代表得到52% 的選票。 在選後的一年這位代表發起一個調查,詢問300 位民眾的隨機樣本,在下次的選舉中他們是否還會投給他。 如果我們假設他受歡迎的程度沒有改變,則此樣本中會有一半以上的民眾投票給他的機率為何? 第9章 抽樣分配 第341頁
範例9.2 將會投給這位代表的受訪者人數是一具有n = 300 與 p = .52 的二項隨機變數。 我們想要決定樣本比例大於50% 的機率。也就是,我們要找出 。 我們現在知道樣本比例 是服從近似的常態分配,具有平均數p = .52與標準差 = .0288。 第9章 抽樣分配 第341頁
範例9.2 因此,我們計算 如果我們假設支持度維持在52%,則在300位民眾的樣本中,超過半數會投票給此位代表的機率是.7549。 第9章 抽樣分配 第342頁
兩平均數間差異的抽樣分配 另外一種你很快就會遇到的抽樣分配是兩樣本平均數間差異的抽樣分配(sampling distribution of the difference between two sample means)。抽樣計畫需要: 從兩個常態母體中各抽出一個獨立的隨機樣本。 如果兩個母體是常態,兩樣本平均數間的差異(例, ) 也是常態分配。 注意:如果兩母體皆為非常態分配,但是樣本量是”大的“,則 為近似常態。 第9章 抽樣分配 第343-344頁
兩平均數間差異的抽樣分配 經由使用期望值與變異數法則,我們導出 抽樣分配的期望值: 經由使用期望值與變異數法則,我們導出 抽樣分配的期望值: 標準差[即為兩平均數間差異的標準誤(standard error of the difference between two means)]: 第9章 抽樣分配 第343頁
WLU 畢業生的樣本平均起薪超過UWO 畢業 範例9.3 假設Wilfrid Laurier University (WLU) MBA 畢業生與University of WesternOntario (UWO) MBA 畢業生的起薪是常態分配,且具有平均數與標準差。如果WLU 以及UWO 的MBA 畢業生的隨機樣本分別被選出,如下所示…… WLU UWO 平均數 62,000 $/年 60,000 $/年 標準差 14,500 $/年 18,300 $/年 樣本大小 n 50 60 WLU 畢業生的樣本平均起薪超過UWO 畢業 生的樣本平均起薪的機率為何? 第9章 抽樣分配 第344頁
“對於50 位從WLU 畢業生與60 位UWO 畢業生的樣本而言,WLU 的樣本平均起薪超過 UWO 的樣本平均起薪的 範例9.3 我們想要決定P(X1 > X2 >0)。我們知道 X1 > X2 是常態分配且具平均數1- 2 = 62,000 - 60,000 = 2,000 與標準差 我們可以將此項變數標準化並且參考附錄B 的表3: “對於50 位從WLU 畢業生與60 位UWO 畢業生的樣本而言,WLU 的樣本平均起薪超過 UWO 的樣本平均起薪的 機率是.7389” Z 第9章 抽樣分配 第344-345頁
由此出發談統計推論 在第7 與第8 章中我們介紹過機率分配,它讓我們 對隨機變數的數值做機率的描述。 這項計算的先決條件是知道分配與相關的參數。 第9章 抽樣分配 第346頁
由此出發談統計推論 範例7.9 中,我們需要知道Pat Statsdud 猜到正確答案的機率是20% (p = .2)以及在10 題( 測驗) 中正確答案的題數( 成功) 是一個二項隨機變數。 然後我們可以計算任何成功次數的機率。 第9章 抽樣分配 第346頁
由此出發談統計推論 在範例8.3 中,我們必須知道投資的報酬率服從平均數10% 與標準差5% 的常態分配。 這三點資訊讓我們能夠計算隨機變數各種數值的機率。 第9章 抽樣分配 第346頁
由此出發談統計推論 下圖 以符號表示機率分配的使用。 簡單地說,對母體與其參數的了解讓我們使用機率分配對母體中的個別成員做機率描述。箭頭的方向表示資料流動的方向。 第9章 抽樣分配 第346.347頁 圖9.10
由此出發談統計推論 在這一章中我們發展了抽樣分配,基於對參數的認知和一些關於分配的資訊,讓我們得以對一個樣本統計量做機率的描述。 Statistical works藉著逆轉圖中資料流的方向 第9章 抽樣分配 第347頁 圖9.11
由此出發談統計推論 在機率分配與抽樣分配兩種應用中,我們必須知道相關參數的數值,這是一個相當難辦到的事情。在實務的世界中,由於參數代表極大母體的敘述性量數,參數幾乎全都是未知的。 從第10 章開始,我們將假設大部分的母體參數是未知的。統計實作人員會從母體中抽樣並且計算所需的統計量。統計量的抽樣分配讓我們可以對參數做推論。 第9章 抽樣分配 第347頁
由此出發談統計推論 這張圖呈現統計推論的特色 第9章 抽樣分配 第347頁 圖9.12