第五章 抽樣與抽樣分配
學習重點 從母體挑選一組隨機樣本 分辨母體參數與樣本統計量 應用中央極限定理 推導樣本平均與樣本比例的抽樣分配 解釋為什麼樣本統計量是好的母體參數估計式 根據估計式的需求性質判斷估計式的好壞 應用自由度的概念 指出特別的抽樣辦法 利用樣板計算抽樣分配與相關的結果
估計母體參數的樣本統計量 討論母體時,平均與標準差被稱為參數,記做 μ 及 σ。 母體的數值測度被稱為母體參數 (population parameter)。
估計母體參數的樣本統計量 樣本統計量 (sample statistic):指樣本的數值測度,簡稱統計量。 某種母體參數的估計式 (estimator) 是估計該參數的樣本統計量。利用樣本得到估計式的某特定數值是被估計母體參數的一項估計,稱為母體參數的點估計 (point estimate)。
估計母體參數的樣本統計量
估計母體參數的樣本統計量 如何由母體隨機挑選樣本 需要一份所有母體元素的名單 (底冊) 藉由隨機產生的數字,這份底冊讓我們決定樣本應該包含名單中的哪些元素
估計母體參數的樣本統計量 分層抽樣方法 分層抽樣把母體分成二個或二個以上稱為「層」(strata)的子母體,並且隨機從每一個子母體挑選一些樣本 每一層從某種與抽樣實驗有關的角度來看都必須是不同的
估計母體參數的樣本統計量 分層抽樣方法例子 某間大學的學生或許有 54% 的女學生及 46% 的男學生。因為男女生或許在某一次調查中有著非常不一樣的意見。故,隨機樣本中有必要包含適當比例的男女生。如果樣本總數剛好等於 100,則一種代表性的樣本應該包含 54 個女學生及 46 個男學生。
估計母體參數的樣本統計量 其他抽樣方法 分群抽樣 (cluster sampling) 一階段分群抽樣 (single-stage cluster sampling) 二階段分群抽樣 (two-stage cluster sampling) 多階段分群抽樣 (multistage cluster sampling) 系統抽樣 (systematic sampling)
抽樣分配 固定母體並且固定樣本數的條件下,統計量的抽樣分配 (sampling distribution) 是該統計量所有可能值的機率分配。
抽樣分配
抽樣分配
舉例-分例均等分配(Discrete Uniform Distribution) f(X)=1/N N=1,2, …, N E(X)=(N+1)/2 V(X)=(N^2-1)/12 從1-8的數字中隨機抽出兩個樣本點 E(X)=4.5, V(X)=2.29 請問X-bar 的期望值與標準差
抽樣分配
抽樣分配
抽樣分配 中央極限定理 當樣本數增加至無限大, 的極限分配是常態分配-這是統計學最重要的結果之一
抽樣分配 中央極限定理 說明樣本平均 的抽樣分配會接近常態分配,無論樣本來自的母體是何種分配。 說明樣本平均 的抽樣分配會接近常態分配,無論樣本來自的母體是何種分配。 此定理讓我們有能力產生樣本平均可能存在區域的機率陳述,同時計算 與它所估計的母體平均離多遠的機率。
抽樣分配
Shape of the Binomial Distribution y : n = 4 p = . 1 B i n o m i a l P r o b a b i l i t y : n = 4 p = . 3 B i n o m i a l P r o b a b i l i t y : n = 4 p = . 5 . 7 . 7 . 7 . 6 . 6 . 6 n = 4 . 5 . 5 . 5 ( ) x . 4 ( x ) . 4 ) . 4 P x ( . 3 P . 3 P . 3 . 2 . 2 . 2 . 1 . 1 . 1 . . . 1 2 3 4 1 2 3 4 1 2 3 4 x x x B i n o m i a l P r o b a b i l i t y : n = 1 p = . 1 B i n o m i a l P r o b a b i l i t y : n = 1 p = . 3 B i n o m i a l P r o b a b i l i t y : n = 1 p = . 5 . 5 . 5 . 5 . 4 . 4 . 4 n = 10 x ) . 3 ( ( ) x . 3 P P P x ( ) . 3 . 2 . 2 . 2 . 1 . 1 . 1 . . . 1 2 3 4 5 6 7 8 9 1 1 2 3 4 5 6 7 8 9 1 1 2 3 4 5 6 7 8 9 1 x x x B i n o m i a l P r o b a b i l i t y : n = 2 p = . 1 B i n o m i a l P r o b a b i l i t y : n = 2 p = . 3 B i n o m i a l P r o b a b i l i t y : n = 2 p = . 5 n = 20 2 . 2 . . 2 x ) ( x ( ) ) P P x P ( 1 . 1 . 1 . . . . 1 2 3 4 5 6 7 8 9 1 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 1 2 3 4 5 6 7 8 9 1 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 1 2 3 4 5 6 7 8 9 1 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 x x x Binomial distributions become more symmetric as n increases and as p .5.
成功比例的抽樣分配 成功與失敗-伯努力(Bernoulli distribution)分配 成功的加總-二項分配 成功加總的平均-樣本比例P^ 分配 例5-3
抽樣分配 中央極限定理的三個面向 如果樣本數夠大, 的抽樣分配是常態的。 的期望值等於μ。 的標準差等於 。
抽樣分配
抽樣分配 當標準差未知,標準化樣本平均的抽樣分配
抽樣分配
點估計的統計性質 如果一個估計式被稱為不偏的 (unbiased),表示該估計式的期望值等於它希望估計的母體參數。
點估計的統計性質
點估計的統計性質
有效性 如果某一估計式有著相對比較小的變異數,,那麼該估計式是有效的(efficient)。
點估計的統計性質
一致的(consistent) 如果某一估計式,隨著樣本數的增加,其估計參數的準確程度也跟著增加,這個估計式可稱為一致性估計式。
充分的(sufficient) 如果某一估計式用了所有有關欲估計參數的相關資訊,則這個估計式可稱為充份的估計式。
點估計統計量的性質 一個好的樣本統計量,或者說一個好的點估計式,應該具有:不偏性、有效性、一致性、充分性。
自由度 如果你必須選擇 n 個數字,並且加諸一種關於它們總和的條件,則你的自由度為 n-1。 例如:你被要求自由地選擇 10 個數字,但是這 10 個數字總和必須等於 100,你的自由度有 9 個。
自由度
自由度
自由度
自由度