Chapter 6 常態分配
學習目標 指出常態分配的性質。 分辨對稱的或是偏斜的分配。 在已知各種 z 值的條件下,求出標準常態分配的面積。 透過轉換為標準常態變數得知常態分配變數的各種機率。 在已知比例的條件下,透過標準常態求出某個特定的數據。 針對大樣本,使用中央極限定理求解樣本平均的問題。 使用常態分配近似二項變數的機率。
圖6-1 成年女子身高分配的直方圖與常態模型
圖6-5 常態與偏斜分配
6-1 常態分配
圖6-2 圓形和應用的圖形
如果某一個隨機變數的機率分配具有連續、鐘型且對稱的圖形,我們稱呼它是常態分配 (normal distribution),它的圖形是一種常態分配曲線。
圖6-3 常態分配的形狀
常態分配的理論性質摘要 1. 常態分配曲線是鐘形的。 2. 常態分配的平均數、中位數與眾數是同一個數字,而且位在分配的中心。 3. 常態分配曲線是單峰的(這意味著它只有一個眾數)。 4. 曲線對稱於平均數,也就是說,在通過分配中心的那一條垂直線兩側有著完全一樣的形狀。 5. 曲線是連續的;也就是說,曲線上沒有間隙或是洞。對每一個 X 值,都對應一個 Y 值。 6. 曲線不會接觸到 x 軸。理論上,不論往兩側延伸多遠,曲線都不會接觸到 x 軸──但是它會愈來愈接近 x 軸。 7. 常態分配曲線下方的總面積是 1.00,或說是 100%。這一項事實看似不尋常,因為曲線永遠不會接觸到 x 軸,但是數學上可以用微積分證明這一件事。 8. 與平均數偏離小於一個標準差的面積大約是 0.68,或是 68%;小於兩個標準差的面積大約是 0.95,或是 95%;而小於三個標準差的面積大約是 0.997,或是99.7%。詳見圖 6-4,此圖同時顯示每一個區域的面積。
圖6-4 常態分配曲線下的面積
圖6-6 標準常態分配 標準常態分配 (standard normal distribution) 是一種平均數等於 0 且標準差等於1 的常態分配。
求出標準常態曲線下方的面積 針對標準常態分配的問題,我們建議的兩步驟程序顯示在下面程序表。 這兩項步驟是: 繪製常態分配曲線,並且塗上(對應問題所求的)陰影。 在程序表內找出合適的圖,然後按照指示的方向。
求出標準常態曲線下方的面積 程序表
求出標準常態曲線下方的面積 程序表
圖6-7 表D中 z = 1.39 的面積
例題6-1 例題6-1 (解答)
例題6-2 例題6-2 (解答)
例題6-2
例題6-3 例題6-3 (解答)
例題6-3 (解答)
例題6-4
例題6-4 (解答)
例題6-4 (解答)
例題6-4 (解答)
例題6-5 例題6-5 (解答)
例題6-5 (解答)
圖6-16 面積與機率之間的關係
觀念應用 6-1 保證常態性 在統計學經常需要檢視一組數據是否接近常態分配。有一些特殊的技巧可以用。其中一項就是為數據繪製一份直方圖,並且檢查它的形狀是不是接近鐘形。(注意:不需要絕對對稱才會是鐘形的。) 以下是前 50 大圖書館的分館數資料。
觀念應用 6-1 保證常態性 1. 建構數據的頻率分配。 2. 建構數據的直方圖。 3. 描述直方圖的形狀。 觀念應用 6-1 保證常態性 1. 建構數據的頻率分配。 2. 建構數據的直方圖。 3. 描述直方圖的形狀。 4. 根據第 3 題的答案,你覺得數據的分配接近常態嗎? 除了直方圖,如果數據的分配接近常態,大概會有 68% 的數據與平均數偏離會落在一個標準差的範圍內,大概會有 95% 的數據與平均數偏離會落在兩個標準差的範圍內,幾乎 100% 的數據與平均數偏離會落在三個標準差的範圍內。詳見圖 6-5。 5. 求出數據的平均數以及標準差。 6. 有多少比例的數據與平均數偏離會落在一個標準差的範圍內? 7. 有多少比例的數據與平均數偏離會落在兩個標準差的範圍內? 8. 有多少比例的數據與平均數偏離會落在三個標準差的範圍內? 9. 第 6、7、8 題的答案分別與 68、95、100% 比較,結果如何? 10. 你的答案對第 4 題的結論有幫助嗎?
6-2 常態分配的應用
圖6-17 測驗分數與對應的Z值
例題6-6 血液公升數 例題6-6 血液公升數(解答)
例題6-6 血液公升數(解答)
例題6-7 每月回收報紙 例題6-7 每月回收報紙(解答a)
例題6-7 每月回收報紙(解答a)
例題6-7 每月回收報紙(解答b)
例題6-7 每月回收報紙(解答b)
例題6-8 桌機的用電量 例題6-8 桌機的用電量(解答)
例題6-8 桌機的用電量(解答)
例題6-9 警校資格考 例題6-9 警校資格考(解答)
例題 6-9 警校資格考(解答)
例題 6-9 警校資格考(解答)
例題6-10 收縮壓 例題6-10 收縮壓(解答)
例題6-10 收縮壓(解答)
例題6-11 科技公司的庫存
例題6-11 科技公司的庫存(解答)
例題6-11 科技公司的庫存(解答)
例題 6-12 棒球比賽次數
例題 6-12 棒球比賽次數(解答)
例題 6-12 棒球比賽次數(解答)
觀念應用6-2 聰明人 假設你想要在人口 10,000 的加州 Visiala 經營 Mensa 俱樂部。你必須知道有多少人有資格進入 Mensa,這些人的智商至少要 130。你已經知道智商是平均數100 且標準差 15 的常態分配。完成以下的問題。 1. 求出在 Visiala 大概有多少人符合資格。 2. 在 Visiala 經營 Mensa 合理嗎? 3. 你如何能夠知道符合資格的人會有多少人真的加入俱樂部?明確說明你收集資訊的辦法。 4. 如果你想經營只允許智商在前 10% 者加入的 Ultra-Mensa 俱樂部,請問有資格加入者的智商最少要多少?
6-3 中央極限定理
樣本平均數的分配 樣本平均數的抽樣分配 (sampling distribution of sample means) 是不斷地從母體挑選固定數量的樣本,並且計算每一次的樣本平均數,所有這些數字所構成的一種分配。 抽樣誤差 (sampling error) 是因為每一次的樣本都不是母體的完美代表,所以樣本測度會和母體測度有一些差異。這一項差異就是所謂的抽樣誤差。
樣本平均數分配的性質 1. 樣本平均數的平均數等於母體平均數。 2. 樣本平均數的標準差比母體標準差小,而且它會等於母體標準差除以樣本數的正方根。
中央極限定理
例題6-13 孩童看電視時數 例題6-13 孩童看電視時數(解答)
例題6-13 孩童看電視時數(解答)
例題6-13 孩童看電視時數(解答)
例題6-14 註冊車子的壽命 例題6-14 註冊車子的壽命(解答)
例題6-14 註冊車子的壽命(解答)
例題6-14 註冊車子的壽命(解答)
例題6-14 週末加班
例題6-14 週末加班(解答a)
例題6-14 週末加班(解答b)
例題6-14 週末加班(解答b)
觀念應用6-3 中央極限定理 統計課 20 位學生個別收集一組樣本,他們詢問其他同學上學要花多少時間。所有樣本的樣本數都是 30。結果的平均數如下所示。
觀念應用6-3 中央極限定理 1. 學生們注意到每一個答案都不一樣。假如你隨機從任意母體不斷地抽樣,每一次的樣本數都一樣,這樣的話,結果有可能會一樣嗎? 2. 學生會懷疑到底誰的答案是對的。他們能夠求出母體平均數和母體標準差是多少嗎? 3. 把上述的平均數輸入電腦,並且檢查它們的分配是不是常態的。 4. 檢查樣本平均數的平均數和標準差。這些數字和學生個別的答案,比較起來如何? 5. 這些樣本平均數的分配是一種抽樣分配嗎? 6. 檢查第 3、7 和 14 位學生的抽樣誤差。 7. 比較這 20 個平均數的標準差。這是否等於第 3 位學生的標準差除以樣本數的正方根?第 7 和 14 位學生呢?
6-4 二項分配的常態近似
二項分配的特徵 連續性校正 (correction for continuity) 是當使用連續型分配近似離散型分配的時候會引用的一種校正。 1. 試驗次數固定。 2. 每一次試驗的出象彼此間是獨立的。 3. 每一次試驗只有兩種出象,或是可以被簡化到兩種出象。 4. 每一次試驗的成功機率固定不變。 連續性校正 (correction for continuity) 是當使用連續型分配近似離散型分配的時候會引用的一種校正。
圖6-38 比較二項分配與常態分配
圖6-38 比較二項分配與常態分配
表6-1 二項分配的常態近似摘要
使用常態分配近似二項分配的程序 步驟 1 檢查是否可以使用常態近似。 步驟 2 求出二項分配的平均數 以及標準差 σ。 步驟 1 檢查是否可以使用常態近似。 步驟 2 求出二項分配的平均數 以及標準差 σ。 步驟 3 用機率符號以及 X 把問題寫下來。 步驟 4 用連續性校正再把問題寫一遍,並且圖示常態分配曲線下的對應面積。 步驟 5 求出對應的 z 值。 步驟 6 找到答案。
例題6-16 開車時看書 例題6-16 開車時看書(解答)
例題6-16 開車時看書(解答)
例題6-16 開車時看書(解答)
例題6-17 豚草過敏 例題6-17 豚草過敏(解答)
例題6-17 豚草過敏(解答)
例題6-17 豚草過敏(解答)
例題6-18 打擊率平均 例題6-18 打擊率平均(解答)
例題6-18 打擊率平均(解答)
例題6-18 打擊率平均(解答)
例題6-19 例題6-19 (解答)
例題6-19 (解答)
觀念應用6-4 你有多安全? 假設你最喜歡的活動是爬山。當你去爬山的時候,會攜帶幾種安全設備預防墜山。你注意到某一個安全掛鉤的可靠度指數是 97%。你預估明年會用到這一項器材的次數大概是 100 次。回答以下的問題: 1. 可靠度指數 97% 的意思是不是使用這一項器材 100 次,每一次該器材不失誤的機率是 97%? 2. 至少失誤一次的機率是多少? 3. 這一項事件的餘集是哪一個事件? 4. 這個事件可以視為一種二項實驗嗎? 5. 你可以使用二項機率公式嗎?為什麼可以或為什麼不可以? 6. 求出至少失誤兩次的機率。 7. 你可以使用某一種常態分配精確地近似這一項二項分配嗎?試著解釋為什麼可以或為什麼不可以? 8. 需要連續性校正嗎? 9. 在獨立於第一支掛鉤的情況下,使用第二支掛鉤會有多安全?
結語 常態分配可以用來描述許多變數,例如身高、體重或者是溫度。常態分配是鐘形、單峰、對稱且連續的;它的平均數、中位數以及眾數是同一個數字。因為每一個常態分配變數都有自己的平均數 以及標準差 σ,數學家使用一種標準常態分配,它的平均數是 0,而且標準差是 1。使用公式 z = (X− )/σ,可以把其他接近常態分配的變數轉換為標準常態分配變數。(6-1) 常態分配也可以用來解決許多近似常態變數的問題。(6-2) 樣本平均數的抽樣分配是某特定樣本數所有樣本的樣本平均數的分配。樣本測度與母體測度之間的差異叫做抽樣誤差。樣本平均數的平均數是母體平均數。樣本平均數的標準差是母體標準差除以樣本數的正方根。中央極限定理主張當樣本數無限制地不斷增長,取後放回地從母體抽樣的樣本平均數,其分配會趨近某一種常態分配。(6-3)
結語 常態分配可以被用來近似其他分配,例如二項分配。針對用來近似的某一項常態分配,必須同時滿足兩項條件:np ≥ 5 和 nq ≥ 5。另外,使用連續性校正可以讓結果更準確。(6-4)