6-1 機率分配概說 6-2 二項式機率分配 6-3 常態機率分配 6-4 t分配 大 綱 大 綱 習題解答 習 題 6-1 機率分配概說 6-2 二項式機率分配 6-3 常態機率分配 6-4 t分配
習題解答 大 綱 習題解答 習 題 習 題
圖 片 大 綱 習題解答 習 題 習題解答
6-1 機率分配概說 從本節起,我們開始研究「機率分配」。機率分配呈現一個實驗發生數值的整體範圍,和相對次數分配非常類似。透過對於過去已經發生事件的描述,機率分配可以告訴我們未來事件可能發生的情形。舉例來說,若有一製藥廠宣稱他們所出品的減肥藥對於80%的人都有效的話,消費者保護基金會為了確認他們的宣稱是否屬實,則挑選了六個人進行測試。若製藥廠的宣稱屬實的話,我們可以預期這六個人應該都會有體重減輕的現象發生。更明確地說,也就是六個人中應該會有將近五個人左右體重確實減輕了。 機率分配(probability distribution),表現出一個實驗所有的可能結果以及每一可能結果所發生的機率。機率分配如何產生?
例題6.1 表6-1為投擲一個公正硬幣三次,出現正面的次數為若干?可能情況:沒有正面、一個正面、二個正面與三個正面。請問,正面出現次數的機率分配為何? 如下表所示,一共有八種可能的結果。H代表正面,T代表反面。
從上表可以了解,都沒有出現正面的情況只有一種;出現一次正面的情況共有三種;出現二次正面的情況共有三種;出現三次正面的情況只有一種。因此,投擲公正硬幣三次,沒有出現正面的機率是1/8;出現一次正面的機率是3/8;出現二次正面的機率是3/8;出現三次正面的機率1/8。出現正面數與機率值彙整如表6-2,稱之為機率分配表。也可用圖形表示(參閱下圖)。
機率分配有下列二個重要的性質: 1.每一種可能結果的機率介於0與1之間【x表結果.P(x)表機率,如上例所示,機率為0.125、0.375二種】。 2.所有互斥的結果機率總和為1,上例中0.125+0.125+0.375+0.375=1
6-1-1 隨機變數 在任何隨機性的實驗中,任何可能的結果都是隨機性的出現。舉例來說,若我們進行丟骰子的實驗,那骰子的六種點數都有出現的可能。若依據實驗結果的性質加以區分,我們將資料的形態區分成兩大類:其中一種資料我們稱為數量化的結果(如錢的數目、體重或孩童的總數);另一種資料則是性質上的結果(如顏色或喜歡的宗教)。底下幾個例子將更進一步地說明隨機變數的意義。
如果我們統計星期一學生缺席人數,則可能是0、1、2、3、4、……。這些缺席人數是隨機變數。 擲二枚公正的硬幣,出現正面數可能是0、1、2。確實的正面數依實驗而定,出現的正面數為隨機變數。 隨機變數(random variables),能隨機表示不同數值的實驗所產生的變數。隨機變數依其性質可區分成連續隨機變數與不連續隨機變數。
6-1-2 機率分配的平均數、變異數與標準差 我們討論過次數分配的集中趨勢和離散程度。平均數告訴我們資料的集中趨勢,而變異數則告訴我們資料的離散程度。同樣的,機率分配亦可藉由平均數和變異數來表示其機率分配的特性。平均數採用的符號是μ、變異數採用的符號是σ2。
(一)平均數 在傳達機率分配的特性時,平均數是常用的參考指標,它也可視為源於同一樣率分配的隨機變數的平均值。機率分配的平均數我們也稱為期望值E(x),它是隨機變數可能數值之加權平均數,經相對應的出現機率加權而成的。 μ = E(x) = Σ[xp(x)] [式6-1] 其中,p(x)代表隨機變數x的機率值。換句話說,將每一隨機變數的可能值x乘以其本身的機率值p(x),然後再將其加總起來就是平均數。
(二)變異數 如前所述,平均數是不連續機率分配的集中趨勢值,然而它卻沒有辦法表現出機率分配的離散程度。至於變異數,則能衡量機率分配的離散程度。不連續機率分配的變異數計算公式為: σ2=Σ[(x-μ)2p(x)] [式6-2]
6-2 二項式機率分配 二項式機率分配(binomial probability distribution)是不連續機率分配,其主要的特徵是實驗的結果只有兩種形式而且互斥。例如,是非題的答案只有「是」與「非」兩種,而且是互斥的。通常我們把實驗的結果分成「成功」與「失敗」兩種。例如,一個人回答是非題,假如他猜對了,我們將它歸類為「成功」;假如猜錯了,我們將它歸類為「失敗」。 二項式機率分配的第二項特性是資料的蒐集依點計結果得來。這便是為什麼二項式機率分配被歸類為不連續機率分配的原因。
第三項特性是二項機率分配的實驗,每次成功(失敗)的機率都是相同的。第四項特性是每次試行的結果是相互獨立的。 二項式機率分配擁有下列特性: 1.一項實驗結果被劃分成二種互斥的類型—成功或失敗。 2.資料之蒐集來自點計。 3.每次試行成功(或失敗)的機率都是相同的。 4.每次試行的結果是相互獨立的。
6-2-1 二項式機率分配的計算 計算二項式機率分配時,必須獲知:(1)試行次數;(2)每次試行成功的機率。例如,一位學生回答20題問題,故試行20次;每一題共有5個答案,所以猜對(成功)的機率都是1/5或0.20。
一個二項式實驗共試行n次,每次成功的機率為π,則在n次試行中成功x次的機率為: P(x) = nCxπx(1-π)n-x [式6-3] 其中:C = 組合函數 n = 試行次數 x = 試行成功次數 π = 每次試行成功機率 值得注意的是,這裡的π代表的是母體參數,不要和圓周率3.1416混淆了。
例題6.2 假若每天行台北飛香港的飛機有五個班次,而每一班次抵達香港時班機延誤的機率是0.20。請問在一天之中都沒有班機延誤的機率是多少?在一天之中只有一架班機延誤的機率是多少?
解 我們利用[式6-3]來解。每一班次班機延誤的機率是0.20所以π = 0.2,每天有五架次的飛機n = 5,x代表成功次數,而在這一個實例中試行成功代表的是班機延誤。若都沒有班機延誤則x = 0。 P(0) = nCxπx (1-π)n-x = 5C0(0.20)0(1-0.20)5-0 = (1)(1)(0.3277) = 0.3277 而在一天之中只有一架班機延誤的機率是0.4096,計算如下: P(1) = nCxπx(1-π)n-x = 5C1(0.20)1(1-0.20)5-1 = (5)(0.20)(0.4096) = 0.4096
6-2-2 二項式分配機率表 二項式分配機率值是一項可以經由計算而容易獲得的機率理論,在n較小(如n=3、4)時容易計算,然而n漸大或是P值較繁複時,計算過程則相當龐大。因此利用「二項式分配機率表」,可以節省許多時間,詳表在附錄。
例題6.3 根據過去的經驗顯示,從一部高速機器製造的螺絲釘有5%是瑕疵品,現在隨機抽取6個螺絲釘,請問沒有瑕疵品的機率是多少?如果是1個、2個、3個、4個、5個、6個,請問瑕疵品的機率是多少?
解 本例符合二項機率分配之四項條件:(a)每次試行成功的機率相同(0.05);(b)試行次數已知;(c)所有試行皆屬獨立事件;(d)實驗只有二種可能的結果(正常與瑕疵品)。 從表中先找到最上一列的成功率值π = 0.05,往下尋找最左一行的機率值,得到P(0) = 0.735。 另外,當發現一個瑕疵品的機率為0.232。下表將n = 6、π = 0.05的二項機率值列出:
6-3 常態機率分配 在此節我們將會: 1.瞭解常態機率分配的特性。 2.瞭解標準化之意義及z值的計算。 6-3 常態機率分配 在此節我們將會: 1.瞭解常態機率分配的特性。 2.瞭解標準化之意義及z值的計算。 3.使用標準常態分配,計算兩點間的機率值。 4.使用標準常態分配,計算位於某一數值以上或以下的機率值。 5.比較二組以上不同機率分配的觀察值。 本節中,我們所研究一項非常重要的連續機率分配—常態機率分配(normal probability distribution)。一般而言許多自然界的事物的機率分配,如身高、體重、智商等都是屬於「常態」分配。
6-3-1 常態機率分配的特性 常態機率分配和它的圖形具有下列幾項特徵: 6-3-1 常態機率分配的特性 常態機率分配和它的圖形具有下列幾項特徵: 1.常態曲線以鐘形呈現,在正中央部分為其頂峰。該點是機率分配的平均數、中位數及眾數所在。 2.常態機率分配以其平均數為中心,左右對稱。換句話說,左右兩邊的曲線相互對應,並可對摺重疊。 3.常態曲線以其平均數為中心,向左右兩邊X軸緩和地趨近,但不相切。
6-3-2 標準常態機率分配 從以上可以發現,平均數與標準差的不同,構成許多不同的常態機率分配,數目則毫無限制,因此無法像二項式分配一樣,提供一張通用的機率表,所以常態分配必須「標準化」,所有的常態皆可以化成μ = 0,σ = 1的「標準常態分配(the standard normal distribution)」。
舉例來說,一數值經計算z值為1. 91,在標準常態曲線下,平均數與X之間的面積是多少?從表中最左一行往下找到1 舉例來說,一數值經計算z值為1.91,在標準常態曲線下,平均數與X之間的面積是多少?從表中最左一行往下找到1.9,再往右尋找,與最上一列為0.01對稱的機率值0.4719便是答案。這便是觀察值落於平均數與z值1.9之間的機率。
例題6.4 P(Z<+1.38)
解
例題6.5 P(Z>-2.01)
解
例題6.6 P(-1<Z<1.8)
解
例題6.7 P(Z<-2.01)
解
例題6.8 P(Z>1.38)
解
例題6.9 μ = 21,σ = 3,P(X<24) = ?
解
例題6.10 μ = 21,σ = 3,P(X>24) = ?
解
例題6.11 μ = 21,σ = 3,P(18<X<24) = ?
解
例題6.12 μ = 21,σ = 3,P(X<18) = ?
解
例題6.13 μ = 21,σ = 3,P(X>18) = ?
解
例題6.14 一群中階管理者的月薪呈現常態分配,其平均數為$1,000、標準差為$100,請將月薪X=$1,100化為z值,並將X=$900化為z值。
解
例題6.15 某一輪胎製造商正欲對普利司通型新型輪胎,設定一保證哩程數。假設經過測試,該牌輪胎壽命呈常態分配,平均數是47,900英哩,標準差是2,050英哩。該製造商欲使因哩程數不及保證哩數而要求更換新胎的比例不超過4%,請問該製造商應該設定多少的保證哩程數?
解
例題6.16
解
解
解 留給讀者仿例6-16練習!
解 留給讀者仿例6-17練習!
解
6-4 t分配 t分配(Student’s t-distribution)為英國學者Gosset(1876-1937)於1908年以筆名Student所發表,故取名為t分配,這是一種專門討論小樣本的分配。與常態分配比較起來,它也是一種對稱於平均數的機率分配,且其平均數和標準常態分配一樣是0,但與常態分配最大的不同點是t分配的形狀隨著自由度(Degree of freedom,簡稱d.f.)的不同而改變,如圖所示:
所謂自由度指的是一統計量中各變量可以自由變動的個數,當統計量中每含一個條件時,自由度就會少一個。例如x1、x2、x3與x4等四個變量均可代表任何數,此時自由度為4,但是如果其平均值已知,在多出此一限制條件下,自由度將變為4-1=3。而在t分配中的自由度為樣本數減1,即d.f. = n-1。 當自由度越小時,t分配的離散程度越大;當自由度越大時,t分配的離散程度越小,且越接近標準常態分配。一般而言,當d.f.≧30時,t分配與標準常態分配已經很接近,尤其當d.f.→∞時,t分配即可視為標準常態分配。如圖所示。
例題6.21 根據附錄之t分配表,求出在自由度為5的情況下, P (t≧k) = 0.025的臨界值k =?
解 因為d.f. = 5且P(t≧k) = 0.025, 故查表得k = 2.571。
例題6.22 根據附錄之t分配表,求出在自由度為10的情況下, P (t≧k) = 0.05的臨界值k =?
解 因為d.f. = 10且P(t≧k) = 0.05, 故查表得k = 1.812。
例題6.23 根據附錄之t分配表,求出在自由度為8的情況下,P(t<k) = 0.99的臨界值k =?
解 因為d.f. = 8且P(t<k) = 0.99,即P(t≧k) = 0.01 故查表得k = 2.896。
例題6.24 根據附錄之t分配表,求出在樣本數為13的情況下,P(t<k) =0.9的臨界值k =?
解 因為d.f. = n-1 = 13-1 = 12且P(t<k) = 0.9,即P(t≧k) = 0.1
<重點整理> 因t表和z表的概念完全相同只是轉換公式不同,而且第6章的機率分配重點在計算z分配及t分配的正規化公式轉換及查表;我們歸納成四大部分: