第 6 章 連續機率分配
統計實例 寶鹼公司 (Procter & Gamble, P&G) 是一家全球性的日用品製造商,該 公司的產品包括清潔劑、嬰兒尿布 、成藥、牙膏、肥皂、漱口水,以 及衛生紙等。 寶鹼公司的工業化學部門是油脂性酒精的主要供應商,這種酒精是從天然植物油 (如椰子油) 或石油裂解物抽取而成。 第6章連續機率分配 第220頁
連續機率分配 6.1 均勻機率分配 6.2 常態機率分配 6.3 二項機率的常態分配近似值 6.4 指數機率分配 x 指數 均勻 常態 6.1 均勻機率分配 6.2 常態機率分配 6.3 二項機率的常態分配近似值 6.4 指數機率分配 x f (x) 指數 f (x) x 均勻 x f (x) 常態 第6章連續機率分配 第119頁
連續機率分配 對離散隨機變數而言,機率函數 f (x) 提供一特定隨機變數 x 所對應的機率值。 對連續隨機變數而言,也有一種函數類似機率函數,稱為機率密度函數 (probability density function) 。 以計算連續隨機變數的機率可說是計算在此區間之內任何隨機變數值的機率。 第6章連續機率分配 第220頁
連續機率分配 連續隨機變數的機率定義的另一個涵義是任何特定隨機變數值的機率值為 0 ,因為 f(x)圖形上任何一點所佔的面積為0,6.1節將介紹均勻機率分配以說明連續隨機變數的相關概念。 x1 x2 指數 x f (x) f (x) x 均勻 x1 x2 x f (x) 常態 x1 x2 第6章連續機率分配 第221頁
6.1 均勻機率分配 只要機率值與區間長度成比例時,此隨機變數即為均勻分配。 均勻機率分配 第6章連續機率分配 第221頁
均勻機率分配實例 假設我們得到充分的飛行資料,並獲知飛行時間為 120 分鐘至 140 分鐘之內任一分鐘的機率都是相同的。 飛行時間和機率密度函數可用均勻機率分配表示為 第6章連續機率分配 第221頁
均勻機率分配實例 圖 6.1 是此機率密度函數的圖形。在飛行時間的例子中,a=120而b=140。 第6章連續機率分配 第221頁 圖6.1
均勻機率分配實例 在飛行時間的例子中,其機率問題可以是:飛行時間介於 120 分鐘到 130 分鐘的機率為何?也就是 P(120 ≤ x ≤ 130) 是多少?由於飛行時間必須介於120 分鐘到 140 分鐘之間,而且是均勻分配,我們可以說 P(120 ≤ x ≤ 130)=0.50。接下來,我們將說明此機率值可以利用介於 x=120 到 130 的 f (x) 圖形下方面積求得 (見圖 6.2)。 第6章連續機率分配 第221-222頁
均勻機率分配實例 第6章連續機率分配 第222頁 圖6.2
均勻機率分配實例-以面積衡量機率 首先考慮圖 6.2 中介於 120 至 130 間的 f (x) 圖形下方的面積,此區域是一個長方形,寬度為 130-120=10,而高度為機率密度函數 f (x) 的值=1/20,面積則為寬度×高度=10(1/20)=10/20=0.50。 由 f (x) 圖形下方的面積及機率,可得知什麼結果?面積等於機率。事實上,對所有的連續隨機變數而言都是如此。一旦確認了機率密度函數 f (x),計算較小的 x1值到較大的 x2 值之間的面積就可得到機率值。 第6章連續機率分配 第222頁
均勻機率分配實例-以面積衡量機率 已知飛行時間的均勻機率分配,及機率函數圖形下方的面積就等於機率,我們便可以回答關於飛行時間的機率問題。例如,飛行時間為 128 分鐘到 136 分鐘的機率是多少?區間的寬度是 136-128=8,高度則是 f (x)=1/20,所以,P(128 ≤ x ≤ 136)=8(1/20)=0.40。 請注意 P(120 ≤ x ≤ 140)=20(1/20)=1,也就是說機率密度函數下的總面積等於 1。此一特性對所有的連續機率分配皆成立,而且此特性可類比為離散機率函數之總和等於 1。對連續機率密度函數而言,任一 x 值的 f (x) ≥ 0 也是必要的,這個條件亦可類比為離散機率函數的 f (x) ≥ 0。 第6章連續機率分配 第222頁
均勻機率分配實例-以面積衡量機率 處理連續隨機變數和離散隨機變數時,有兩個主要的不同點: 我們不再說某一特定變數值的機率值,而以隨機變數值在某一區間的機率來替代。 隨機變數在區間 x1 至 x2 的機率值,是機率密度函數在該區間的圖形下方的面積;也就是說一連續隨機變數在任何特定值時的機率是 0,因為該點的面積在f (x) 圖形下的總面積為 0。 第6章連續機率分配 第222頁
均勻機率分配 x 的期望值 x 的變異數 E(x) = (a + b)/2 Var(x) = (b - a)2/12 第6章連續機率分配 第223頁
均勻機率分配實例 應用這些公式來計算從芝加哥到紐約的飛行時間之均勻分配,我們可以得到: 標準差為變異數的正平方根,因此, σ =5.77分鐘。 第6章連續機率分配 第223頁
評註 對連續隨機變數而言,變數為任何特定值時的機率皆為零;因此,P(a ≤ x ≤ b)=P(a , x , b),這說明了無論這個區間是否包含端點的隨機變數值,此區間的機率皆相同。 為了更進一步顯現機率密度函數的機率不是高度,可以觀察下列的均勻機率分配: 在 x 值為 0 到 0.5 之間的機率密度函數 f(x) 高度為 2,但機率值一定不會大於 1。因此,我們不能視機率密度函數值 f(x) 為機率值 x。 第6章連續機率分配 第223頁
6.2 常態機率分配 常態機率分配 (normal probability distribution) 可以說是描述連續隨機變數最重要的機率分配。 常態分配的運用範圍很廣,諸如身高、體重、測驗的分數、科學測量、降雨量等等的隨機變數,都適合以常態分配來描述。 第6章連續機率分配 第225頁
常態機率分配 常態機率分配的運用範圍很廣 身高、體重 科學測量 第6章連續機率分配 第225頁
常態機率分配 常態機率分配的運用範圍很廣 測驗的分數 降雨量 第6章連續機率分配 第225頁
常態機率分配 常態機率密度函數 其中: e = 2.71828 μ = 平均數 σ = 標準差 π = 3.14159 μ = 平均數 σ = 標準差 π = 3.14159 e = 2.71828 第6章連續機率分配 第225頁
常態機率分配 第6章連續機率分配 第225頁 圖6.3
常態機率分配 特性 曲線是對稱的,常態分配的偏度為 0。 x 第6章連續機率分配 第226頁
常態機率分配 特性 不同的平均數 μ 和標準差 σ 可以形成不同的 常態分配。 標準差 s x 平均數 μ 第6章連續機率分配 第226頁
常態機率分配 特性 常態曲線的最高點落在平均數,平均數同時也是分配 的中位數和眾數。 x 第6章連續機率分配 第226頁
常態機率分配 特性 常態分配的平均數可以是任意數值:負、零或正的 值,下圖是三個有不同平均數(−10, 0, 20)的常態曲線。 x -10 20 第6章連續機率分配 第226頁
常態機率分配 特性 標準差可以決定曲線的寬度,標準差較大則曲線看起 來較寬較扁平,這表示資料比較分散。 s = 15 s = 25 x 第6章連續機率分配 第226頁
常態機率分配 特性 常態隨機變數的機率可以由曲線下方的面積求得。常 態機率分配曲線下所涵蓋的總面積為 1 。由於分配是 態機率分配曲線下所涵蓋的總面積為 1 。由於分配是 對稱的,平均數以左的曲線下方的總面積是0.5,平均 數以右的曲線下方的總面積也是0.5。 .5 .5 x 第6章連續機率分配 第226頁
常態機率分配 特性 常態隨機變數落在離平均數 ± 1個標準差內的機率 為68.3%。 常態隨機變數落在離平均數 ± 2個標準差內的機率 為95.4%。 常態隨機變數落在離平均數 ± 3個標準差內的機率 為99.7%。 第6章連續機率分配 第頁
常態機率分配 特性 x 99.72% 95.44% 68.26% m m – 3s m – 1s m + 1s m + 3s m – 2s 第6章連續機率分配 第227頁 圖6.4
標準常態機率分配 當一個隨機變數具有常態分配且其平均數為 0,標準 差為 1 時,則稱此變數具有標準常態機率分配 (standard normal probability distribution) 。 第6章連續機率分配 第227頁
標準常態機率分配 字母 z 常被用來代表這個特殊的常態隨機變數。 s = 1 z 第6章連續機率分配 第227頁 圖6.5
標準常態機率分配 給定一 z 值,我們可以利用標準常態表求得機率 (曲線下的區域)。 第6章連續機率分配 第227.228頁 表6.1
標準常態機率分配 第6章連續機率分配 第228頁 表6.1
標準常態機率分配 第6章連續機率分配 第228頁 表6.1
標準常態機率分配實例 標準常態隨機變數的 z 值如果從 0.00 到 1.00,則其相對應的機率將是多少?也就是 P(0.00 ≤ z ≤ 1.00) 是多少?下圖中的陰影部分即為此面積或機率。 第6章連續機率分配 第228-229頁
標準常態機率分配實例 表 6.1 內的值代表在標準常態分配下,標準常態曲線在平均數 z=0 與另一已知 z 的正值間所形成的面積(可參照表 6.1 上方的圖示)。若要找 z=0 與 z=1.00 之間的面積,我們必須找出表中 z =1.00時所對應的值。先在左欄的 z 值中找到1.0的值,然後在最上方的橫列上找出0.00行,行與列交叉處的值為 0.3413,如此,就可以找到所要計算的機率 P(0.00 ≤ z ≤ 1.00)=0.3413。下表為表6.1的部分資料,用來說明上述的程序。 第6章連續機率分配 第229頁
標準常態機率分配實例 利用同樣方法,也可計算 P(0.00 ≤ z ≤ 1.25) 的值,首先找出左欄 z 值為 1.2 的橫列,然後向右移到0.05那一行,我們可以發現 P(0.00 ≤ z ≤ 1.25)=0.3944。 第6章連續機率分配 第229頁
標準常態機率分配實例 再用另一個例子說明標準常態分配表的用法。我們來找介於 z=−1.00和 z=1.00的機率值,即P(−1.00 ≤ z ≤ 1.00)。 使用表 6.1 可以注意到先前 z=0.00到 z=1.00的機率值為 0.3413,而且常態機率分配是對稱的(symmetric),所以 z=0.00 到 z= −1.00 與 z=0.00到 z=1.00 有相同的機率值,因此 z 由z= −1.00到z= +1.00的機率值為 P(−1.00 ≤ z ≤ 0.00)+P(0.00 ≤ z ≤ 1.00) =0.3413+0.3413=0.6826 其面積如下圖所示。 第6章連續機率分配 第229頁
標準常態機率分配實例 第6章連續機率分配 第230頁
標準常態機率分配實例 同樣的道理,我們可以利用表 6.1 算出 z 值由 -2.00 至 +2.00 的機率為0.4772+0.4772=0.9544,而 z 值由 -3.00 到 +3.00 的機率則為 0.4987+0.4987=0.9974。我們知道在連續隨機變數曲線下的總面積必須為 1.0000,所以機率為0.9974 表示幾乎所有的 z 值都會落在 -3.00 與 +3.00 之間。 接下來,將計算 z 值至少是 1.58 的機率,也就是計算 P(z ≥ 1.58) 的值。首先,我們可以在表 6.1 中找到 z=1.5 的列、z=0.08 的行,即 P(0.00 ≤ z ≤ 1.58)=0.4429 第6章連續機率分配 第230頁
標準常態機率分配實例 由於常態分配是對稱的,而且總面積等於 1,以平均數為界,大於平均數與小於平均數的面積各佔 50%。由於0.4429 代表是由平均數到 z=1.58之間的面積,故 z ≥ 1.58的機率為 0.5000-0.4429=0.0571 ,其機率如下圖所示。 第6章連續機率分配 第230頁
標準常態機率分配實例 若z 值是-0.50 或更大的值,則 P(z ≥ -0.50) 的機率是多少呢? 在計算機率時,我們可以將機率寫成兩個機率的和:P(z ≥ -0.50)=P(-0.50 ≤ z ≤ 0.00)+P(z ≥ 0.00)。 先前已經知道 P(z ≥ 0.00)=0.50,且也知道由於常態分配的對稱關係,使得 P(-0.50 ≤ z ≤ 0.00)=P(0.00 ≤ z ≤ 0.50)。參考表 6.1,找到P(0.00 ≤ z ≤ 0.50)=0.1915 ,因此 P(z ≥ -0.50)=0.1915+0.5000=0.6915 ,其機率如下圖所示。 第6章連續機率分配 第230頁
標準常態機率分配實例 第6章連續機率分配 第231頁
標準常態機率分配實例 計算 z 從1.00到1.58的機率值,亦即 P(1.00 ≤ z ≤ 1.58)的值。在前幾個範例中,我們知道 z 從 z= 0.00到 z= 1.00的機率為 0.3413,而且 z 從 z= 0.00到 z= 1.58的機率為 0.4429,因此 z 從 z= 1.00到 z= 1.58的機率值將為 0.4429-0.3413=0.1016,即 P(1.00 ≤ z ≤ 1.58)=0.1016 ,此情況如下圖所示。 第6章連續機率分配 第231頁
標準常態機率分配實例 最後,來看看 z 值應為何,才能使隨機變數大於 z 值的機率是0.10,狀況如下圖所示。 第6章連續機率分配 第231頁
標準常態機率分配實例 回想表 6.1 的值是常態曲線在介於平均數到一特定 z 值之區間內的面積,現已知曲線右尾的面積為 0.10,因此,我們必須先求 z 值與平均數間的面積。由於大於平均數的面積為 0.5000,故目標 z 值與平均數間的面積為 0.5000-0.1000=0.4000。我們檢視表 6.1,發現 0.3997 最接近 0.4000,下表即顯示此結果。 第6章連續機率分配 第231頁
標準常態機率分配實例 從0.3997 所對應出的 z 之行列值顯示 z=1.28 *,因此在平均數與 z=1.28 間的面積接近 0.4000 (實際為 0.3997),根據題目的要求,z 值大於 1.28 的機率約為0.10。 第6章連續機率分配 第232頁
常態分配的機率計算方法 轉換成標準常態分配 一個有平均數μ,標準差σ的常態分配 隨機變數 x 轉換為標準常態 z 值的公式 第6章連續機率分配 第232頁
常態分配的機率計算方法 當 x 值等於平均數μ時 z=(μ-μ) / σ =0。因此當 x 值等於平均數μ時,所對應的 z 值即平均數 0。現在假設 x 值大於平均數一個標準差,也就是 x=μ+σ時,運用式 (6.3),我們可以算出其對應的 z 值為 z=[(μ+σ)-μ] / σ =σ/σ=1。因此,大於平均數一個標準差的值所對應的 z值等於 1,我們可以將 z 值解釋為常態隨機變數 x 距離其平均數μ的標準差個數。 第6章連續機率分配 第232頁
常態分配的機率計算方法 看看如何利用此種轉換算出任何常態機率分配的機率值,假設有平均數μ=10,標準差σ=2的常態分配,隨機變數 x 介於 10 到 14 間的機率值為何?利用式 (6.3),可求得當 x=10 時,z= (x-μ) /σ=(10-10) / 2=0 且當 x=14 時,z=(14-10) / 2=4 / 2=2。故欲求 x 介於 10 到 14 間的機率值,就等於在找 z 介於標準常態分配 0 到 2之間的機率值。也就是說,我們所要找的隨機變數 x 值的區域面積,剛好等於平均數到距平均數兩個標準差間的面積,利用 z=2.00 及表 6.1 可得機率值為 0.4772,因此 x 介於 10 到 14 之間的機率為 0.4772 第6章連續機率分配 第232-233頁
Grear輪胎公司的問題 現在來看一個常態機率分配的應用範例。Grear輪胎公司最近發展出一種新的輻射鋼圈輪胎,預計將透過全國性的連鎖商店進行銷售。由於該輪胎是新產品,Grear的經理們相信哩程保證將是顧客接受與否的重要因素之一。在還未訂定其哩程保證策略時,他們想先知道有關該輪胎的哩程測試資料。 實際的道路測試中,Grear的工程師們估計平均的哩程數可達 μ=36,500 哩,而標準差為 σ=5,000 哩,而且資料也顯示哩程數呈常態分配,那麼輪胎能跑超過 40,000 哩的機率是多少?此問題可以利用圖 6.6 來解釋。 第6章連續機率分配 第233頁
圖6.6 Grear輪胎公司的哩程分配 第6章連續機率分配 第233頁 圖6.6
Grear輪胎公司的問題 當 x=40,000,我們得到 參考圖 6.6 的下方, x=40,000時所對應的標準常態分配 z 值等於0.70。查表 6.1,從平均數到 z=0.70的面積為0.2580。再看圖 6.6,x 介於36,500到40,000的Grear輪胎常態分配圖中的面積也是0.2580,因此0.5000-0.2580=0.2420就是 x 超過40,000哩的機率,我們可以判定大約有24.2%的輪胎可以跑超過40,000哩。 第6章連續機率分配 第233頁
Grear輪胎公司的問題 現在假設 Grear 輪胎公司想要提出一個哩程保證,若新輪胎未能達到此保證哩程,該公司就免費更換新的輪胎給顧客,那麼要訂定多少哩程數,才可使獲得優惠者不超過總數的 10%?此問題可以用圖 6.7 表示。 第6章連續機率分配 第233-234頁
Grear輪胎公司的問題 第6章連續機率分配 第234頁 圖6.7
Grear輪胎公司的問題 根據圖6.7,有 40% 的面積必須介於平均數和未知的保證哩程數之間,由表6.1,機率值為 0.4000 的地方,我們可以看出此區域為小於平均數 1.28 個標準差,也就是 z=-1.28,此為其哩程保證的標準常態隨機變數值,而相對於 z=-1.28 的實際哩程數 x 為: 又 μ =36,500且 σ =5,000 x=36,500-1.28(5000)=30,100 第6章連續機率分配 第234頁
Grear輪胎公司的問題 因此,哩程標準訂在30,100哩,約有10% 的輪胎未達到此保證哩程數,或許Grear公司會根據此項資訊而將哩程保護訂在30,000哩。 第6章連續機率分配 第234頁
6.3 二項機率的常態分配近似值 二項隨機變數則是 n 個試驗中成功的次數,二項機率關心的是 n 個試驗中成功次數 x 的機率。 6.3 二項機率的常態分配近似值 二項隨機變數則是 n 個試驗中成功的次數,二項機率關心的是 n 個試驗中成功次數 x 的機率。 在試驗次數大於 20,np ≥ 5 及 n(1-p) ≥ 5 時,使用常態分配可很容易地求出二項分配的近似值。 第6章連續機率分配 第237頁
二項機率的常態分配近似值 設 = np 我們稱由 12 加減的 0.5 為連續校正因子 (continuity correction factor)。因為要以連續分配來近似離散分配的值,因此要以連續校正因子校正之。 離散二項分配的機率值P(x=12) 可以利用連續常態分配的 P(11.5 ≤ x ≤ 12.5) 來近似之。 第6章連續機率分配 第238頁
二項機率的常態分配近似值 將常態分配轉換為標準常態分配以計算P(11.5≤ x ≤12.5) 。我們可以利用下列的式子: 由表6.1,我們可以找到介於 10 到 12.5 的曲線下方的面積是 0.2967 (見圖6.8) 。同樣的,我們可以知道介於 10 到 11.5 的曲線下方的面積是 0.1915。因此,介於 11.5 到 12.5 之間的面積是 0.2967-0.1915=0.1052。在100次試驗中,12次成功的常態分配近似值是0.1052。 第6章連續機率分配 第238頁
二項機率的常態分配近似值 第6章連續機率分配 第238頁 圖6.8
二項機率的常態分配近似值 如果我們想知道 100 張發票中,13張(含)以下有錯誤的機率。圖 6.9 是近似此二項分配機率的常態分配。請注意,使用連續校正因子的結果是,我們要以 13.5 來求近似機率。對應於 x=13.5 的 z 值是 表 6.1 顯示,在標準常態分配曲線以下介於 0 到 1.17 之間的面積是 0.3790。 圖 6.9 中以常態曲線來求 13 的二項機率近似值,也就是 100 張發票中,13張(含)以下有錯誤的機率是陰影的部分,機率是 0.3790+0.5000=0.8790。 第6章連續機率分配 第239頁
二項機率的常態分配近似值 第6章連續機率分配 第239頁 圖6.9
6.4 指數機率分配 一個常被用來描述完成工作所需時間的連續機率分配是指數機率分配(exponential probability distribution) 。 指數隨機變數可以用來描述如:s 車輛到達洗車 場的時間間隔 貨車裝貨時間 公路路面損壞的 間隔距離 SLOW 第6章連續機率分配 第240頁
指數機率分配 指數機率密度函數 x > 0, μ > 0 第6章連續機率分配 第241頁
指數機率分配 第6章連續機率分配 第241頁 圖6.10
指數機率分配 如同其他連續機率分配,分配曲線下的區段面積決定隨機變數在某範圍內的機率。在 Schips 碼頭的例子中,裝貨時間少於(含)6 分鐘的機率 (x ≤ 6)是圖 6.10 中 x=0 到 x=6 之間的曲線下面積;同樣的,裝貨時間少於(含)18 分鐘的機率 (x ≤ 18)則是 x=0 到 x=18 之間的曲線下面積。另外,裝貨時間為 6 分鐘到 18 分鐘的機率(6 ≤ x ≤ 18)則是計算 x=6 到 x=18 之間曲線下的面積。 第6章連續機率分配 第241頁
指數機率分配:累積機率 指數分配:累積機率 其中: x0 =小於等於某一特定 x 值 第6章連續機率分配 第241頁
指數機率分配:累積機率 在Schips碼頭的例子中,x=裝貨時間且μ =15,因此: 所以,裝貨時間少於(含)6分鐘的機率 圖 6.11 為裝貨時間少於(含)6分鐘的機率或面積。使用式 (6.5),裝貨時間少於(含)18分鐘的機率 P(x ≤ 18)則為 因此,裝貨時間介於 6 分鐘到 18 分鐘的機率等於0.6988-0.3297=0.3691。我們可以用相同的方法算出任何區間的機率值。 第6章連續機率分配 第241-242頁
指數機率分配:累積機率 前述例子中,裝貨所需平均時間為μ =15分鐘。指數分配的特徵之一是,平均數與標準差相等。因此,裝貨時間的標準差σ=15分鐘,變異數為σ2=(15)2=225。 第6章連續機率分配 第242頁
指數機率分配:累積機率 第6章連續機率分配 第242頁 圖6.11
卜瓦松分配與指數分配的關係 卜瓦松分配適合用來表示某一區間內 的事件發生次數的機率 指數分配可以描述二次事件發生的 時間間隔的機率 第6章連續機率分配 第242頁
卜瓦松分配與指數分配的關係 假設洗車場的來車數量呈卜瓦松機率分配,平均每小時 10 輛汽車,則以 x 表示來車車數的卜瓦松機率分配函數將是 由於平均到達車數為每小時 10 輛,則連續到達的 2 輛汽車之間的時間間隔為 第6章連續機率分配 第243頁
卜瓦松分配與指數分配的關係 因此,對應的指數分配是平均數為μ =0.1小時/車;而指數機率密度函數為 第6章連續機率分配 第243頁
評註 如圖6.10所示,指數分配是右偏分配。事實上,指數分配的偏度是 2。第 3 章曾介紹偏度大於 2 者為嚴重右偏。所以,指數分配恰好可以讓我們瞭解嚴重右偏的資料分配的形狀。 第6章連續機率分配 第243頁
End of Chapter 6