第 5 章 離散機率分配
統計實例 花旗銀行是花旗集團的一員,提供多樣化的金融服務。 花旗銀行在花旗卡片銀行中心內設置 了許多最先進的自動櫃員機(ATMs), 每週7天,每天24小時為客戶提供服 務。花旗銀行的ATM不只是提款機, 有80% 左右的交易都是在ATM完成 的。 因此,花旗銀行定期進行服務產能調查,以分析顧客等候時間以及增設自動櫃員機的必要性。 由花旗銀行蒐集的資料顯示顧客到達的時間是一個卜瓦松分配,利用卜瓦松分配,花旗銀行可以計算任何時間到達卡片銀行中心的顧客人數的機率,以決定最適的自動櫃員機數目。
離散機率分配 5.1 隨機變數 5.2 離散機率分配 5.3 期望值與變異數 5.4 二項機率分配 5.5 卜瓦松機率分配 5.1 隨機變數 5.2 離散機率分配 5.3 期望值與變異數 5.4 二項機率分配 .10 .20 .30 .40 0 1 2 3 4 5.5 卜瓦松機率分配 5.6 超幾何機率分配
5.1 隨機變數 隨機變數是實驗結果的數值描述。 隨機變數的可能數值若是有限個數值或一個無限的數 5.1 隨機變數 隨機變數是實驗結果的數值描述。 隨機變數的可能數值若是有限個數值或一個無限的數 列,如0, 1, 2, ...,則稱為離散隨機變數(discrete random variable)。 可指派成一區間或數個區間內的任何數值到一隨機變 數,此隨機變數稱為連續隨機變數(continuous random variable)。
離散隨機變數實例 例如將會計師資格考試視為一個實驗,該考試分為四個項目。令離散隨機變數 x=已通過的會計師資格考試項目的數目,則此隨機變數的可能數值為0, 1, 2, 3, 4。 將汽車到達收費站視為一個實驗,令隨機變數x=一天內到達收費站的車輛數,則x的可能值為0, 1, 2, ...,因此x為一離散隨機變數,它可能是無窮數列中的任一個值。
連續隨機變數實例 某保險公司正在觀察保戶的來電情況,令x= 兩通來電的時間間隔,則此一隨機變數的範圍為x > 0。事實上,x的可能值有無限多個,如1.26分、2.751分、4.3333分等。 長達90哩的某段公路,緊急救護站位於公路一端,我們定義一隨機變數x= 公路上發生意外事件的位置,則 x 為一連續隨機變數,其值的範圍為0 < x < 90。
評註 決定隨機變數為離散或連續隨機變數的一種方法是以一線段代表隨機變數的可能範圍,將隨機變數的可能值視為線段上的點,在線上選擇兩個表示隨機變數值的點,如果兩點間的所有點都是隨機變數的可能值,則該隨機變數為連續變數。
5.2 離散機率分配 隨機變數的機率分配(probability distribution)描述不 同隨機變數值的機率分配狀況。 5.2 離散機率分配 隨機變數的機率分配(probability distribution)描述不 同隨機變數值的機率分配狀況。 離散隨機變數 x 的機率分配是由機率函數(probability function)來定義的。
離散機率分配 離散機率函數的必要條件 : f(x) > 0 f(x) = 1 機率函數記作 f(x),機率函數讓我們知道各隨機變數值 的出現機率。 離散機率函數的必要條件 : f(x) > 0 f(x) = 1
離散機率分配實例 DiCarlo汽車銷售公司根據過去300天的銷售狀況得知,有54天沒有賣出任何汽車,有117天賣出1輛汽車,有72天賣出2輛,有42天賣出3輛,有12天賣出4輛,有3天賣出5輛。 表5.3所示該汽車銷售公司每天銷售汽車數的機率分配。
離散機率分配實例 機率函數也可以用圖形的方式來表達。圖5.1中隨機變數x的值列於橫軸,相對應的機率值列於縱軸。
離散型均勻機率分配 除了表和圖之外,離散隨機變數的機率函數 f(x)常用 公式來表達。最簡單的例子是離散型均勻機率分配 (discrete uniform probability distribution)。 散型均勻機率分配 f(x) = 1/n 其中: n =隨機變數的可能值個數
離散型均勻機率分配實例 以丟擲骰子的實驗為例,定義隨機變數x為丟擲一骰子之後出現的點數。因此,n=6代表可能出現6種隨機變數值,x =1, 2, 3, 4, 5, 6,可定義此隨機變數的機率函數為: f(x)=1 / 6 x=1, 2, 3, 4, 5, 6 以下為隨機變數x的可能值及其對應的機率。 x f (x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6
離散型均勻機率分配實例 另一個例子,假設隨機變數x及其離散機率分配如下表所示。 上表的機率分配亦可由如下的公式來定義。 1 1/10 x f (x) 1 1/10 2 2/10 3 3/10 4 4/10
5.3 期望值與變異數 隨機變數的期望值(expected value)或平均數來衡量隨 5.3 期望值與變異數 隨機變數的期望值(expected value)或平均數來衡量隨 機變數的中央位置(central location) E(x) = = xf(x) 變異數(variance)表示一組資料的分散程度 Var(x) = 2 = (x - )2f(x) 標準差(standard deviation)定義為變異數的正平方 根,記作 。
期望值與變異數實例 以5.2節DiCarlo汽車銷售公司為例,我們來看看汽車銷售數量的期望值是如何計算出來的。
期望值與變異數實例 表5.5中 xf(x)欄的加總是1.5輛。因此可知,雖然每個營業日的汽車銷售量可能是0, 1, 2, 3, 4或5輛,但長期而言,汽車公司可以預期每天平均銷售1.5輛車。假設該公司每月營業30天,則可預期每月平均銷售量為 30 (1.50)=45輛。 表5.6是DiCarlo汽車公司日銷售量之機率分配的變異數計算過程。由該表可知其變異數為1.25。
期望值與變異數實例
5.4 二項機率分配 二項實驗(binomial experiment)具有以下四個特性。 5.4 二項機率分配 二項實驗(binomial experiment)具有以下四個特性。 1.由 n 個相同的試驗(trials) 所構成的實驗。 2.每一試驗有兩種可能的結果,我們常以成功(success) 和失敗(failure) 稱之。 3.成功的機率為p,失敗的機率為1-p。每一試驗的 成功和失敗機率皆維持不變。 4.每一試驗皆獨立。
二項實驗實例 圖5.2表示一個包含8個試驗的二項實驗的可能結果之一。此圖顯示的是成功5次、失敗3次的情形。
二項實驗實例 在二項實驗中,我們有興趣的是n次試驗中成功的次數。令x代表成功的次數,x的可能值為0, 1, 2, 3, ... , n。由於x的可能值為有限個,因此x為一離散隨機變數。此隨機變數的機率分配稱為二項機率分配(binomial probability distribution)。
二項實驗實例 例如擲一枚硬幣5次,觀察總共出現幾次正面 此實驗包含5個相同的試驗,每一試驗為擲一枚硬幣。 每一試驗有兩個可能的結果:正面或反面。我們可以定義正面表示成功,反面表示失敗。 對每個試驗而言,出現正面的機率是0.5,出現反面的機率也是0.5。 每一試驗皆彼此獨立,因為每一試驗彼此互不影響。 因此,滿足二項實驗的特性。而我們有興趣的隨機變數x是5次試驗中正面出現的次數,在本例中x的可能值為0, 1, 2, 3, 4, 5。
二項實驗實例 有一保險業務員隨機拜訪10個家庭,若該家庭購買保險,則視為成功事件,不購買保險則視為失敗。依據過去的經驗顯示,家庭會購買保險的機率是0.1,現在看看這是否為二項實驗。我們觀察到: 這個實驗含10個相同的試驗,每拜訪一個家庭視為一試驗。 每一試驗有兩個可能的結果:購買保險或不購買(購買保險為成功,不購買保險為失敗)。 對每一家庭而言,購買的機率可假設相同,不購買的機率亦然。購買的機率為0.1,而不購買的機率為0.9。 每一試驗彼此隨機獨立,因為被拜訪的家庭是隨機選取的。
二項實驗實例 由於符合二項實驗的特性,故此例是二項實驗。隨機變數x為10個受訪家庭中購買保險的家庭數,所以x的可能值為0, 1, 2, 3, ... , 10。 二項實驗的第3個特性又稱為穩定性假設(stationarity assumption),很容易與第4個特性(試驗的獨立性)相混淆。我們特別說明如下:以前述的保險業務員為例,若業務員工作了一整天,由於身心相當疲憊,因此拜訪最後一個家庭時,該家庭購買保險的機率降為0.05。此時第3個特性(穩定性)將不成立,因此這不是一個二項實驗,但此實驗仍符合第4個特性,因為對每一家庭而言,買不買保險是獨立的。
二項實驗實例 在應用二項實驗時,有一數學公式,稱為二項機率函數(binomial probability function)。該函數可用來計算n次試驗中成功次數x的機率,利用第4章的機率觀念,我們將以一範例來說明此公式的意義。
二項實驗實例 假設有3位顧客走進馬丁服飾店,根據過去的經驗,店長估計每位顧客購買服飾的機率是0.3。那麼請問3人中有2人會購買的機率是多少? 利用樹狀圖(見圖5.3),此實驗因每一顧客的決策為買與不買,所以實驗結果有8個。令S表成功(購買),F表失敗(不購買),而我們有興趣的是3人中有2人購買的實驗結果。接下來檢驗此實驗是否為二項實驗,看看二項實驗的4個要求條件是否皆滿足。
二項實驗實例 因此,符合二項實驗的定義。 此實驗有3個相同的試驗,每一試驗為顧客進入馬丁服飾店。 每一試驗有2個實驗結果:購買或不購買(成功或失敗)。 每一顧客購買或不購買的機率(0.3及0.7)假設皆相同。 顧客間買與不買的決策是獨立的。 因此,符合二項實驗的定義。
二項分配 我們有興趣的是在n次試驗中所發生成功的次數 令 n 次試驗中有 x 次成功的實驗結果次數
二項機率分配 二項機率函數 其中: f(x) = n次試驗中x次成功的機率 n =試驗的次數 p =任何一個試驗成功的機率
二項機率分配 二項機率函數 n次試驗中有x次成功 的任一實驗結果發生的機率 n次試驗中恰有x次成功 的實驗結果數
二項機率分配實例 回到馬丁服飾店的問題,三位顧客的購買決策的例子。式(5.6)可用來計算3人中有2人購買的實驗結果數,也就是n=3次試驗中,出現x=2次成功的實驗結果共有幾種。因此根據式(5.6)可得: 式(5.6)表示3人中有2人購買的實驗結果有3個。從圖5.3中可看出這3個實驗結果,分別表示成 (S, S, F), (S, F, S) 及 (F, S, S)。
二項機率分配實例 利用式(5.6)可以得知3人皆購買的實驗結果數為: 從圖5.3可知,只有一個實驗結果是3個都成功,以(S, S, S)表示。 利用式(5.6)可計算n次試驗中,x次成功的實驗結果數。但是如果我們想瞭解n次試驗中x 次成功的機率時,則必須知道每一個實驗結果出現的機率。由於二項實驗中每一個試驗間彼此獨立,因此每一實驗結果發生的機率即為該實驗中各試驗結果出現機率的乘積。
二項機率分配實例 以本例而言,前2位顧客購買而第3位顧客不購買的機率為 pp(1-p) 已知每一試驗中購買的機率為0.30,因此前2位購買而第3位不購買的機率為 (0.30)(0.30)(0.70)=(0.30)2(0.70)=0.063 其他兩種2個成功1個失敗的實驗結果發生的機率如下所示。
二項機率分配實例 由以上可知有2個顧客會購買的共有3種實驗結果,它們出現的機率皆相同,皆為0.063。x為其他值時亦有此一特點。
二項機率分配實例 在馬丁服飾店的例子中,我們可以計算沒有顧客購買、恰有1位購買、恰有2位購買及3位都購買的機率,計算結果彙整於表5.7,此即為購買人數的機率分配。圖5.4為此機率分配的圖形表示法。
二項機率分配實例
二項機率分配實例
二項機率分配實例 二項機率函數可以應用到任何的二項實驗中,只要符合二項實驗的特性並且知道n , p及(1-p)的值就可以利用式(5.8)計算n次試驗中成功x次的機率。 如果我們將馬丁服飾店的實驗稍做變化,如10位顧客而非3位顧客,式(5.8)的二項機率函數公式仍然適用。假定有一個n=10, x=4且 p=0.30的二項實驗。10位來店顧客中恰有4位購買的機率是
二項機率分配的期望值與變異數 期望值 E(x) = = np 變異數 Var(x) = 2 = np(1 - p) 標準差
二項機率分配的期望值與變異數實例 以馬丁服飾店為例,我們可以利用式(5.9)計算顧客購買的期望人數為 假設下個月馬丁服飾店的來客數為1,000人,則會購買的人數期望值是μ=np=(1000)(0.3)=300。因此,要增加購買人數的期望值,馬丁服飾店必須設法增加來客數或增加來店顧客購買的機率。 E(x) = = 3(0.30) = 0.9
二項機率分配的期望值與變異數實例 再以馬丁服飾店為例,若來客數為3人,則購買人數的變異數及標準差為: 若來客數為1,000人時,則購買人數的變異數與標準差分別為
評註 附錄B的二項機率表中,p值都在0.5以下,當p值超過0.5時即無表可查。然而我們可以利用n-x個失敗取代x個成功,以失敗的機率1-p取代p值計算二項機率值。 某些二項機率表是以累積機率的形式表示,使用此種表格時,必須採減法運算以求出所需的機率,如f(2)=P(x ≤ 2)-P(x ≤ 1)。在本書中我們直接列出f(2)的機率值,因此,如果要計算累積機率值時,必須採加法方式加以處理,如P(x ≤ 2)=f(0)+f(1)+f(2)。
5.5 卜瓦松機率分配 卜瓦松機率分配常用來估計某特定區間或特定空間 中,發生某特定事件的次數。 x 為一離散隨機變數,其可能值為無限數列
卜瓦松機率分配 符合卜瓦松機率分配的隨機變數 洗車場每小時車輛到達的次數 高速公路每10哩需要維修的數目; 每100哩管線破損的數目。
卜瓦松機率分配 卜瓦松實驗的特性 任意兩個等長的區間發生特定事件的機率皆相同。 各區間發生或不發生某特定事件是彼此獨立的。
卜瓦松機率分配 卜瓦松機率函數 f(x) = 一區間中發生x次的機率 = 一區間中發生次數的期望值或平均數 e = 2.71828. 其中: f(x) = 一區間中發生x次的機率 = 一區間中發生次數的期望值或平均數 e = 2.71828.
卜瓦松機率分配實例 假設我們有興趣的是銀行在正常上班時間中,每15分鐘駛入汽車櫃員窗口的車輛數。假設在任何相同的時間區間中,車輛到達的機率皆相同且車輛到達與否為獨立事件。在這種情況下便可以應用卜瓦松機率分配。若根據歷史資料發現,15分鐘內車輛的平均到達數為10輛,則可應用下列機率函數。 隨機變數x是15分鐘內的來車數。
卜瓦松機率分配實例 若管理者想要瞭解15分鐘內恰有5輛車到達的機率,則此時x=5可得: 上述機率值是將μ =10, x=5代入式(5.11)中計算而得。
卜瓦松機率分配實例 計算每3分鐘1輛來車的機率 由於15分鐘內平均來車數為10輛,因此每分鐘平均來車數為 10/15 = 2/3 輛,而每3分鐘平均來車為μ=(2/3)(3分鐘)=2輛。因此,3分鐘內來車x輛的機率為 欲求3分鐘內1輛來車的機率,可利用上述公式
一個包含長度或距離區間的例子 假如我們有興趣的是某一段高速公路路段,經重新舖設路面一個月後,發現重要瑕疵的數量。假設在此路段的任何兩個區間中,發現一個瑕疵的機率皆相同,且各區間發現瑕疵與否為獨立事件。因此可以應用卜瓦松機率分配。 假設每哩在重新舖設路面一個月後,發現重大瑕疵的平均數目為2個,則在3哩內沒有發現重大瑕疵的機率為何?因為我們有興趣的長度區間為3哩,因此3哩的平均瑕疵數為μ=(2個 / 哩)(3哩)=6個,利用式(5.11),f(0)=6e/0!=0.0025,可得3哩內沒有重大瑕疵數的機率為0.0025,表示在3哩內沒有重大瑕疵的可能性非常小。事實上,在3哩長的路段裡至少有1個重大瑕疵的機率為1-0.0025=0.9975。
5.6 超幾何機率分配 超幾何機率分配(hypergeometric probability 5.6 超幾何機率分配 超幾何機率分配(hypergeometric probability distribution)與二項機率分配關係相當密切。 兩者主要的差別有二, 超幾何分配的各試驗並不獨立 超幾何分配成功的機率隨試驗而有不同。
超幾何機率分配 超幾何機率函數 其中: f(x) = n次試驗中x次成功的機率 n = 試驗的次數 N = 母體大小 for 0 < x < r 其中: f(x) = n次試驗中x次成功的機率 n = 試驗的次數 N = 母體大小 r = 母體中成功的個數
超幾何機率分配 超幾何機率函數 for 0 < x < r 表示從母體總失敗個 數N-r中,選出n-x個失敗 個數的可能組合 表示從母體總成功個 數 r 中,選出 x 個成功個 數的可能組合 表示從母體大小為N中, 選出n個樣本的可能組合
超幾何機率分配實例 品管的例子 某家公司生產燈絲,12個燈絲包裝成一盒。品管檢驗員隨機從一盒產品中抽出3個檢驗。假定該盒恰有5個瑕疵品,檢驗員抽出的3個燈絲中恰有一個是瑕疵品的機率為何?在此例中,n=3且N=12,每盒裡有r=5個瑕疪品,要計算抽出的瑕疵品個數x=1的機率,計算公式為:
超幾何機率分配實例 假定我們想知道至少有一個瑕疵品的機率。最簡單的方式是先算出沒有瑕疵品的機率,x=0的機率是 已知沒有瑕疵品的機率 f(0)=0.1591,可以求出至少有一個瑕疵品的機率是1-0.1591=0.8409。因此,至少發現一個瑕疵品的機率很高。
超幾何分配 平均數 變異數
超幾何分配實例 燈絲的例子中n=3, r=5且N=12,所以瑕疵品的平均數及變異數是 標準差是 σ=
超幾何分配 以 n 個試驗的超幾何分配而言,令p=(r / N)表示第一次 試驗的成功機率。 如果母體很大,式(5.14)中的(N-n)/(N-1)會接近1 期望值與變異數可以寫成 E(x) = np, Var(x) = np(1 – p). 這也是二項分配的期望值與變異數公式 continued
超幾何分配 在母體很大時,可以用n次試驗,每次成功機率 p=(r / N) 的二項分配來求得超幾何分配的近似值。
End of Chapter 5