機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈 第四章.分立機率分佈 機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈 P
4.1 機率的意義 機率就是長期下來事件自然發生的結果,其所佔的比例(相對次數)。 1 機率是介於0與1之間,其結果之機率和為1。 必然發生Certain 機率就是長期下來事件自然發生的結果,其所佔的比例(相對次數)。 機率是介於0與1之間,其結果之機率和為1。 擲一質地均勻的骰子,若擲很多次時,則每面出現的機率為1/6。 男女出生的比例約為1/2,即為性別出現的機率。 1 P (Event) P (A) .5 不會發生Impossible
機率的意義 試驗(experiment):獲得一個結果(outcome)或簡單事件(event)之觀測值的過程。 試驗結論的推定,主要看資料的可信度,如果可信度高其結論可靠,如果低其結論就不可靠了。 機率論(probability theory):決定可信度高低的方法。 如進行A、B兩種療效比較試驗,各選取50位病人,結果A療法有45人治癒,B療法有42人治癒,若說A法比B法好,則此推論是否可靠?
機率的意義 各種形式的統計問題,都是以機率論的原理來解釋所發生的現象。 如擲硬幣,有正面及反面兩種,若擲很多次,則可得一隨機序列(random series) 隨機試驗。 HHTHTTHHTTTHHTHTT… H或T之 比例為1/2 (機率) H或T:事件(event)、結果(outcome)
Total heads Number of tosses = 出現人頭的機率 1.00 0.75 0.50 0.25 0.00 50 100 150 200 Cumulative coin tosses (累積投擲次數)
機率基本觀念 補充 隨機試驗(random experiment):試驗前已知所有可能發生的結果,但卻無法預知會發生何種試驗結果。而在相同情況下,試驗可重複進行。 樣品空間(sample space):隨機試驗之所有樣品點所形成的集合,通常以 S 表示之。 擲骰子的試驗,其樣品空間為{1,2,3,4,5,6},而其中的1、2、3、4、5、6為樣品點。 事件(event):樣品空間的部分集合稱為事件。 如{1,6}為一事件。
S Venn Diagram范氏圖 Experiment: 擲骰子的試驗 3 1 2 6 4 5 event事件 {1, 6} 樣品點 補充 Experiment: 擲骰子的試驗 event事件 3 Other compound events could be formed: Tail on the second toss {HT, TT} At least 1 Head {HH, HT, TH} 1 {1, 6} 樣品點 2 6 4 5 S 集合的呈列 S: {1, 2, 3, 4, 5, 6} Sample space樣品空間
4.1.1 機率運算法則 加法法則(addition rule): 互斥事件(exclusive events):如果事件沒有共同的樣本點,則稱為互斥事件。 例子:丟擲一個均勻的骰子一次,出現1或3的機率為何? 解:丟擲一個均勻的骰子,每一樣品點出現的機率皆為相等,假設 為出現1的事件, 為出現3的事件,則其發生的機率為:
Venn Diagram范氏圖 互斥事件(exclusive events) Experiment: 擲骰子的試驗 Mutually Exclusive What is the intersection of mutually exclusive events? The null set. 3 1 B A S
機率運算法則 非互斥事件: 例子4.1: 某班學生50人,其中20歲的學生有35人,女性學生有30人,而女性學生中20歲的有21人,則此班學生年齡為20歲或是女性的機率有多少? 解:
S S S S Venn Diagram范氏圖 非互斥事件 P(A∪B)=P(A)+P(B)-P(A∩B) A B A∩B A∪B Mutually Exclusive What is the intersection of mutually exclusive events? The null set. P(A∪B)=P(A)+P(B)-P(A∩B) A∩B A∪B S S
機率運算法則 乘法法則(multiplication rule): 當兩試驗同時進行,而各試驗之某事件同時發生的機率,為兩事件獨立發生機率之相乘積。 例子:某地區男女性別比為男性0.51,女性則為1-0.51=0.49,試問若一個家庭四個小孩皆為女性的機率為何?又若一個家庭四個小孩一個為男性的機率為何?
機率運算法則 解:設四個皆為女性的機率為 而四個當中有一個為男性,則有下列幾種現象:BGGG、GBGG、GGBG、GGGB,其每種現象之機率皆為 所以四種現象之機率和為 4(0.06)=0.24
4.1.2 條件機率 Condition Probability 令A、B為定義於樣品空間的事件,在已知事件B發生的條件下,事件A發生的機率,即稱為事件A的條件機率,其可表示為
條件機率 100 200 例4.3 調查產婦年齡與初生嬰兒體重之現象: B(大於3500克) Bc(小於3500克) 和 產婦A 產婦Ac (大於30歲) 產婦Ac (小於30歲) 80 20 90 10 100 170 30 200 產婦大於30歲,嬰兒體重超過3500克之機率? 產婦小於30歲,嬰兒體重超過3500克之機率?
4.2 機率分佈 Probability Distribution 隨機變數(random variable):隨機試驗中,出現不同結果之對應的實數值,即稱為隨機變數。 隨機變數X 隨機變數X 機率f(x) 隨機試驗 反反 正反 反正 正正 擲兩枚硬幣 X=0 X=1 X=2 1/4 2/4 機率分佈 變數:出現正面的次數
4.3 分立隨機變數機率分佈 隨機變數(X)是以整數出現,而將不同隨機變數出現的次數除以試驗總次數,即得各隨機變數唯一對應的機率。 例4.4:同時擲三枚質地均勻的硬幣,若以正面(H)數為隨機變數X,則X機率分佈如下: 表4.2 Event X 機率 {TTT} 1/8 {HTT,THT,TTH} 1 3/8 {HHT,HTH,THH} 2 {HHH} 3
分立隨機變數機率分佈 f (x) X 機率分佈與相對次數不同,前者是在整個族群中穩定不變的理論,而後者隨樣品的不同而異,當樣品很大時,相對次數可能接近理論機率分佈。
4.4 期望值與標準偏差 分立隨機變數X之平均值(未知資料的平均值)即稱為期望值。定義如下: 分立隨機變數期望值為該變數可能值的加權平均,其權數為該數值出現的機率。如擲骰子很多次,每一點出現的機率應為1/6,其族群平均值為:
期望值與標準偏差 例4.5:設X為同時擲三個質地均勻的硬幣,其出現正面之次數,試求X之期望值(平均值)? x 1 2 3 1/8 3/8 1 2 3 1/8 3/8 6/8 合計
期望值與標準偏差 例4.6:設今有一樂透彩券發行5,000張,結果中獎獎金及中獎彩券數如下,若X為中獎獎金,試求X之機率分配及其期望值? 4,000 1,000 100 5 1 3 95 425 4,476 0.0002 0.0006 0.0190 0.0850 0.8952 0.8 0.6 1.9 0.425 5,000 1.0000 3.725
期望值與標準偏差 因 為隨機變數X之中心值,以 表示其偏差,則變數X之變方,可以偏差平方的期望值求得。 隨機變數X之變方為:
期望值與標準偏差 例4.7:求例子4.5同時擲三個質地均勻的硬幣,其出現正面之次數(X)之變方及標準偏差?
期望值與標準偏差 例4.8:求例子4.6樂透彩券獎金(X)之變方及標準偏差?
二項分佈(Binomial distribution) 試驗結果僅有二種結果 小孩性別:男,女 擲硬幣:正,反 種子發芽:發芽,不發芽 殺蟲劑成效:死亡,存活 政策:贊成;反對 進入商店:購買;不購買 一般:成功(S);失敗(F)
二項分佈(Binomial distribution) 問題:根據過去經驗一個顧客進入 某一家商店會購買商品的機率為 0.4(40%),請問三位顧客中 有二位會購買商品之機率為何? 隨機變數X:購買商品的顧客 可能出現的值:0,1,2,3 問題:p(x=2)=?
二項分佈(Binomial distribution) 問題特性: 1.本試驗包括三個相同的小試驗 每一小試驗是顧客購買商品 2.每一小試驗只有二種結果 購買(S)或不購買(F) 3.P(S)=0.4; P(F)=1-P(S)=0.6 4.每一個顧客買的機率均為0.4 5.每一個顧客均獨立購買商品(不受他人影響)
二項分佈(Binomial distribution) 樣品空間 X=2之事件包含的結果為 {SSF,SFS,FSS} SSS FFS SSF FSF SFS SFF FSS FFF
二項分佈(Binomial distribution) P(SSF)=P(S)P(S)P(F)=(0.4)(0.4)(0.6)=(0.4)20.6 P(SFS)=P(S)P(F)P(S)=(0.4)(0.6)(0.4)=(0.4)20.6 P(FSS)=P(F)P(S)P(S)=(0.6)(0.4)(0.4)=(0.4)20.6 P(X=2)=P(SSF)+P(SFS)+P(FSS) =(0.4)20.6+(0.4)20.6+(0.4)20.6 =3(0.4)20.6=0.288
1. 0.4為顧客購買商品之機率=p 2. 0.6為顧客不購買商品之機率=q=(1-p) 3. 3為X=2事件包含結果之個數 即3位顧客中有兩位顧客會 購買商品的可能組合 SSF→第一位,第二位 SFS→第一位,第三位 FSS→第二位,第三位 4.
二項分佈(Binomial Distribution) 每個小試驗包括二個結果成功(S)或失敗(F) 成功機率為p,失敗機率為q=1-p 小試驗間為互相獨立 X為成功次數
二項族群之平均值與變方 例如一個二項族群觀測值僅有五個如下 0,1,0,1,1(如1代表贊成,0代表反對) N=5 族群平均值: 族群變方:
二項族群之樣品平均值與變方 如從一個二項族群0,1,0,1,1,0,1,…中隨機抽取四個觀測值為一樣品如下: 0,1,0,1(如1代表贊成,0代表反對) n=4 樣品平均值: 樣品平均值變方: (注意:0.6在前,0.4在後) 樣品平均值變方估值: (注意:0.4在前,0.6在後)
二項分佈(Binomial Distribution) 成功機率為p,其二項分立隨機變數,記以 X~B(n,p) 若p未知,則以其估值 代替
[例]有一醫學試驗進行某新藥品對某疾病的治療效果,我們希望新藥品治癒率達90%,(無效率為10%)。今試驗20位病人,若其治癒率可靠,則應有多少病人治癒?而最多有15位病人治癒之機率為多少? 由二項分布期望值公式,其治癒人數為: E(X)=np=20(0.9)=18人
而最多有15位病人治癒之機率可利用二項分布累計機率公式求得: 至少有16位病人治癒的機率為:
[例4.10] 有一健保意見調查,若設80%居民 贊成,今獨立隨機訪問15位居民,8 個以上居民贊成之機率為多少?有 10個至14個居民贊成之機率有多 少? (1)至少有8位居民贊成之機率為 Pr(X≧8)=1-Pr(X≦7) 今n=15, x=7, p=0.8 查附表2得 Pr(X ≦7)=0.0042
二項分佈(Binomial Distribution) 故至少有8位居民贊成之機率為1-0.0042=0.9958 (2)有10至14位居民贊成之機率為 Pr(10≦X≦14) =P(X≦14)-P(X≦9) =0.9648-030611=0.9037
卜瓦松分布(Poisson Distribution) 卜瓦松分布為稀少事件個數之分布 二項分布中n很大且p很小時,其分布即變成 卜瓦松分布 例:十字路口車禍之次數 騎兵被馬踢死之人數 中正機場塔台發生錯誤的次數 一c.c.血液中某種細菌之個數
卜瓦松分布(Poisson Distribution) 機率公式 μ為卜瓦松分布之平均 ‧卜瓦松分布之特性 μ=σ2
不同之卜瓦松分布圖
例:某醫院經過幾年的調查統計,平均一天有2位車禍病人求診,若車禍病人屬卜瓦松分布,試求一天多於3位車禍病人求診之機率。 μ=2, 車禍病人 x=0,1,2,3之機率如下表
卜瓦松分布機率求法 完全沒有車禍病人之機率只有13.534%, 有一個車禍病人之機率為27.067%, 有二個車禍病人之機率為27.067%, 而有三個車禍病人之機率為18.045%, 大於三個車禍病人之機率為: P(X>3)=1-p(X≦3)=1-0.85713 =0.14287=14.287%
例:設在高速公路上平均每天有5次車禍發生,若x為某天 發生車禍之隨機變數,求下列各項機率: (a)沒有車禍發生 (b)少於3次車禍 (c)多於3次車禍 高速公路來往車輛很多,平均一天發生5次車禍應屬於 卜瓦松分布,故上述各項機率為: (a) (b) =0.00674+0.03369+0.08422+0.14037 =0.26502=26.502% (c) P(X>3)=1-P(X≦3)=1-0.26502=0.73498=73.3498%
本章結束