四、分立隨機變數 (Discrete Random Variables) 劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生統資訊組 jpliu@ntu.edu.tw
機率分布(Probability Distribution) 二項分布(Binomial Distribution) 卜瓦松分布(Poisson Distribution)
分立隨機變數 例:擲硬幣三次 令X為出現正面的次數 X可能的值為0,1,2,3 在未擲硬幣三次前不知X之值 故X稱為分立隨機變數(Discrete Random Variables) 其相應的機率稱為分立隨機變數之機率分布
分立隨機變數 擲硬幣三次的樣品空間 HHH,HHT,HTH,THH HTT, THT,TTH, TTT X Event 機率 {TTT} {TTT} 1/8 1 {HTT,THT,TTH} 3/8 2 {HHT,HTH,THH} 3 {HHH}
分立隨機變數 例:擲硬幣三次正面出現至少二次的機率 P(X≧2)=P(X=2)+P(X=3) =3/8+1/8 =1/2 正面出現少於二次的機率 P(X<2)= 1-P(X≧2) =1-1/2
分立變數期望值(Expected Value) 分立變數期望值為該變數可能值的加權平均,其權數為該數值出現的機率。
分立變數期望值(Expected Value) 例:擲硬幣三次出現正面(H)之機率分布及期望值 x p(x) xp(x) 1/8 1 3/8 2 6/8 3 和 12/8=1.5=μ
例:樂透彩券中獎機率分佈及期望值 獎金 彩券數 機率p(x) x‧p(x) 4,000 1 0.0002 0.8 1,000 3 0.0006 0.6 100 95 0.0190 1.9 5 425 0.0850 0.425 4,476 0.8952 和 5,000 1.0000 3.725=μ
例:某流行歌曲的收聽率(排行) 評分(x) 機率p(x) x‧p(x) 1 0.7 2 0.07 0.14 3 0.22 0.66 4 0.21 0.84 5 0.43 2.15 和 3.86=μ
例:保險公司壽險額$20,000,保費$300/year 利潤x 機率p(x) x‧p(x) $300 (保險人未死亡) 0.999 299.7 $300-20,000=-19,700 (保險人死亡) 0.001 -19.7 和 280=μ=利潤
分立變數的變方(Variance) 分立變數的變方 分立變數之變方為每個可能值與期望值偏差平方之加權平均,權數為其數值之機率
擲三個硬幣出現正面之變方計算表 x x-μ (x-μ)2 p(x) (x-μ)2‧p(x) -1.5 2.25 1/8 0.28125 1 -1.5 2.25 1/8 0.28125 1 -0.5 0.25 3/8 0.09375 2 0.5 3 0.75=σ2
分立變數的變方(Variance) 樂透彩券獎金之變方與標準偏差 σ2 =Σx2‧p(x)-μ2 =40002×0.0002+10002×0.0006 +1002×0.019+52×0.085+02×0.8952-3.7252 =3992.125-13.8756 =3978.2494
二項分佈(Binomial distribution) 試驗結果僅有二個結果 擲硬幣:正,反 種子發芽:發芽,不發芽 小孩性別:男,女 殺蟲劑成效:死亡,存活 政策:贊成;反對 進入商店:購買;不購買 一般:成功(S);失敗(F)
二項分佈(Binomial distribution) 問題:根據過去經驗一個顧客進入 某一家商店會購買商品的機率為 0.4(40%),請問三位顧客中 有二位會購買商品之機率為何? 隨機變數X:購買商品的顧客 可能出現的值:0,1,2,3 問題:p(x=2)=?
二項分佈(Binomial distribution) 問題特性: 1.本試驗包括三個相同的小試驗 每一小試驗是顧客購買商品 2.每一小試驗只有二種結果 購買(S)或不購買(F) 3.P(S)=0.4; P(F)=1-P(S)=0.6 4.每一個顧客買的機率均為0.4 5.每一個顧客均獨立購買商品(不受他人影響)
二項分佈(Binomial distribution) 樣品空間 X=2之事件包含的結果為 {SSF,SFS,FSS} SSS FFS SSF FSF SFS SFF FSS FFF
二項分佈(Binomial distribution) P(SSF)=P(S)P(S)P(F)=(0.4)(0.4)(0.6)=(0.4)20.6 P(SFS)=P(S)P(F)P(S)=(0.4)(0.6)(0.4)=(0.4)20.6 P(FSS)=P(F)P(S)P(S)=(0.6)(0.4)(0.4)=(0.4)20.6 P(X=2)=P(SSF)+P(SFS)+P(FSS) =(0.4)20.6+(0.4)20.6+(0.4)20.6 =3(0.4)20.6
1. 0.4為顧客購買商品之機率=p 2. 0.6為顧客不購買商品之機率=q=(1-p) 3. 3為X=2事件包含結果之個數 即3位顧客中有兩位顧客會 購買商品的可能組合 SSF→第一位,第二位 SFS→第一位,第三位 FSS→第二位,第三位 4.
二項分佈(Binomial Distribution) 每個小試驗包括二個結果成功(S)或失敗(F) 成功機率為p,失敗機率為q=1-p 小試驗間為互相獨立 X為成功次數 附表2 (P.459-470)
二項分佈(Binomial Distribution) 二項分布之期望值與變方 μ = np σ2 = npq σ = n個相同小試驗其成功機率 為p之二項分立隨機變數,記 X~Bin(n,p)
有一醫學試驗進行某新藥品對某疾病的治療效果,我們希望新藥品治癒率達90%,(無效率為10%)。今試驗20位病人,若其治癒率可靠,則應有多少病人治癒?而最多有15位病人治癒之機率為多少? 由二項分布期望值公式,其治癒人數為: E(X)=np=20(0.9)=18人
而最多有15位病人治癒之機率可利用二項分布累計機率公式求得: 至少有16位病人治癒的機率為:
[例4.10] 有一健保意見調查,若設80%居民 贊成,今獨立隨機訪問15位居民,8 個以上居民贊成之機率為多少?有 10個至14個居民贊成之機率有多 少? (1)至少有8位居民贊成之機率為 Pr(X≧8)=1-Pr(X≦7) 今n=15, x=7, p=0.8 查附表2得 Pr(X ≦7)=0.0042
二項分佈(Binomial Distribution) 故至少有8位居民贊成之機率為1-0.0042=0.9958 (2)有10至14位居民贊成之機率為 Pr(10≦X≦14) =P(X≦14)-P(X≦9) =0.9648-030611=0.9037
卜瓦松分布(Poisson Distribution) 卜瓦松分布為稀少事件個數之分布 二項分布中n很大且p很小時,其分布即變成 卜瓦松分布 例:十字路口車禍之次數 騎兵被馬踢死之人數 中正機場塔台發生錯誤的次數 一c.c.血液中某種細菌之個數 附表3(P.471-P.472)
卜瓦松分布(Poisson Distribution) μ為卜瓦松分布之平均 ‧卜瓦松分布之特性 μ=σ2
例:某醫院經過幾年的調查統計,平均一天有2位車禍病人求診,若車禍病人屬卜瓦松分布,試求一天多於3位車禍病人求診之機率。 μ=2, 車禍病人 x=0,1,2,3之機率如下表
完全沒有車禍病人之機率只有13.534%, 有一個車禍病人之機率為 27.067%, 有二個車禍病人之機率為 27.067%, 而有三個車禍病人之機率為 18.045%, 大於三個車禍病人之機率為: P(X>3)=1-p(X≦3)=1-0.85713 =0.14287=14.287%
例:設在高速公路上平均每天有5次車禍發生,若x為某天 發生車禍之隨機變數,求下列各項機率: (a)沒有車禍發生 (b)少於3次車禍 (c)多於3次車禍 高速公路來往車輛很多,平均一天發生5次車禍應屬於 卜瓦松分布,故上述各項機率為: (a) (b) =0.00674+0.03369+0.08422+0.14037 =0.26502=26.502% (c)P(X>3)=1-P(X≦3)=1-0.26502=0.73498=73.3498%
總結(Summary) 機率分布 二項分布 μ =n‧p σ2=n‧pq 卜瓦松分布 μ =σ2
習題: P.108 2,3 P.109 5