第四章 機率概論
4.1 導論 機率事件在我們生活中的確是無所不在: 明天台北市下雨的機率為30%; 丟骰子的那一瞬間,心裏盤算“勝算有多少,贏的機率有多大”; 統一發票的中獎的機率有多大。 定義4.1.1 機率即為衡量某一事件在未來發生的可能性,並將此可能性數量化。
4.1 導論 一般而言,統計學研究的範圍可分為兩大部份: 1. 敘述統計(descriptive statistics): 將其所得到的資料,歸納整理之後,僅只描述並分析它們 的特性。 2. 推論統計(statistical inference): 以抽樣方法獲得樣本,並根據樣本實際資料的分析來推論或判斷母體的狀態,進而預測未來,做出決策。
4.2 機率學入門 機率事件: “在擲一公平骰子實驗當中,出現6點的機率為1/6 ”。這裡所稱的“實驗”,並不是我們直覺所聯想到必須在實驗室所進行的化學實驗或物理實驗。 機率學中對“實驗”有著更嚴謹的定義。 定義4.2.1 實驗(experiment)是一種過程(process),在此過程中可產生各種可能結果(possible outcomes),在實驗前已知所有可能發生的結果,但實驗後可能發生的結果是具有不確定性的。
機率學中“實驗”的例子: 1、隨機從剛出廠的電燈泡群中抽取3顆電燈泡,每一燈泡分類為:亮(良好);不亮(損壞),並檢驗其損壞的個數。 2、投擲一公平的骰子,觀察其面朝上之點數。 3、紀錄由1號至5號的田徑選手,跑完百米競賽後的名次序。 以上例子的共通性:知其所有可能發生的結果,但不知那一種結果會真正發生。也就是可能結果的不確定性。
定義4.2.2【樣本點(sample point)與樣本空間(sample space)】 定義4.2.3【事件(event)】 事件(event)即包含了一個或數個樣本點,也就是樣本空間的一子集合。當一事件無法分解時,也就是其只包含一個樣本點,此時我們稱之為單一事件(simple event)。而相對的,複合事件(compound event)即是可以分解成數個事件。換句話說,複合事件是含有兩個樣本點以上的事件。
樣本空間(sample space)、樣本點(sample point)、事件(event)例子 隨機抽取3燈泡,結果為良品(G)或損壞(B) 第一顆 第二顆 G B G G G B G G G B B 第三顆 B G G G B G B G G B B B G G B G B B B G B B B 樣本空間={GGG,GGB、GBG、GBB、BGG、BGB、BBG、BBB} A事件:抽取之3顆燈泡為良好。 A={GGG} B事件:抽取之3顆燈泡中,至少有2顆損壞。 B ={GBB、 BGB、BBG、BBB}
樣本空間(sample space)、樣本點(sample point)、事件(event)例子 投擲一枚公平骰子。 樣本空間S:所有可能出現的結果。 S={1、2、3、4、5、6} A事件:面朝上的點數,正好出現3點的事件。 A={3} B事件:面朝上的點數,出現3點以上的事件。 B ={4、5、6}
4.3 機率測度 4.3.1 機率表示及測度 習慣上以大寫英文符號來表示機率事件。 定義4.3.1 4.3 機率測度 4.3.1 機率表示及測度 習慣上以大寫英文符號來表示機率事件。 定義4.3.1 若A為某一機率事件。描述事件所可能發生的機率通常以 P(A) 表示之。 P(A)=0:表示此事件不可能發生。 P(A)=1:表示此事件必然發生。 一般而言,機率介於0與1之間:0 ≦ P(A) ≦ 1
機率測度 求出某一事件所可能發生的機率:P(A) 定義4.3.2 計算事件所可能發生的機率,可先算出此事件所包含的每一樣本點,其個別所可能發生的機率,再將其加總即是。
P(E1)=1/4;P(E2)=1/4;P(E3)=1/4;P(E4)=1/4 E={HT、TH} P(E)=P(E2)+P(E3)=1/2 機率測度例子 投擲一枚硬幣二次,試算出現結果的機率。 樣本空間S:所有可能出現的結果。 S={HH、HT、TH、TT} E1:兩次都出現正面的事件。 E2:第一次出現正面及第二次出現反面的事件。 E3:第一次出現反面及第二次出現正面的事件。 E4:兩次都出現反面的事件。 P(E1)=1/4;P(E2)=1/4;P(E3)=1/4;P(E4)=1/4 E:剛好出現一次正面(E2與E3)的事件。 E={HT、TH} P(E)=P(E2)+P(E3)=1/2
三種求出事件機率的方法: 古典法、相對次數法、主觀法。 使用時,必須符合下列的兩項限制條件: 1. 此實驗的樣本空間必須是有限的。 2. 此實驗的每一樣本點所可能發生的機率是相等的。 古典法:當某一隨機實驗的樣本空間是有限的,且每一樣本點所可能發生的機率是相等的,則一事件A其所可能發生的機率為: P(A)= N(S) :樣本空間所包含的樣本點個數。 N(A) :事件A本身所包含的樣本點個數。
三種求出事件機率的方法: 古典法、相對次數法、主觀法。 我們一直不斷重覆一項實驗N次,並紀錄事件A發生的次數。計算某事件發生的次數N(A)佔全部實驗總次數(N)的比例。即可求得該事件發生機率的估計值。由於此方法運用到相對次數的觀念,故稱為相對次數法。
三種求出事件機率的方法: 古典法、相對次數法、主觀法。 當有時某些實驗無法如客觀方法所述,重覆的執行。這時可能只經由個人主觀的推斷,來估計事件的機率。 定義4.3.5 主觀法:單由個人的經驗,觀點,相當主觀的推算事件發生的機率。
4.4 事件關係形式與公理化的機率定義 聯集(union)、交集(intersection)、餘集(complement)。 如圖 4-1之陰影部份,就是A,B兩事件的聯集,通常我們將之記為A∪B。
聯集(union)、交集(intersection)、餘集(complement)。 如圖 4-2之陰影部份,就是A,B兩事件的交集,通常我們將之記為A∩B,也有人直接寫成AB。
聯集(union)、交集(intersection)、餘集(complement)。
聯集(union)、交集(intersection)、餘集(complement)例子 假設某一機率實驗其樣本空間包括7個樣本點: S={e1,e2,e3,e4,e5,e6,e7} 定義兩事件A,B為: A={e2,e4,e7},B={e1,e2,e5} (a) 以作圖方式將A,B兩事件表現出來。 (b) 列出以下新事件所包含的樣本點: 1. A∩B 2. Bc 3. A∩Bc 4. A∪B
解:(a) A={e2,e4,e7} B={e1,e2,e5}
解: (b) A={e2,e4,e7},B={e1,e2,e5} 1. A∩B={e2} 2. Bc={e3,e4,e6,e7} 3. A∩Bc={e4,e7} 4. A∪B={e1,e2,e4,e5,e7}
聯集(union)、交集(intersection)、餘集(complement)例子 假設某一機率實驗為,直3枚公平骰子,觀察期正反面情形。定義A為至少有一面正面的事件事件,B為至少有一反面的事件。列出以下事件各自所含的樣本點並計算機率: A,B,A∩B,A∪B H H H S={HHH、HHT、HTH、HTT、THH、THT、TTH、TTT} H H H H T H H T H A={HHH、HHT、HTH、HTT、THH、THT、TTH} P(A)=7/8 H T H T T B={HHT、HTH、HTT、THH、THT、TTH、TTT} P(B)=7/8 T H H T H T H T A∩B={HHT、HTH、HTT、THH、THT、TTH} P(A∩B)=6/8 T T T H T T A∪B=S P(A∪B)=1 T T T
互斥(mutually exclusive) 空集合(empty set) 兩事件的交集A∩B根本不含任何一個樣本點,稱之為空集合(empty set),也是一個零事件(null event),通常以符號ψ表示,P(ψ)=0。 互斥(mutually exclusive) 當兩事件A、B,其交集為空集合時:A∩B=ψ,則稱兩事件互斥(mutually exclusive),意指此兩事件不可能同時發生。 S A B A E F G H D C B
4.4.2 公理化的機率定義 定義4.4.4 公理化的機率定義 公理 1. 對任一事件A,0 ≦ P(A) ≦ 1。 4.4.2 公理化的機率定義 定義4.4.4 公理化的機率定義 公理 1. 對任一事件A,0 ≦ P(A) ≦ 1。 公理 2. S為樣本空間,則 P(S)=1。 公理 3. 對於兩兩彼此互斥的事件A1,A2,A3、、、An, 則 P(A1∪A2∪A3....∪An)=ΣP(Ai) 。
4.4.2 公理化的機率定義例子 某機率實驗樣本空間包含5樣本點:{e1、e2、e3、e4、e5} 4.4.2 公理化的機率定義例子 某機率實驗樣本空間包含5樣本點:{e1、e2、e3、e4、e5} (a)如果P(e1)=P(e2)=0.15,P(e3)=0.4,P(e4)=2P(e5) 試求P(e4)及P(e5) 解:設P(e5)=a, P(S)=P(e1)+P(e2)+P(e3)+P(e4)+P(e5) =0.15+0.15+0.4+2a+a=1 故: a=0.1, P(e5)=0.1, P(e4)=0.2。 (b)如果P(e1)=3P(e2)=0.3,其餘樣本點機率皆相等,試求其餘樣本點之機率。 解:設P(e3)= P(e4)= P(e5)=b,由題意知P(e2)=0.1, P(S)=P(e1)+P(e2)+P(e3)+P(e4)+P(e5) =0.3+0.1+b+b+b=1 故:b=0.2, P(e3)=P(e4)=P(e5)=0.2。
4.5 條件機率與獨立事件 4.5.1 聯合機率及邊際機率 在正式介紹條件機率與獨立事件之前,先行介紹在機率學中所謂的聯合機率及邊際機率。通常對一個相同的樣本空間,我們可以有不同的分割法,而形成不同類別事件所分割成的樣本空間。如我們可將一班的學生(樣本空間S),分割成男生(A)、女生(Ac)兩大塊。也可以依某次統計學的成績,將班上分成統計學及格的同學(B),及不及格的同學(Bc)。此時原樣本空間也被分割成A∩B、A∩Bc、Ac∩B、Ac∩Bc四個互斥事件。P(S)=1=P(A∩B)+P(A∩Bc)+P(Ac∩B)+P(Ac∩Bc)。我們可得到如下所示的一聯合機率表:
聯合機率表 聯合機率(joint probability):多個事件所同時發生的機率,例如P(A∩B) 。 邊際機率(marginal probability):只考慮某依事件個別發生的機率,可由垂直或平行加總聯合機率可求得。
條件機率 4.5.2 條件機率 通常一事件可能發生的機率,是與其他相關事件是否發生而息 息相關的。所謂的條件機率,就是將相關事件的影響性考慮進來,再重新考慮該事件機率。 定義4.5.1 給定一事件B已經發生,則事件A的條件機率(conditional probability)記為P(A|B),並定義為 P(A|B) ,假若 P(B)>0
條件機率例子 假設有兩事件A,B。且P(A)=0.5,P(B)=0.3,P(A∩B)=0.1試求:(a) P(A|B) (b) P(B|A) 解: 依照條件機率之定義 (a) P(A|B)= (b) P(B|A)=
條件機率例子 台灣某一大學,其企管系大二班,男生有30人,女生20人。一天舉行統計學期中考,60分為及格。及格和不及格人數如表中所述,括號中為其佔全班人數比例,今從此班任抽取一人:(單位:人) (a)若已知被抽取此人為一男同學,試求此男同學統計學成績不及格機率。 (b)若已知被抽取此人為一女同學,試求此女同學統計學成績及格的機率。
條件機率例子 解: (a) 定義事件: A:抽取此人統計學成績不及格 B:抽取此人為男同學 依照條件機率之定義,由表知抽取此人為一男同學,此男同 學統計學成績不及格的機率為 P(A|B)=
條件機率例子 (b) 定義事件: C:抽取此人統計學成績及格 D:抽取此人為女同學 條件機率例子 (b) 定義事件: C:抽取此人統計學成績及格 D:抽取此人為女同學 依照條件機率之定義,由表知抽取此人為一女同學,此女同學統計學成績及格的機率為 P(C|D)=
獨立事件 4.5.3 獨立事件 條件機率P(A|B)是在B事件發生的前提下,討論A事件發生的機率。非條件機率P(A)是不考慮其他相關事件,單純討論A事件發生的機率。兩種定義有其本質上的不同。 而或許在某些情況我們會得到P(A|B)=P(A),換句話說,就是B事件發生與否,都不影響A事件發生的機率。此時,即稱兩事件為獨立(independent)。
獨立事件 定義4.5.2 任意A,B兩事件,若有下列三等式,其中任何一式成立時: P(A|B)=P(A) P(B|A)=P(B) 則稱A與B兩事件獨立(independent),反之則稱A與B兩事件相依(dependent),亦即兩事件相依係指一事件的發生會影響其他事件發生的機率。
獨立事件例子 在前例中,試問兩事件 A:抽取此人統計學成績不及格 B:抽取此人為男同學, 此A,B兩事件是否獨立? 解: P(A|B)= ,而P(A)=0.6。因P(A|B)≠P(A), 所以此兩事件並不獨立,而是相依。
獨立事件例子 在不透明的桶子中,裝有一顆白球(W)及兩顆黑球(B)。 今依序抽取2顆球,並以抽取不放回(without replacement)之方式。 (a)試求下列事件機率: A:抽取第一顆為白球的事件。 B:抽取第二顆為白球的事件。 (b)此A、B事件互斥嗎?獨立或相依?
獨立事件例子 S={WB1、WB2、B1W、B1B2、B2W、B2B1} (6樣本點) (a)試求下列事件機率: A:抽取第一顆為白球的事件。 A={WB1、WB2}(2樣本點),P(A)=2/6=1/3。 B:抽取第二顆為白球的事件。 B={B1W、B2W}(2樣本點),P(A)=2/6=1/3。 (b)此A、B事件互斥嗎?獨立或相依? A∩B=ψ,P(A|B)=P(A∩B)/P(B)=0 ∵ P(A|B) ≠P(A) ∴不獨立(兩事件相依)
4.6 機率法則 加法法則(additive rule),乘法法則(multiplicative rule),餘集法則(complementary rule)。 任意A,B兩事件,則: P(A∪B)=P(A)+P(B)-P(A∩B),此即為加法法則 若兩事件互斥,則此法則改寫為: P(A∪B)=P(A)+P(B) B A∪B A A∩B P(A∪B)=P(A)+P(B)-P(AB)
加法法則(additive rule)例 台北市一中學日前舉行期中考,已知班上同學有50%數學不及格,有30%英文不及格,而有20%數學與英文均不及格。今從此班級中隨機抽取一人,試問此同學在這兩科中,至少有一科不及格的機率為何? 解: 令事件A:抽取此同學,數學不及格的事件,P(A)=50%。 B:抽取此同學,英文不及格的事件,P(B)=30%。 數學與英文均不及格事件的機率為P(A∩B)=20%, 而至少有一科不及格的事件,即為A∪B。 則其機率為運用事件加法法則: P(A∪B)=P(A)+P(B)-P(A∩B)=50%+30%-20%=60% 也就是說,班上有60%的同學,數學或英文不及格(至少有一科不 及格)。
加法法則(additive rule)例 (a) 假設有A,B兩事件。P(A)=0.3,P(B)=0.8,P(A∩B)=0.2 試求P(A∪B)? P(A∪B)=P(A)+P(B)-P(A∩B)=0.3+0.8-0.2=0.9 (b) 假設有C,D兩事件。P(C)=0.2,P(D)=0.3,且C,D兩事件 互斥,試求P(C∪D)? 因兩事件互斥,P(C∩D)=0, P(C∪D)=P(C)+P(D)=0.2+0.3=0.5
4.6 機率法則 加法法則(additive rule),乘法法則(multiplicative rule),餘集法則(complementary rule)。 任意A,B兩事件,則兩事件同時發生的機率為: P(A∩B)=P(B)P(A|B)=P(A)P(B|A),此即為乘法法則。 若兩事件獨立,則此乘法法則改寫為: P(A∩B)=P(B)P(A)
乘法法則(multiplicative rule)例 W B 乘法法則(multiplicative rule)例 在一不透明桶子,裝有4顆白球(W)6科黑球B。 (a)以抽取不放回(without replacement)之方式,求2顆球中一顆為白球一顆為黑球的機率。 P(W1∩B2)+P(B1∩W2)= P(W1)P(B2|W1)+P(B1)P(W2|B1)= (4/10)×(6/9)+(6/10)×(4/9)=(4/15)+(4/15)=8/15。 (a)以抽取放回(with replacement)之方式,求2顆球中一顆為白球一顆為黑球的機率。 P(W1∩B2)+P(B1∩W2)= P(W1)P(B2|W1)+P(B1)P(W2|B1)= (4/10)×(6/10)+(6/10)×(4/10)=(6/25)+(6/25)=12/25。
4.6 機率法則 加法法則(additive rule),乘法法則(multiplicative rule),餘集法則(complementary rule)。 P(A)=1 - P(Ac)或P(Ac)=1 - P(A)此即為餘集法則。
餘集法則(complementary rule)例 有一神射手,其槍法十分準確。對於在五十公尺遠的目標,有90%的機率可射擊命中。今對於此目標連續射發十次,並假設十次擊發彼此皆為獨立事件。試問此神射手至少失誤一發的機率。 解: 定義A:至少失誤一發的事件(也就是每次都命中的餘集)。而A的餘事件Ac,也就是十發完全命中無失誤的事件,很明顯的,P(Ac)容易計 算的多。 P(Ac)=(0.9)10,運用餘集法則: P(A)=1-P(Ac)=1-(0.9)10=0.6513
4.7 貝氏定理 全機率定理(law of total probability)。它在貝氏定理的運用過程中,有其不可或缺的重要性。 假設 S=A1∪A2∪……∪Ak , P(Ai)>0,i=1,2,……k,且對i≠k而言,Ai∩Ak=ψ。則對任意事件B: P(B)= 意義:Ai為樣本空間之全部樣本點,且彼此互斥。P(B)即為發生每一個Ai與B交集機率之合。
貝氏定理 如圖所示{A1,A2,A3,A4,A5,A6}為樣本空間S之一分割,而橢圓部分為一事件B。事件B乃是互斥事件 (A1∩B),(A2∩B),…,(A6∩B)的聯集,即圖中陰影部分。 B=(A1∩B)∪(A2∩B)∪……∪(A6∩B)且根據互斥事件之加法法則及乘法法則,得知 P(B)=P(A1∩B)+P(A2∩B)+…………+P(A6∩B) = P(A1)P(B|A1)+P(A2)P(B|A2)+……+P(A6)P(B|A6)=
貝氏定理 定理4.2 貝氏定理(Bayes’ Theorem) 假設事件{A1,A2,…,Ak}為樣本空間S之一分割,P(Ai)>0,i=1,2,……k,則對其他任意事件B而言:
貝氏定理例子 台積電工廠有4部機器生產同一產品,令其為機器A1,A2,A3,A4 。各機器出產產品數量各佔總產量之比為 0.4 ,0.3 ,0.2 ,0.1。再令產品為不良品的事件為B。各部機器產品的不良率分別為0.02,0.05,0.01,0.02,試問若隨機抽取一產品,其為不良品的機率為何? 解: 依題意,所欲求之不良品的機率即為P(B),且依題目所示可知若 隨機抽取一產品, 則P(A1)=0.4, P(A2)=0.3, P(A3)=0.2,P(A4)=0.1, P(B|A1)=0.02, P(B|A2)=0.05,P(B|A3)=0.01,P(B|A4)=0.02 根據全機率法則: P(B)=P(Ai)P(B|Ai) =P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)+P(A4)P(B|A4) =0.40.02+0.30.05+0.20.01+0.10.02=0.027
貝氏定理例子 前例中,從工廠的成品中,隨機抽取一產品。假如抽取的產品是不良品,請問由機器A1所產生的機率為多少? 【P(B)=0.027】 解: 依題意,所欲求之機率即為P(A1|B),且由題目可知若隨機抽取一產品,則P(A1)=0.4,且已知A1的不良率為P(B|A1)=0.02 根據全機率法則:
貝氏定理例子 假設有一血液檢查,若有人真正感染病毒時,其呈現陽性的機率為0.99(陽性:感染;陰性:未感染)。此血液檢查,當病人無感染時,也有0.05的機率呈現陽性。假設全國人口中,10%感染此病毒。請問若隨機抽取一人受測,已知檢查的結果為陽性反應,此人真正感染病毒的機率為何? 解:設事件Y:檢查結果為陽性,事件T:感染病毒。 已知:感染,呈現陽性之機率P(Y︱T)=0.99;無感染,呈現陽性之機率P(Y︱Tc)=0.05;全國人口感染機率P(T)=0.1, P(Tc)=0.9 。 求解:檢驗結果為陽性,真正感染之機率P(T︱Y)=? The End 作業:習題奇數題