第五章 機率論
學 習 目 標 介紹機率的基本觀念如隨機試驗、樣本點、樣本空間、事件等。 了解古典機率理論、客觀機率理論及主觀機率理論。 學習事件機率、聯合機率、邊際機率及條件機率之定義及其應用。 如何應用貝氏定理。
本 章 架 構 5.1 機率(probability)基本觀念 5.2 機率(probability)定義 5.3 事件(event)及事件機率(event probability)的定義 5.4 貝氏定理(Bayes’ theorem)
機率簡史 機率論之起源據說是由於投骰子,卡片,錢幣等之賭博遊戲之流行及保險之發生而產生。其發展之動機是當時商業資本家作如此打賭之交易時,認為要依靠占星術不如依靠較為確實可以致富之學術界。 16-17世紀數學者大約完成古典機率論。在當時由於數學史上微積分之發明,機率論亦因而應用此法。古典機率論的內容由組合論進入幾何學的機率論,更與誤差論聯結出現解析的機率論。在此間由 De Moivre、James Bernoulli 等所展開之古典的推測論中始確立大數法則,更進一步的到 Gauss、Laplace 時發現中央極限定理。此大數法則對古典統計學提供大數觀察之理論基礎,意義甚大。中央極限定理是誤差論之一支柱且成為最小自乘法的背景。 資料來源:姚景星教授 –機率之回顧
5.1 機率基本觀念 5.1.1 隨機試驗(random experiment)、 樣本點(sample point)及樣本空間(sample space) 5.1.2 計數法則
5.1.1 隨機試驗、樣本點及樣本空間 隨機試驗(random experiment): 在實驗之前已知所有可能發生的結果,但卻無法預知會發生何種結果的實驗方式。 樣本點(sample point): 隨機試驗之每個可能出現的結果(outcome)稱為樣本點。 樣本空間(sample space): 隨機試驗之所有樣本點所形成的集合,稱為樣本空間,通常以英文大寫字母S表示之。
5.1.1隨機試驗、樣本點及樣本空(續) 表5.1 隨機試驗、樣本點及樣本空間
5.1.2 計數法則 樹狀圖(tree diagram): 藉由樹狀圖可了解隨機試驗的過程及其所有可能的結果,如下圖所示。 圖5.1 丟擲兩個銅板的樹狀圖
5.1.2 計數法則(續) 多步驟隨機試驗之計數法則: 若一個隨機試驗係由 k 個步驟所形成,而第一步驟有n1種可能結果,第二步驟有n2種可能結果,依此類推,第 k 步驟有nk種可能結果,則此隨機試驗共有n1 n2 … nk種可能結果,即此隨機試驗之樣本點數為各步驟可能結果個數之乘積。
例5.1 衣服的搭配方式 陳先生衣櫃中有10件襯衫、6件長褲、3件外套及8條領帶,現陳先生要選擇1件襯衫、1件長褲、1件外套及1條領帶搭配,問共有多少種可能的搭配方式? 解: 此隨機試驗係由4個步驟所形成,第一步驟選擇襯衫,有10種選擇的方式;第二步驟選擇長褲,有6種選擇的方式;第三步驟選擇外套,有3種選擇的方式;第四步驟選擇領帶,有8種選擇的方式; 故共有10 ×6 ×3 ×8 = 1,440種搭配方式。
5.1.2 計數法則(續1) 排列(permutation): 從n個不同的物體中,每抽取一個,抽出不放回,連續抽取r個物體依序安排在r個位置,則共有n (n-1) (n-2) … (n-r +1)種不同的排列方式,一般以 表示。此處 組合(combination): 從n個不同的物體中抽取r個物體,則共 種選法。此處,
例5.2 班級幹部之選取 一班有60位學生,從中選取3位分別擔任班代、服務股長及康樂股長,問有多少種可能的情況? 解: 例5.2 班級幹部之選取 一班有60位學生,從中選取3位分別擔任班代、服務股長及康樂股長,問有多少種可能的情況? 解: 因班代、服務股長及康樂股長表示3個不同的位置。故 班代 服務股長 康樂股長 60 × 59 × 58 = 205,320 種可能的情況, 或 。
例5.3 金融卡密碼之選取 陳先生設定四個不相同數字為金融卡之密碼,問有多少種可能的方式? 解: 種可能的方式。
例5.4 樂透彩券號碼之選取方式 風靡台灣的公益彩券,分為大樂透以及小樂透的樂透彩兩種,大樂透玩法係從1至49號碼中選取6個不同的號碼,而小樂透彩則係從1至38個號碼中選取6個不同的號碼,試問此兩種玩法分別共有多少種選法? 解: 2
例 威力彩與大樂透中獎機率如何算?兩者機率差異為何? 威力彩機率 第一區所有組合數(38個號碼取6個的所有組合) C(38,6)=38x37x36x35x34x33 / 6x5x4x3x2x1 = 2760681組合 第二區所有組合數(8個號碼取1個的所有組合) C(8,1)=8/1 =8 故機率為第一區機率 * 第二區機率 =1/2760681 * 1/8 = 1/ 22085448 大樂透機率(49個號碼取6個的所有組合) C(49,6)=49x48x47x46x45x44 / 6x5x4x3x2x1 = 13983816 組合 故機率為 1/ 13983816 以上為兩者機率相比較 , 中威力彩機率比大樂透低很多
台灣的樂透彩與美國比較 美國樂透動輒要一、二十期才會有人拿到頭彩,我們中華民國,每期便有三五個人平分頭彩;更誇張的是:還有人一次買兩張相同的號碼,一次中個雙囍臨門。 拿台灣的樂透彩跟美國比較,其實是有問題的,國外一、二十期中一次是因為49選6的關係。我們運用數學的機率來算看看。 國內樂透中六星的機率: 美國樂透中六星的機率: 由此可見,國內簽注樂透中頭彩的機率,是美國的3倍。加上台灣民眾賭性堅強,個人花上數百萬包牌、甚至組織串聯集資簽注幾乎已經不是新聞了,每一期中樂透的人數超過一人,的確有它的理由存在。
購買彩券前您不可不知的守則 根據專家表示,你每投資五十元,就有機會回收廿八元;然而摃龜機率超過97%。以下就是專家的分析: 摃龜組合:以 42 選 6 的現行規則,總共會有5,245,786種組合,在這些組合中六個號碼都不中的有 1,947,792 種組合;只中一個號碼的有 2,261,952 種組合;只中兩號碼的有 883,575 種組合,以上三種組合一共是 5,093,319 種摃龜組合,也就是不會中獎的組合佔97.09%。 會中獎的號碼只有152,467組,這152,467組會中獎的號碼組當中分別為: 普獎(中三碼)142,800 種 (2.2722%) 四獎(中四碼)9,450 種 (0.18%) 三獎(中五碼)210 種 (0.004%) 二獎(中五碼再加中特別碼)6 種 (0.0001%) 頭獎(六碼全中)1 種。
5.2 機率定義 5.2.1 相對次數法 5.2.2 古典方法 5.2.3 主觀法
5.2 機率定義(續) 機率: 係衡量隨機試驗之各種結果發生的可能量數。 條件: 機率值必須介於0與1之間,若該隨機試驗結果不發生,則其機率等於0;若該隨機試驗結果一定發生,則機率等於1。 所有隨機試驗結果發生機率的總和必須等於1 。
5.2.1 相對次數法 相對次數法: 在相同情況下,重複進行隨機試驗,經過長期重複試驗許多次後,試驗結果E發生的機率,以P(E)表示,則 , 5.2.1 相對次數法 相對次數法: 在相同情況下,重複進行隨機試驗,經過長期重複試驗許多次後,試驗結果E發生的機率,以P(E)表示,則 , 其中 n(E)表示試驗結果E實際發生的次數,n表隨機試驗總次數。
保險基本原理—大數法則 大數法則是指一件事重覆發生的次數很多時,其發生的機率就會接近真實的情形。 假定吾人觀察某事件在進行反覆N次以後,會有R次特定狀況出現。當觀察越多次時,R/N會趨近於定值的一種現象。如果上述的N是參與保險的單位,R是危險發生的次數,即適合用保險來處理的危險。用保險的語言來說,即有夠多的危險單位存在時,即可統計出一穩定的損失機率。這也是保險費率訂定的基礎。 大數法則運用在保險上面最常見的就是死亡率,壽險業利用〝臺灣壽險業第三回經驗生命表〞來計算保費的基準,〝臺灣壽險業第三回經驗生命表〞是以一千萬人為基準的。
例5.5 一個均勻銅板出現正面的情形 分別重覆丟擲一個均勻的銅板10次、100次、1,000次及10,000次,其出現正面的次數如表5.1所示,由表5.1可看出,隨著試驗次數之增加,出現正面的比例愈來愈接近0.5。 表5.2 丟擲一個均勻銅板的結果統計表
5.2.2 古典方法 古典方法: 假設每一種隨機試驗結果出現的可能性皆相等之情況下,衡量各隨機試驗結果發生之機率的方法。 計算法則: 如果一個隨機試驗有n(S)個,則各隨機試驗結果發生之機率皆為 。
例5.6 丟擲一個均勻骰子的情形 丟擲一個均勻的骰子一次,其樣本空間為 例5.6 丟擲一個均勻骰子的情形 丟擲一個均勻的骰子一次,其樣本空間為 因為這是一個均勻的骰子,故假設每一個隨機試驗結果發生的可能性皆相等。即
例5.7 誰出公差呢? 全班有60位學生,從中抽取一位學生出公差,每個人被抽到的機率皆為1/60。
5.2.3 主觀法 主觀法: 在相對次數法與古典法均不適用的情況下,利用所有相關的資料加上經驗與直覺,衡量某一特定隨機試驗結果發生之機率值。
例5.8 誰會當選立法院副院長呢? 江丙坤與洪奇昌委員競選第五屆立法院副院長,每位候選人當選的可能性不需要相等,且又不能重覆進行投票,故雙方人馬根據所有可用的訊息估計江委員或洪委員當選之機率。
預測的主觀方法— 德非法( Delphi Survey ) 「德非調查法」 有三個主要性質:第一,探討的問題是非常專業的問題;其次,調查的對象是專業的菁英;最後,它的功能是決策與溝通,而前者又包含評估和預測兩個層次。 相對於一般意見調查是一種公眾性態度的調查;德非調查法是一種專家性、行動或預言的調查。 「德非調查法」的誕生基於三個理論,其一,處理專業問題,專家和普通人的正確程度不同,專家擁有一種「主觀的先知機率」,較為正確。第二,如果對於一個抽象事物反復測量,最後會獲得一個比較穩定、正確的平均結果。其三,三個臭皮匠抵過一個諸葛亮,經由團隊作用,一群專家的預測力抵得上阿波羅。
5.3 事件及事件機率的性質 5.3.1 事件(event)的基本性質 5.3.2 事件機率(event probability) 5.3.3 聯合機率(joint probability)及 邊際機率(marginal probability) 5.3.4 條件機率(conditional probability) 5.3.5 機率的性質
5.3.1 事件的基本性質 事件(event): 樣本空間的部分集合稱為事件。 簡單事件: 只包含一個樣本點的部分集合稱為簡單事件。 複合事件: 包含二個或二個以上樣本點的部分集合稱位複合事件。
例5.9 從球袋中抽取一球 假設一球袋內有1、2、3號球,現從袋內抽取一個球,則其樣本空間為{1,2,3},試問其部分集合為何? 例5.9 從球袋中抽取一球 假設一球袋內有1、2、3號球,現從袋內抽取一個球,則其樣本空間為{1,2,3},試問其部分集合為何? 解:共有 個部分集合,包括 空集合:一定不會發生之事件。 簡單事件:{1}、{2}、{3} 。 複合事件:{1,2}、{1,3}、{2,3}、{1,2,3},其中 {1,2,3}為一定發生之事件。
圖5.2 事件A的餘集(complement of event A) 5.3.1 事件的基本性質(續1) 事件的餘集(complement of event)係指樣本空間中不包含A事件之所有樣本點形成之集合,以Ac表示之。如圖5.2所示。 圖5.2 事件A的餘集(complement of event A) A Ac
5.3.1 事件的基本性質(續2) 事件A和B的交集,表示在A和B中共同出現的樣本點所形成之集合,以A∩B表示之。如圖5.3所示。
5.3.1 事件的基本性質(續3) 事件和的聯集表示所有屬於或或兩者都有的樣本點所形成之集合,以表示之。如圖5.4所示。 圖5.4 事件A和B的聯集 A B
5.3.2 事件機率 事件機率(event probability): 事件A發生之機率—P(A)— 為事件A之樣本點出現機率的總和,即P(A) = ΣP(Ei) ,EiA。
例5.10 接續例5.6 丟擲一個均勻的骰子一次,出現偶數的機率為何? 解: 例5.10 接續例5.6 丟擲一個均勻的骰子一次,出現偶數的機率為何? 解: 由例5.9可知,其樣本空間 ,且每一樣本點出現的機率皆為1/6,假設為出現偶數的事件,則 ,故其發生的機率為 另解: 因為每一樣本點出現的機率皆相等,故亦P(A)可定義為事件所包含之樣本點個數與樣本空間之樣本點總個數之比值,即 。故此題亦可作為 。
例5.11 丟擲一個不均勻的骰子 丟擲一個不均勻的骰子一次,其出現2的機率為1/3,而其他樣本點出現的機率皆相等,問出現偶數的機率為何? 例5.11 丟擲一個不均勻的骰子 丟擲一個不均勻的骰子一次,其出現2的機率為1/3,而其他樣本點出現的機率皆相等,問出現偶數的機率為何? 解:此隨機試驗各樣本點出現之機率為 ,且 所以,
5.3.3 聯合機率及邊際機率 聯合機率(joint probability): 兩個或兩個以上分類的事件同時發生的機率,稱為聯合機率。 邊際機率(marginal probability): 在有兩個或兩個以上類別的樣本空間中,若僅考慮某一類別個別發生的機率者,稱為邊際機率。
例5.12 性別及入園時間之情況 調查某水上樂園調查40位遊客其性別及日夜間入園之情況,如表5.3所示。試問男性及在日間入園之機率為何? 例5.12 性別及入園時間之情況 調查某水上樂園調查40位遊客其性別及日夜間入園之情況,如表5.3所示。試問男性及在日間入園之機率為何? 表5.3 40位遊客之性別及入園時間
例5.12 解答 令 A1 表示男性遊客入園的事件 A2 表示女性遊客入園的事件 B1 表示日間入園的事件 B2 表示夜間入園的事件
例5.12 解答(續) 由表5.2可獲得下列之聯合機率值:
例5.12 解答(續1) 表5.3 40位遊客之性別及入園時間之聯合機率表
例5.13 接續例5.12 接續例5.12,試問男性遊客入園之機率為何? 解: 例5.13 接續例5.12 接續例5.12,試問男性遊客入園之機率為何? 解: 由題意,本題所要求的是男性遊客入園的邊際機率,由於A1、A2、B1及B2之邊際機率分別為
5.3.4 條件機率 條件機率(conditional probability): 令A、B為定義於樣本空間的事件,在已知事件B發生的條件下,事件A發生的機率,即稱為事件A的條件機率。條件機率定義為聯合機率和邊際機率的比值,其可表示為 , 其中,P(A B)表事件A與B同時發生的聯合機率,P(B)表事件B發生的機率。
例5.14 接續例5.12 接續例5.12,已知男性入園,試問其在日間入園之機率為何? 解:
5.3.5 機率的性質 加法法則: 係計算兩事件聯集的機率,其可表達為 乘法法則: 計算兩事件交集的機率,其係由條件機率的定義而來,可表達為 計算三個事件交集的機率,其可定義為
例5.15 電腦公司員工離職的原因 根據一電腦公司人事經理指出,該公司員工離職的原因,有25%是對薪資不滿意,有15%是對工作環境不滿意,而有10%是同時對薪資及工作環境不滿意,請問員工離職的原因是對薪資不滿意或工作環境不滿意或兩者皆不滿意之機率為何? 解:令 A表示員工離職是因為對薪資不滿意的事件 B表示員工離職是因為對工作環境不滿意的事件 因此,題意即在求事件 發生的機率 , ,
例5.16 抽球的順序會影響機率嗎? 一個袋子內有兩個白球及一個紅球,現有三人以不放回的方式依序從袋內抽出一個球,請問這三人分別抽到紅球的機率會因抽取的順序不同而差異嗎? 解:令
例5.16 解答
5.3.5 機率的性質(續1) 獨立事件(independent events) : 係指一事件的發生不會影響立一件事件發生的機率,所以若A、B兩事件合乎於下列任一條件,則A、B互為獨立事件。 1. P(A | B) = P(A) 2. P(B | A) = P(B) 3. P(A B) = P(A) .P(B)
5.3.5 機率的性質(續2) 相依事件(dependent event): 係指一事件的發生會影響其他事件發生的機率。 互斥事件(mutually exclusive events): 係指兩事件沒有共同的樣本點。
5.3.5 機率的性質(續3) 分割集合: 若A1,…, Ak事件具有下列性質,則稱{A1,…, Ak},為一分割集合(partition set) 。 A1,…, Ak事件彼此互斥,即P(Ai Aj) = 0,對所有的 i j 。 A1,…,Ak事件組成樣本空間,即S = A1 A2 … Ak。
例5.17 使用信用卡付賬之情況 某一加油站經理根據過去經驗表示,有60%顧客會使用信用卡付賬,如果每位顧客是否使用信用卡付賬不會彼此互相影響,試問下兩位顧客都使用信用卡付賬之機率為何? 解:
例5.18 接續例5.14 接續例5.14,試問日間入園是否與男性遊客入園有關? 令 A1 表示男性遊客入園的事件 例5.18 接續例5.14 接續例5.14,試問日間入園是否與男性遊客入園有關? 令 A1 表示男性遊客入園的事件 A2 表示女性遊客入園的事件 B1 表示日間入園的事件 B2 表示夜間入園的事件 所以男性遊客入園與否會影響日間入園的情況。
例5.19 撲克牌之抽取 自52張撲克牌以不放回的抽取2張牌,假設A表示抽取的第一張牌為Ace的事件,B表示抽取的第二張牌為Ace的事件,試問A、B兩事件彼此獨立嗎? 解: 所以A、B兩事件彼此不獨立,而是相依事件。
5.4 貝氏定理 分割定理: 若A1,…,Ak為一樣本空間之分割集合,B為某特定事件,則
5.4 貝氏定理(續) 貝氏定理(Bayes’ theorem): 若已知A1,…,Ak為一樣本空間的分割集合,B為某特定事件, 且已知P(Ai)及P(B|Ai),則在已知B事件發生之條件下,Ai事件發生之機率為P(Ai | B) 其中, P(Ai)為事前機率,P(B | Ai)為條件機率, P(Ai | B)為事後機率(posterior probabilities)。
5.4 貝氏定理(續1) 貝氏定理進行的程序 (額外資訊)
表5.4 各供應商提供之零件為良品及不良品的條件機率 例5.20 不良零件來自何處? 例如某公司生產之主要產品所需之零件係由三家不同的供應商(甲、乙、丙)供應,其供貨比例分別為50%、30%及20%,而各供應商公或的不良率分別為1%、3%及2%,表5.4為各供應商所提供之零件分別為良品及不良品的條件機率。現自所有零件中抽取一個,若該零件被發現係不良品,請問該零件最可能來自於那家供應商? 表5.4 各供應商提供之零件為良品及不良品的條件機率 P(B|A) 條件機率(額外資訊)
例5.20 解答 假設 A1表示該零件來自於甲供應商的事件 A2表示該零件來自於乙供應商的事件 A3表示該零件來自於丙供應商的事件 B表示該零件是不良品的事件,則 , , , ,
例5.20 解答(續) 整個零件不良機率
例5.20 解答(續1) 因為 為最大,故該零件最可能來自於乙供應商。