第五章 離散型隨機變數及其常用的機率分配
5.1 隨機變數 5.1.1 隨機變數的意義 討論隨機實驗時,有時我們感興趣的,或許並不是確切的發生結 果,因其結果所成的樣本空間較為抽象,真正關心的,可能是將 這些確切結果經由一有意義的實數值函數轉換,進而改以函數值 表示的事件。經實數值函數轉變後以數值表示的事件即稱為實數 值事件( real value event),在實數裏有很多數學運算可應用,如加 法、減法、積分、微分。例如觀察投擲兩枚骰子的實驗中,我們 不在乎是(1,3)或(3,1)或(2,2)〔確切結果〕發生,對我 們更有意義的,則是兩枚骰子總合〔函數〕為4〔函數值〕的事 件。經一特定實數值函數,並以轉換後的函數值來表示事件,則 此實數值函數即稱為隨機變數。
一般而言以大寫英文字母來表示此函數,也就是隨機變數。而以小 寫英文字母來表示函數值,也就是隨機變數可能值。如上述投擲兩 枚骰子實驗,若定義隨機變數Y〔函數〕:其面朝上點數總合。而 其相對的可能值〔函數值〕Y=2,3,4,5,6,7,8,9,10,11,12。並以{Y =}來表示原樣本空間,經此函數轉變後的實數值事件。 定義5.1.1 隨機變數(random variable)即是以樣本空間為定義域而值 域為實數的實數值函數。
【例5.1】 考慮投擲三枚硬幣實驗,定義隨機變數Y:出現正面的次數。試著 將每一樣本點所對應的函數值列出,並列出所有轉換後的實數值事 件,所各自包含的樣本點。
解: 上一章曾經提及,投擲三枚硬幣其樣本空間為: H:正面 T:反面 S={ HHH,HHT,HTH,HTT,THH,THT,TTH,TTT } 而隨機變數Y定義為出現正面的次數,故其對應關係如本頁圖5-1所 示。由此圖可知,隨機變數的可能值Y=0,1,2,3。也就是說,原樣 本空間經由隨機變數而轉變成4個實數值事件。其各自包含的樣本點 為 {Y=0}={ TTT } {Y=1}={ THT,TTH,HTT } {Y=2}={ HHT,HTH,THH } {Y=3}={ HHH }
5.1.2 隨機變數的分類 隨機變數可區分為兩大類:離散型隨機變數(discrete type random variable)和連續型隨機變數(continuous type random variable)。當一 隨機變數其可能值的個數為有限個(finite)或是可數的無限多 (countably infinite)時,稱為離散型隨機變數。而若一隨機變數其可 能值為不可數的無限多(uncountably infinite)時,此時稱為連續型隨 機變數。下一例子將可幫助讀者進一步清楚其詳細的分類。
【例5.3】 1. 定義隨機變數X:投擲一枚硬幣次,其出現正面的次數。則X的可能值為=0,1,2,3,…...〔有限個〕。X為離散型隨機變數。 2. 定義隨機變數Y:一小時內某一路口通過之車輛個數。則Y的可能值=0,1,2,3,……..〔可數的無限多〕。Y為離散型隨機變數。 3. 定義隨機變數T:某一電視機之使用壽命。則T的可能值t≧0〔不可數的無限多〕。T為連續型隨機變數。
5.2 離散型隨機變數之機率分配 定義5.2.1 一離散型隨機變數之機率分配(probability distribution),即是以表格、圖表、或公式,將隨機變數所有可能值而成的事件之機一一列出。率, 定義5.2.2 一離散型隨機變數Y之機率分配 則有下列性質: . 0≦ ≦1,對每一可能值。 . =1
【例5.4】 台灣某一大學,企管系大二班。班上成績前五名中,有三名為男同 學,二名為女同學。由於五名同學都十分優秀,老師想以公平之標 準,隨機抽取二人擔任統計學助教。定義隨機變數Y:抽取二人中, 女同學之人數。試以表格、圖表、或公式列出隨機變數Y之機率分 配。
解: 隨機變數Y定義為抽取二人中,女同學之人數。顯而易見的,Y 可能值=0,1,2。欲求Y之機率分配,必先將P (Y=0),P (Y=1), P (Y=2)求出。由於是採隨機抽出,此實驗之所有樣本點,發生 機率皆相同。是故我們試著以古典法,求算事件機率。在解題之 前,先行介紹一組合符號 或 。此值 = = 代表著在個不同的個體中,隨機抽取個,其各種不同可能抽取結 果之總數。故就本題而言,在五名學生中,抽取二名即有 個各 種可能結果。也就是此實驗之樣本空間有 =10個樣本點。
5.2.2 累積分配函數的意義 累積機率F (x),我們又可將之稱為累積分配函數(cumulative distribution function),簡稱 c.d.f.。
5.3 期望值及變異數
5.3.1 離散型隨機變數之期望值 假設考慮投擲一公平骰子36次,進而出現之點數如下: 2,1,2,4,5,6 5,3,1,6,6,3 3,6,4,1,1,5 4,5,3,6,6,3 6,2,1,4,6,1 3,3,5,6,1,6 就以上資料36個數值,我們可計算其樣本平均數為 再將這些資料稍加整理之後,可得如下表所示
經由上表所表示各可能值之次數分配,我們可以行另一方式,求算 該樣本平均數: 計算法則即是為 (樣本平均數)=Σ〔點數(可能值)×相對次數〕
【例5.6】 此隨機變數Y之機率分配為: 考慮投擲三枚公平硬幣,定義隨機變數:三枚公平硬幣正面朝上之 個數。試求隨機變數之期望值。 解: 根據期望值定義 E[y]=
5.3.2 離散型隨機變數之變異數
5.3.3 期望值及變異數之基本定理
【例5.10】 再以例5.6為例,並利用定理5.5,求出隨機變數之變異數。
5.4 二項分配及超幾何分配 在接下來幾小節中,將介紹幾個特殊且常見的機率分配。其中有: 二項分配 (binomial distribution) 超幾何分配(hypergeometric distribution) 幾何分配 (geometric distribution) 負二項分配(negative binomial distribution) 卜瓦松分配(Poisson distribution) 隨機變數的機率分配本是透過此隨機變數所定義的函數關係,由原 實驗樣本空間轉換而來。所以讀者學習這些機率分配時,若能清楚 各原實驗之前提條件,並了解該隨機變數所定義的函數關係,如此 必能收事半功倍之效。
5.4.1 二項分配 考慮一隨機實驗,其可能發生的結果只有單純兩種:其一為“成 功”(S),另外一個便是“失敗”(F)。假設發生結果為“成功”時,令隨機 變數Y=1,而若發生結果為“失敗”時,則令Y=0。換句話說,隨 機變數Y把“成功”對應到實數值1,把“失敗”對應到實數值0。則此隨 機變數Y之機率分配為: P (Y=y)= ,=0,1 其中p為結果發生“成功”的機率,,若符合以上條件,則此隨機實驗 過程稱為伯努利試驗(Bernoulli trial),此隨機變數Y稱為伯努利隨 機變數(Bernoulli random variable),上述機率分配稱為伯努利分配 (Bernoulli distribution)。
對於上述二項實驗之定義,下有幾點略加說明: 1. 所謂個相同試驗,當然指的是“伯努利試驗”。 2. 可能發生結果分類為“成功”、“失敗”,這樣的分類方式,並不 意謂好或壞的價值判斷。其目的只是單純的將結果區分為兩類: 例如檢驗燈炮時,其結果不是良好,就是損壞。投擲一硬幣, 其可能發生結果亦只有正面、反面之分。像這樣的例子都屬於 此限制條件之範疇。 3. 所謂每一試驗彼此互為獨立,意即為每次試驗發生的結果,都不影響其他試驗可能發生的結果。 4. 當=1時,二項實驗即為伯努利試驗,換句話說,伯努利試驗其實為二項實驗之一特例。 簡而言之,若某一實驗符合上述定義之四項特性,即可將該實 驗歸類為二項實驗。
5.4.2 超幾何分配
【例5.16】 在一水塘池中,計有20隻魚,其中有15隻金魚,5隻吳郭魚。今從池 中抽取2隻魚,並定義隨機變數Y表示抽中吳郭魚隻數。試求出: (a) 隨機變數之機率分配 (b) 期望值E [Y],變異數V (Y)
解: (a) 隨機變數Y表示抽中吳郭魚隻數。且一次抽取2隻,如此即可 視為採不放回,故Y必為超幾何隨機變數。根據 定義 5.4.6 N=20,r=5,n=2 P (Y=y)= , y=0,1,2
5.4.3 二項分配與超幾何分配的關係 實務上很多抽樣檢驗,都是以一次抽取,也就是抽取不放回方式來 進行。理論上我們應以超幾何分配來求算機率,不過在 例5.13中我 們曾經提及,當母體所含個數與抽取樣本個數相差很大時,此時雖 採不放回方式,不過試驗間還是逼近“獨立”,故依舊以二項分配來 估算,為什麼呢?玆以下例說明:
【例5.18】 科學園區某一工廠,元月份共出產產品1000件,可惜此批產品中有 100件為不良品。令隨機變數Y表示抽取5件中,不良品個數。則分別 以(a)超幾何分配(b)二項分配,求算機率並比較差異! 解: (a) 採超幾何分配求算,N=1000,r=100,n=5 P (Y=y)= , y=0,1,2,3,4,5
由上可知,當N,n差距很大時,分別用二項分配及超幾何分配求算 的機率值非常接近,可是求算過程中,經由超幾何分配可比起二項 分配計算繁雜的多。所以當母體所含物體個數與抽取樣本個數差距 很大時,以二項分配估算 b(n;p=n/N)顯得容易的多,且又逼近 超幾何分配求算值。
5.5 幾何分配及負二項分配 5.5.1 幾何分配 考慮一隨機實驗,其包含著連串的伯努利試驗:每一次試驗依 舊只有“成功”(S )、“失敗”()兩種可能,各試驗彼此獨立,“成功” 的機率固定為。跟二項分配的實驗前提限制,幾乎相同,唯一 不同的是,此時我們定義一新的隨機變數Y為直到第一次“成 功”(S )出現,所已執行試驗之總次數。由於此定義方式,使得不 再像二項實驗中,確切包含著個伯努利試驗。相對的,在此實 驗中可能包含著1個、2個,甚至於無限個伯努利試驗。我們稱 此隨機變數Y為幾何隨機變數(geometric random variable)。
考慮與幾何分配相同的實驗前提限制,而與幾何分配所不同的是, 此時我們再改令一隨機變數X表示直到第次“成功”出現,所已執 行的試驗總次數。由於此定義方式,此實驗至少包含個,甚至也 包含了無限個伯努利試驗。此隨機變數跟幾何隨機變數相仿,都 含有無限但可計數個可能值。此時我們稱此隨機變數X為負二項 隨機變數(negative binomial random variable)。而當負二項隨機變數 之“成功”次數=1時,其實就是幾何隨機變數之定義。
負二項隨機變數X,其可能值x=,r+1,r+2,……。若令 X=x,意指第r次“成功”(S )出現時,總試驗次數已達次,換句話 說,第次試驗,也就是最後一次試驗,必發生“成功”(S ),而前面 的x-1次試驗中,必發生了x-1次“成功”(S ),-次“失敗”(F )。 若考慮其一排列方式: 因“成功”(S )的機率為,且各試驗之間彼此獨立。如上述之排列方 式,其發生的機率為 其中
5.6卜瓦松分配 5.6.1 卜瓦松分配的意義 考慮一隨機實驗,此實驗特色為,在某一特定區間內(一段時 間、一段距離、一部分面積、體積),觀察某特定“稀少”事件 發生的次數。所謂“稀少”,意指該事件發生的機率低,故發生 的次數少,不過理論上而言,此稀少事件發生的次數,也可能 至無限次,只不過其可能性非常的低。若令隨機變數Y表示在 此實驗中,此特定事件發生的次數。則此觀察過程,我們稱之 為卜瓦松實驗(Poisson experiment),隨機變數Y稱為卜瓦松 隨機變數(Poisson random variable),其可能值Y=0,1,2,…..為 無限但可數。
卜瓦松實驗有下列特性: 1. 在一單位區間,如單位時間或單位面積內,此特定稀少事件發生 平均次數(λ),通常為已知且固定。 2. 此事件在單位區間內發生平均次數(λ),通常與區間大小(t) 成正比。 3. 不管此事件在該區間中何點發生,發生的機率必皆相同。 4. 假設此實驗可分割成極小的區間,每一區間至多可發生一件此特 定事件(成功),或是無該事件發生(失敗)。換句話說,每一小區間, 可能發生結果只有兩類。 5. 事件在各小區間中發生與否,相互獨立。
【例5.23】 台北市每天平均一小時內,發生一次搶案。若令Y表示一小時內, 發生搶案次數。假設Y符合卜瓦松分配,試問: (a) 一小時內,完全無搶案發生的機率。 (b) 一小時內,發生搶案超過兩次的機率。 (c) 兩小時內,恰巧只發生一次搶案的機率。
解: (a) 由題目可知,Y符合卜瓦松分配,λ=1 一小時內,完全無搶案發生,即 Y=0 P (Y=0)= (b) 一小時內,發生搶案超過兩次,即 Y>2 P (Y>2)=1-P (Y=0)-P (Y=1)-P (Y=2)
(c) 令卜瓦松隨機變數X表示兩小時內發生搶案的次數。根據特性 第二點,其平均搶案發生次數λ=2。 兩小時內,恰巧只發生一次搶案,即 X=1 P (X=1)=
5.6.2 卜瓦松分配與二項分配的關係 先前我們曾經提及卜瓦松實驗的特性,由這些特性可知,卜瓦松實 驗可經由某特定方式分割成個小區間(很大,甚至為無限),使得分割 後實驗,一一符合上述卜瓦松實驗特性。而經由分割後的卜瓦松實 驗P( ),由特性3,4,5點可看出,類似於二項實驗b(n;p=λ/n)。 換句話說,卜瓦松分配相當類似二項分配,並且可用來估計,很大; 相對很小的二項分配。通常二項實驗很大,很小時,因其計算過程 可能相當繁雜,所以改用卜瓦松分配P(λ=np)來估計機率值,則 顯得較為容易。理論上,由數理可證明:當時,二項分配趨近於卜 瓦松分配
事實上,當二項分配n很大,p很小時,當 , ,且 np≦7時,用卜瓦松分配P(λ=np)來估計二項分配,較為準確, 結果相當逼近用二項分配求算值。
5.7 總結