第7章 常用機率分配
第一節 二項分配 二項分配(binomial distribution) 二項分配源於二項隨機實驗,其特性包含下列四項: 第一節 二項分配 二項分配(binomial distribution) 二項分配源於二項隨機實驗,其特性包含下列四項: (1)每一實驗包含n次重複試行(trials)。 (2)每一次試行僅有2種結果:其一為我們預期得到的,稱之 為成功;另一種不預期得到的,稱之為失敗。 (3)每一次試行,出現成功結果的機率固定為p,出現失敗的 機率固定為q (=1-p)。 (4)任2次試行之間皆相互獨立,即一次試行結果不會影響下 一次結果。
第一節 二項分配 二項分配的形成 在二項隨機實驗中,設定X為二項實驗n次試行中成功的次數, 則X就是二項隨機變數。 第一節 二項分配 二項分配的形成 在二項隨機實驗中,設定X為二項實驗n次試行中成功的次數, 則X就是二項隨機變數。 以投公正硬幣3次為例,出現正面的次數為X,則X是為二 項隨機變數。因為X的可能值有0, 1, 2, 3等4種。然後再對X 所有可能值一一計算其機率,即構成如下的二項分配: 表7-1 投硬幣3次的二項機率分配
第一節 二項分配 在試行n次的二項實驗中,成功的數目為X,稱為二項隨機變 數,由X隨機變數再發展的機率分配,是為二項機率分配。因 為試行n次有c次成功,其成功機率p,三者為二項機率分配的 重要參數,故記作:
第一節 二項分配 二項分配的機率函數f(x)的公式為:
第一節 二項分配 二項分配查表法 當二項分配的n超過10,計算工作變得十分繁雜,因此宜改用 查表法求其機率。【附表一】內所列出的是二項分配累積機 率的值。以下對二項分配機率表的查表法作簡單介紹。
第一節 二項分配 請回想二項函數的通式: (1)P(X=x)=f(x)= ,此式表示二項分配的隨機變數X=x時的機 率值。 第一節 二項分配 請回想二項函數的通式: (1)P(X=x)=f(x)= ,此式表示二項分配的隨機變數X=x時的機 率值。 (2)F(c)=P(X≤c)= = =B(c; n, p), 此式表示依序把x=0(起始項)至x=c(終止項)之間的所有二項 分配機率值,全部累加起來。
第一節 二項分配 請根據下表,瞭解其運算法則:
第一節 二項分配 在【附表一】所呈現的是二項分配機率表,即P(X≤c)的二項分 配累積機率值。P(X≤c)的意義和上一單元所介紹的相同。所以, 如果我們想求: (1)F(3)=P(X≤3)=f(0)+f(1)+f(2)+f(3),則直接查【附表一】中的 c=3位置上的機率值,就可以獲得了。 (2)f(3)=P(X=3),因為無法從【附表一】直接查到相對應的機 率值。但如把上一單元(單元7-16)的④和③兩式相減,即 可得到f(3)。 f(3)=P(X≤3)-P(X≤2)=P(X=3)
第一節 二項分配 二項分配期望值(平均數)與變異數
第二節 超幾何分配 超幾何實驗(hypergeometric experiment) 超幾何實驗的特性: 第二節 超幾何分配 超幾何實驗(hypergeometric experiment) 超幾何實驗的特性: (1)從一個含有N個個體的有限母體中,採不歸回抽樣,抽 出n個隨機樣本。 (2)N個母體中,預期成功的個數有S個,另預期失敗的個數 有N-S個。 在上述的超幾何實驗中,令X為成功類的個數,稱為超幾何 隨機變數,而X對應的機率函數f(x),稱之為超幾何機率函 數,或超幾何分配。其公式為:
第二節 超幾何分配 若超幾何機率函數f(x)為:
第二節 超幾何分配 1.二項分配的變異數 Var(X)=np(1-p) 2.超幾何分配的變異數 Var(X)=np(1-p)× 第二節 超幾何分配 1.二項分配的變異數 Var(X)=np(1-p) 2.超幾何分配的變異數 Var(X)=np(1-p)× 比較二項分配的變異數公式和超幾何分配的變異數公 式,後者多乘 ,稱為有限母體的校正因子。 假若N夠大,將N和n相比,致使比值 趨近於1 時,不論是否乘上 所造成的影響皆微乎其微,此時的二項 分配變異數和超幾何分配變異數趨近於相等。
第二節 超幾何分配 理論上,N愈大(至無限大),則 愈接近1。但在實際 應用上,只要 ≤0.05時,N就算是夠大了。一般而言,當 ≤ 0.05時,此時可以應用二項分配求算的機率,來取代超幾 何分配求算的機率了。
第三節 連續機率分配——常態分配 常態分配的定義為: (1)以X為橫軸,f(x)為縱軸,可繪出一個以μ為中心且左右對 稱的鐘型曲線。
第三節 連續機率分配——常態分配 (2)常態曲線的左右雙尾與橫軸漸近,但不相交,即常態曲線在橫 軸為漸近線,此乃-∞<x<∞之意義所在。 (3)常態曲線X軸中心點為 、 、 三種集中量數的位置。 (4) 、 為常態曲線中的重要參數,故其表示法是X~N( , ), 其中N代表常態分配(normal distribution), 決定常態曲線的中心位 置, 決定曲線形狀的寬度(或胖瘦)。
第三節 連續機率分配——常態分配 若 ~N( , ),則比較兩者的中心位置和形狀如下(參圖7- 1): 第三節 連續機率分配——常態分配 若 ~N( , ),則比較兩者的中心位置和形狀如下(參圖7- 1): ①當 = , < 時,兩常態曲線中心位置不同,但形狀相 同。 ②當 < , = 時,兩常態曲線中心位置相同,但形狀不 同。 圖7-1 各種不同常態分配圖
第三節 連續機率分配——常態分配 圖7-2 當N 變極大、組寬變極小,相對次數多邊圖之變化
第三節 連續機率分配——常態分配 常態曲線的面積和機率關係 常態曲線具有與相對次數多邊圖相類似的性質: 第三節 連續機率分配——常態分配 常態曲線的面積和機率關係 常態曲線具有與相對次數多邊圖相類似的性質: (1)常態分配曲線總面積=所有相對次數總和=1。 (2)常態分配曲線橫軸上的兩點區間所形成的面積,等於該 兩點間的機率。
第三節 連續機率分配——常態分配 常態分配的表示法 第三節 連續機率分配——常態分配 常態分配的表示法 常態分配的表示法為N( , ),當隨機變數X服從常態分配 N( , ),則代表有下列性質: (1) μ是平均數,決定曲線中心的位置。 (2) 是變異數,決定曲線分散程度,即寬窄形狀。 (3)常態曲線是以μ為中央,左右對稱的鐘形曲線,粗略地 繪圖如圖7-3。 (4)常態分配的模型因μ和S不同而異,因μ與S均屬連續型數 值,故基本上,常態分配有無限多個。
第三節 連續機率分配——常態分配 圖7-3 常態曲線圖,μ表示中央點
第三節 連續機率分配——常態分配 在連續型常態分配中,P(X=a)等於多少? 第三節 連續機率分配——常態分配 在連續型常態分配中,P(X=a)等於多少? 連續型常態分配的隨機變數X,是屬連續型變數,所以從常態曲 線X軸上任一點a作垂直線與其上曲線相交形成的線段 (如圖 7-4),此線段的面積等於0。以機率形式表示如下: 圖7-4 線段 面積為0
第三節 連續機率分配——常態分配 在連續型常態分配曲線下,與X軸上任何點a相關的機率,有 下列多種表示法:(注意有色字部分並比較等號左右兩項的 不同)
第三節 連續機率分配——常態分配 如圖7-4所示,X軸上之兩點區間所形成的面積,與其相對應 機率的說明如下: 第三節 連續機率分配——常態分配 如圖7-4所示,X軸上之兩點區間所形成的面積,與其相對應 機率的說明如下: (1)如圖7-5,a為X軸上之任一點,則: P(X ≤a)=面積 A P(X ≤a)=面積 B P(X ≤a)+P(X ≥a)=A+B= 1(總面積) 圖7-5 A+B=1
第三節 連續機率分配——常態分配 如圖7-4所示,X軸上之兩點區間所形成的面積,與其相對應 機率的說明如下: 第三節 連續機率分配——常態分配 如圖7-4所示,X軸上之兩點區間所形成的面積,與其相對應 機率的說明如下: (2)如圖7-6,c, d為X軸上之任兩點,則: P(c ≤ X ≤ d)=P(X ≤ d)-P(X ≤ c) =(C+D)-C =D 圖7-6 C+D<1
第三節 連續機率分配——常態分配 常態分配兩點區間機率的求法 1.積分法 對常態機率函數上,求任兩變數值間的積分: 2.查表法 第三節 連續機率分配——常態分配 常態分配兩點區間機率的求法 1.積分法 對常態機率函數上,求任兩變數值間的積分: 2.查表法 把常態分配所有變數值與對應機率值編列成表,如此一來, 就能很快從常態分配的任何變數值查到相對應的機率值。
第三節 連續機率分配——常態分配 標準常態分配的定義 由一群數值中的任一隨機變數X,其平均數為 ,標準差為 , 經下列公式轉換成Z值: 第三節 連續機率分配——常態分配 標準常態分配的定義 由一群數值中的任一隨機變數X,其平均數為 ,標準差為 , 經下列公式轉換成Z值: 轉換後的Z值,稱為標準數值(standard value),或標準分數 (standard score),而該群新數值Z的平均變成0 ,標準差變成1。 這種轉換過程稱為標準化。(參單元6-54)
第三節 連續機率分配——常態分配 新的隨機變數Z,具有下列特性: (1)標準化為一種線性轉換。 (2)Z如同原變數X一樣,是為隨機變數。 第三節 連續機率分配——常態分配 新的隨機變數Z,具有下列特性: (1)標準化為一種線性轉換。 (2)Z如同原變數X一樣,是為隨機變數。 (3)所有Z值的平均數 =0,標準差 =1。 (4)新的Z變數仍然屬於常態分配,換句話說,原變數X為常 態分配,而所有變數值之間的相對關係經標準化之後,仍 然維持不變。所以Z服從平均數為0,標準差為1的常態分配, 即:
第三節 連續機率分配——常態分配 標準常態曲線機率表的構成 Z~(0,12) 標準常態曲線的平均數為0,標準差為1,其表達方式如下所 示: 第三節 連續機率分配——常態分配 標準常態曲線機率表的構成 標準常態曲線的平均數為0,標準差為1,其表達方式如下所 示: Z~(0,12) 將隨機變數Z與其對應機率的關係製成一表備用,稱之為標準 常態機率分配表,如【附表二】所示。 (1)表之上方有一常態圖,其內的斜線面積表示小於z值的機 率,記為:P(Z<z)=斜線面積=小於z值的機率 (2)附表二內所列出的四位數值, 即表示常態曲線下的斜線面積所 代表的機率。
第三節 連續機率分配——常態分配 標準常態機率分配表的應用 使用標準常態機率分配表求Z≤1.21的機率(面積): 第三節 連續機率分配——常態分配 標準常態機率分配表的應用 使用標準常態機率分配表求Z≤1.21的機率(面積): (1)首先由標準常態機率分配表找出z=1.21的位置:最左側的縱欄 表示為z值中整數與第1位小數所代表的數值;最上方的橫列表示 為z值第2位小數的數值,所以由縱欄上的1.2和橫列的0.01,兩位 置合成z值1.21。 (2)兩位置直線相交處的數值為0.8869。 P(Z ≤ 1.21)=0.8869。
第三節 連續機率分配——常態分配 由機率值(面積)求z值 P(Z<z)=0.8869,求z值。 (1)由表內部找出0.8869的位置。 第三節 連續機率分配——常態分配 由機率值(面積)求z值 P(Z<z)=0.8869,求z值。 (1)由表內部找出0.8869的位置。 (2)由該位置向左沿線找到z值的整數與第一位小數為1.2, 向上找出z值的第2位小數為0.01。兩者合成得1.21。 (3)z值為1.21。
第四節 常態分配與二項分配的關係 二項分配的分配型態 二項分配B(n, p)的分配形狀,受參數p值和n的大小所影響。 第四節 常態分配與二項分配的關係 二項分配的分配型態 二項分配B(n, p)的分配形狀,受參數p值和n的大小所影響。 在二項分配B(n, p)中,若試驗次數n固定,則當p< 0.5,其分 配呈現右偏;當p> 0.5時,其分配呈現左偏;當p=0.5時, 其分配呈現對稱(參圖7-20)。若n愈大,則無論p值為何, 其分配會愈接近對稱,甚至趨近於常態分配。
第四節 常態分配與二項分配的關係 圖7-20 p與n的大小影響分配圖
第四節 常態分配與二項分配的關係 在二項分配下,趨近於常態分配的n值 二項分配轉換成常態分配 第四節 常態分配與二項分配的關係 在二項分配下,趨近於常態分配的n值 一般實務應用上,當np≥5且n(1-p) ≥5時,二項分配就和常態分 配非常接近。 尤其在n大於25以上,採用常態分配法來求二項分配的機率, 簡易的效果更為顯著。 二項分配轉換成常態分配 二項分配是屬間斷型機率分配,常態分配則屬連續型機率分 配。兩者的數值屬性不同,所以必須把二項分配「間斷型變 數值」轉換成「連續型變數值」之後,才能帶入常態分配環 境內計算。這種轉換過程,稱之為連續性修正(correction for continuity)。
第四節 常態分配與二項分配的關係 連續性修正原理 第四節 常態分配與二項分配的關係 連續性修正原理 二項分配可以用機率線圖(line chart)來表達分配狀況(參圖7- 21),以橫軸上任一點a對應的垂直線長度,表示為該a點的 機率值,公式表示如下: 圖7-21 a點所形成垂直線段的面積為0
第四節 常態分配與二項分配的關係 二項分配a點的機率值: 常態分配a點的機率值: 第四節 常態分配與二項分配的關係 二項分配a點的機率值: 常態分配a點的機率值: 結論:如果想應用連續型常態分配求得趨近於二項分配的機 率值,首要的工作必須先設法把二項分配的間斷型變數值, 作連續性修正為連續型變數值。
第四節 常態分配與二項分配的關係 進行連續性修正 第四節 常態分配與二項分配的關係 進行連續性修正 圖7-22為二項分配機率線圖,從其橫軸上的任一點a,向左右 各延 單位,即形成(a- )至(a+ )區間,然後以此區間作底, 向上繪一長方形。集合所有長方形,就形成連續型直方圖, 如圖7-22的虛線部分。 圖7-22 由a點向左右各延 單位
第四節 常態分配與二項分配的關係 由於直方圖每一長方形的底寬被調整為1個單位長度,所以這 個長方形面積即等同於二項分配a點的機率值f(a)。 第四節 常態分配與二項分配的關係 由於直方圖每一長方形的底寬被調整為1個單位長度,所以這 個長方形面積即等同於二項分配a點的機率值f(a)。 需特別注意的是,以a點經連續性修正而形成區間的長方形面 積(機率值),和原二項分配中a點計算的機率值f(a)是相等 的。
第四節 常態分配與二項分配的關係 比較連續性修正前、後的機率值 (1)二項分配中a點的機率是: …… ① 第四節 常態分配與二項分配的關係 比較連續性修正前、後的機率值 (1)二項分配中a點的機率是: …… ① (2)今a點經過連續修正成線段(a- )至(a+ ),然後把此線段拿到常 態分配環境下,求此區間的面積(機率),即為: …… ② 公式①和②兩個機率值幾乎是相等的。
第四節 常態分配與二項分配的關係 連續性修正時判斷加 或減 (1)繪圖,把a、a- 及a+ 在水平直軸線上標記,而形成區 間。 第四節 常態分配與二項分配的關係 連續性修正時判斷加 或減 (1)繪圖,把a、a- 及a+ 在水平直軸線上標記,而形成區 間。 (2)從該區間的兩端點,繪出不等式(如a ≤ X或a ≥ X)的箭 頭線。 (3)檢討原不等式是否有等號。若「有等號」則選取箭頭線 包含整個區間,若「無等號」則選取箭頭線不含區間。 (4)依(3),很容易判斷作連續性修正時,二項式的不等式是 否該加 或減 。