第五章 機率分配 授課教師: 2011.02.18更新
本章重點 認識隨機變數 瞭解期望值與變異數的定義與意義 認識二項分配與常態分配的各種性質 瞭解標準常態分配如何查表與其應用
大綱 隨機變數與機率分配 機率分配的重要參數 二項分配 百努力試驗 常態分配 標準常態分配
5-1 隨機變數與機率分配 並非所有的事件發生機率都是定值 機率也是一個變數 在本節中將介紹隨機變數與其對應的機率分配
5.1.1隨機變數的意義 隨機變數 定義於樣本空間的實數函數,一般可解釋為樣本出像的分類標準,也可視作一個樣本空間的總代表 例如用變數X來表示隨機從前程大學中抽出100人的性別 用變數Y來表示這100人中的血型 此處X、Y即代表樣本出像的分類標準
若X表示性別,那麼可用x=1表示男生,x=2表示女生 Y表示血型,那麼y=1表示A型血,y=2表B型血,y=3表O型血,y=4表AB型血
隨機變數的種類 離散型隨機變數 連續型隨機變數 離散型隨機變數最大的特性是「可數」 可以一筆一筆資料逐項進行計數 例如隨機抽出100人中男性的人數 連續型隨機變數 連續型隨機變數最大的特性是「不可數」 不能夠一筆一筆的將資料逐項進行計數 例如:連續發生兩次地震所需時間
例 1 隨機抽樣100人記錄這100人的性別、居住地(北、中、南)、家庭背景(雙親、單親、他人扶養)以及出生月份。請你以隨機變數的方式來描述這些變數與其對應的變量。
5.1.2機率分配 指某個隨機變數各變量所對應的機率值 隨機變數與其機率分配的對應關為一對一對應或多對一對應
機率分配表示法 機率分配表 機率函數 x 1 2 3 f(x) 1/8 3/8
機率分配圖
例 2 同時投擲四枚硬幣,假設隨機變數X表示出現人頭像的硬幣數,試求隨機變數X的機率分配。請你分別使用機率分配表、機率分配圖、與機率函數三種方式表示。 (3)機率函數
5-2 機率分配的重要參數 想要描述一組資料的分佈情形,最重要的兩個參數分別為平均數與變異數 常態分配,只要知道平均數與標準差,整個機率函數的圖形就可以描繪出來
5.2.1 期望值 期望值其實就是平均數 期望值的定義為 期望值等於隨機變數值與對應機率乘積的總和
例 3 詢問全班16位修高等統計學的學生,從住處到學校需花費時間為何,假設隨機變數X為學生回答之花費時間(單位:分鐘),將調查所得到的資料製作成機率分配表如下所示: 求隨機變數X的期望值(即求學生到校平均花費時間)。
例 4 某人向保險公司投保1千萬的意外險,保費一年4000元。根據契約書的規定,若被保險人在保險期間意外死亡,保險公司需理賠1千萬元。已知此人一年內發生意外死亡的機率為 10-10,試求保險公司獲利的期望值多少元?
5.2.2變異數與標準差 變異數的定義 E這個符號具有下列性質 ★表任意的式子 標準差的定義 標準差則等於變異數開根號
例 5 承例題3,求隨機變數X的變異數與標準差(即求到校花費時間的變異數與標準差)。
5-3 二項分配 凡是調查的結果只有兩種情況—成功或失敗;是或否;對或錯…..等,都屬於二項分配
5.3.1 二項試驗 二項試驗必須滿足下列四個條件 重複進行n次相同的試驗 每一次試驗皆僅有兩種結果—成功或失敗 每一次試驗,成功與失敗的機率永遠固定不變,且成功機率加失敗機率等於1 每一次試驗均為獨立事件
例 6 請舉出至少3個二項試驗的例子。 第一個例子是:生10位小孩。小孩子的性別只有男女兩種情況,且重複相同的試驗,生男生女的機率永遠固定都是0.5,相加等於1,同時滿足獨立事件。 第二個例子是:買樂透10期且每期只買一張。樂透只有中獎(不考慮獎項)或不中獎兩種情況,且重複相同的試驗,中獎與不中獎的機率永遠固定不變,兩者機率和等於1,同時滿足獨立事件。 第三個例子是:從0到9十個數字中,任選一個數字,連續選10次,選出數字1。選出的數字只有兩種情況,1或不是1,且重複相同的試驗,選出1的機率永遠等於0.1,不是1的機率等於0.9,相加等於1,同時滿足獨立事件。
5.2.3 二項分配 進行二項試驗,所得到的機率函數 二項分配的機率函數 其中p為成功機率, q為失敗機率
例 7 假設某保險業務員向客戶推銷保險,成功的機率永遠固定等於0.2。現在他連續向6個人推銷保險,請問這6個人恰有4個人向他買保險的機率為何?
5.3.3 二項分配的期望值與變異數 期望值 變異數
例 8 已知某袋中共有10個球,其中有8個黑球2個白球。現在隨機從這個袋中任取4球,試分別求取出黑球與白球的期望值個數與變異數。
5.3.4 二項分配圖形的製作 用一個實際例子來說明
例 9 已知二項分配的機率函數為 ,令n=10,p=0.3 ,請用Excel做出二項分配的圖形。 Excel指令說明 COMBIN(n, r):等於組合公式 。 Excel指令說明 BINOMDIST(成功次數,試驗次數,成功機率,邏輯值):邏輯值=FALSE傳回機率函數值;邏輯值=TRUE傳回累積分配函數值。 例如:BINOMDIST(3,10,0.3,FALSE) 打開檔案「5-3-4」
5.3.5二項分配圖形的性質 下列圖形為試驗次數n=10 ,在不同成功機率下的二項分配 成功機率p=0.1 成功機率p=0.3
成功機率0.5時圖形為對稱分配,成功機率小於0.5時,圖形為左偏分配,大於0.5時圖形為右偏分配 成功機率p=0.9
下列圖形為成功機率固定p=0.1的條件下,不同試驗次數的二項分配 n=5 n=10 n=20 n=30
n=40 n=50 試驗次數增加,二項分配的圖形會趨近於對稱分配
5-4百努力試驗 百努力試驗(Bernoulli trial)是二項試驗的一個特例 進行二項試驗時,不論成功或失敗,只做一次時,就稱為百努力試驗 也有人稱為點二項試驗
百努力分配的機率函數 期望值 變異數
5-5常態分配 常態分配在人文社會學的研究中扮演十分重要的角色 只要求出平均數與標準差,那麼整個分配的圖形就可以畫出來 因此在人文社會學的研究中平均數與標準差(或變異數)是最重要的兩個統計量
5.5.1常態分配的簡介 常態分配的機率函數曲線稱為常態曲線 常態分配之機率函數 為母體平均數, 為母體標準差 記作:
5.5.2常態曲線的繪製 繪製常態曲線必須給定母體平均數與母體變異數的數值,然後再利用描點的方式畫出
例 10 已知常態分配機率函數為 。現假設母體平 均數=10,母體變異數 2=2,試利用Excel繪製常態曲線。 打開檔案「5-5-2常態曲線的繪製」
5.3.3常態曲線的特性 曲線下方與x軸所圍面積等於1 對稱於直線 x= 由 開始向左 向右各一個標準差之處為常態曲線的兩個反曲點 常態分配曲線為單峰對稱分配,平均數、中位數、眾數三個數值相等
5.5.4常態分配機率的求法 採用面積的方式來定義機率大小
下列式子所求出來的答案是相同的
例 11 已知前程大學一共有1萬名學生,已知學生的身高服從常態分配,全體平均身高為172公分,標準差5公分。請你估計前程大學學生的身高在165-175公分大約有幾人?
5-6標準常態分配 沒有學過數值分析的人而言,想要計算常態分配的機率值,幾乎是不可能的事情 為了讓非數學背景的人也能夠順利求出常態分配的機率值,數學家想到透過查表的方式
常態分配的查表法是利用積分技巧中的變數變換法,讓所有的常態分配都能對應到相同的積分函數,如此便可以用單一的表查出所有的常態分配機率值
標準常態分配
5.6.1標準常態分配的特性 標準常態分配的平均數等於0,標準差為1
5.6.2標準常態分配的查表
例 12 試利用標準常態分配表求下列各小題之機率: (1) P(z>1.13) (2) P(z<2.06) (3) P(z>-1) (4) P(z<-1.96) (5) P(-1<z<2.14)
(1) (2)
(3) (4) (5) (6)
5.6.3標準常態分配的應用 解題步驟 列式(或畫圖) 標準化 查表
例 14 每年台灣地區都會舉辦大學聯考,許多考生對於自己的落點十分關心,因為能夠的預測落點的話,可以當作選填自願的參考。已知某次大學聯考一共有15萬名考生,已知均標(全體平均數)等於300分,標準差20分。假設全體考生的成績分配為常態分配,某人考了338分,請問這位考生的分數落在前百分之多少?順便請你幫他預估大約有多少考生的分數超越他?
例 15 一般購買產品都有保固期,對消費者來說保固期越長越好,但對製造商而言不希望有太多的產品在保固期內做免費的維修,因此如何定保固期是一門很大的學問。前程汽車股份有限公司是一家全球化的汽車製造商,根據他們自己內部的資料統計,他們所製造的汽車平均壽命20年,標準差10年,而且汽車的壽命服從常態分配。前程汽車公司於保固期內會免費修理任何的毛病,如果前程汽車公司對賣出的汽車只願意免費修理5%,請問保固期應該定多久?