機率論(Probability) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/12/10
課程大綱 隨機實驗(random experiment) 不同的機率理論 「機率」(probability)的基本概念 間斷隨機變數的機率分配 連續隨機變數的機率分配 常態分配與標準化常態分配 計量分析一(莊文忠副教授) 2019/12/10
隨機實驗(random experiment) 計量分析一(莊文忠副教授) 2019/12/10
有趣的問題 明天出門要不要帶雨傘? 要不要買樂透? 該坐火車還是搭飛機? 生了七仙女之後,下一個生男孩的機率 是不是比較高? 職棒的教練和球員為什麼不能下注賭自 己的球隊輸贏? 計量分析一(莊文忠副教授) 2019/12/10
「機率」(probability)是什麼? 機率又稱之為或然率,用以衡量不確定 事件發生或不發生的可能性大小,據以 作為決策的判斷,同時也是推論統計學 得以發展的基礎。 計量分析一(莊文忠副教授) 2019/12/10
隨機實驗(random experiment) 在不控制任何因素的情境中進行試驗的過程, 可以預期會出現數種結果中的其中一種,但無 法事先預測會是出現哪一種結果,此一試驗過 程可以重複進行,進而歸納出一些規則,例如 擲骰子或丟銅板。 隨機和偶遇(haphazard)不同之處在於前者經過重 複試驗或長期觀察即可發現其規則性。必須注 意的是,重複試驗必須是相互獨立的,即任何 一次試驗結果都不會影響到其他試驗結果,否 則就會破壞隨機性。 計量分析一(莊文忠副教授) 2019/12/10
隨機實驗的構成要件 實驗後所有可能的結果可以預知。 實驗後的真正結果無法預知。 在相同的狀況下可以重複的實驗。 經重複且長時間的實驗後,某事件的相 對次數趨近於一定值。 計量分析一(莊文忠副教授) 2019/12/10
基本結果(elementary outcomes) 隨機實驗所可能出現的各種結果。 例如擲一粒骰子可能會出現1到6點的其中 一個 S={1,2,3,4,5,6} 同時丟兩個銅板可能出現兩個正面、一 正一反、或兩個反面的其中一種 W={正正,正反,反反} 計量分析一(莊文忠副教授) 2019/12/10
樣本空間(sample space) 列出隨機實驗中的各種可能結果。樣本 空間內的每一個元素稱之為「樣本點 (sample point)」,可以依某一性質(變數)或 某些性質(變數)加以切割成若干個互斥的 次樣本空間。即 計量分析一(莊文忠副教授) 2019/12/10
例子:丟擲2個銅板 正 反 正正 正反 反正 反反 第1個銅板 第2個銅板 最後結果 計量分析一(莊文忠副教授) 2019/12/10
基本的事件 假設A、B是樣本空間內的二個事件,A和B之間的集合 運算有以下幾種: 3.互補事件:又稱「餘事件」,即事件A之外的其他事件 發生的情形,以「Ac」或「A’」表示。 4.差事件:即事件A發生且事件B不發生的情形,以「A-B」 或「A∩」表示。 5.零事件:即事件A不發生,以ψ表示。 6.互斥事件(mutual exclusive events):,即事件A和事件B不 可能同時發生稱之。 計量分析一(莊文忠副教授) 2019/12/10
不同的機率理論 計量分析一(莊文忠副教授) 2019/12/10
古典的機率理論(classical probability) 機率的定義:假設某一總數為N的集合中包含A 的事件有n個,則A發生的機率為:P(A)=n/N。 此種機率理論係假定各種可能的基本結果是互 斥且出現的機率完全相同。 機率的解釋:機率為包含A性質的個數與總數 之比。 確定機率的數值:任何一集合,先決定總數N 與包含A的次數n,即可求得先天機率: P(A)=n/N。 計量分析一(莊文忠副教授) 2019/12/10
古典的機率理論(classical probability) 機率的運算:能進行運算而獲得新事件發生的 機率。 特點:本理論不經試行,直接依據事物之本質, 推得其發生某事件的機率。故稱之為先天的機 率理論。 缺點: 1.事件的總個數若為無限時,不能求得機率。 2.事件A的個數為有限,但不知其為多寡時,不 能求得機率。 3.各事件的出現不為同等可能時,不能求得機率。 計量分析一(莊文忠副教授) 2019/12/10
客觀的機率理論(objective probability) 此一機率理論的基本假定為該實驗是可以試行的,經 過長期(多次)重複試行的實驗,事件的相對次數會趨於 穩定,而此一次數比即為該事件之機率,故又稱之為 相對次數的機率理論(relative frequency probability)。 機率的解釋:多次試行中,包含A性質的次數與試行總 次數之比。 計量分析一(莊文忠副教授) 2019/12/10
客觀的機率理論(objective probability) 確定機率的數值:試行n次,查得包含A者為f, 則得後天機率:P(A)=f/n。 機率的運算:能進行運算而獲得新事件發生的 機率。 特點:根據本理論,機率必須經試行後才能獲 得,所得之機率為後天機率,無古典理論的缺 點。 缺點:不能重複試行的實驗,無法求得各事件 發生的機率。 計量分析一(莊文忠副教授) 2019/12/10
主觀的機率理論(subjective probability) 機率的定義:機率為人們對某一事件相信其發生之可 能性大小,即事件A發生的機率為:P(A)=[對A發生的相 信程度]。此一機率理論的基本假定是個人有足夠的能 力或資訊來預測事件發生的可能性。 機率的解釋:機率為人們對一事件發生可能性的主觀 評價。 確定機率的數值:任何由人們所提出之計算機率的方 法均應用。 機率的運算:能進行運算而獲得新事件發生的機率。 爭論:由於事件尚未發生,無法以古典的機率或客觀 的機率表示之,故僅能利用個人主觀的判定來表示。 計量分析一(莊文忠副教授) 2019/12/10
「機率」(probability)的基本概念 計量分析一(莊文忠副教授) 2019/12/10
簡單事件機率(event probability) 設事件A為隨機實驗的樣本空間,其發生 之機率P(A)為事件A之基本結果的機率總 和。即 樣本空間S A 計量分析一(莊文忠副教授) 2019/12/10
聯合機率(joint probability) 樣本空間S 計量分析一(莊文忠副教授) 2019/12/10
邊際機率(marginal probability) 在二個或二個以上的類別的樣本空間中,僅考慮某 一類別個別發生的機率。 計量分析一(莊文忠副教授) 2019/12/10
條件機率(conditional probability) 在已知事件Ai發生的前提下再發生Bj的機 率,則Bj的條件機率為 若A和B兩事件獨立或兩分類標準獨立,則 計量分析一(莊文忠副教授) 2019/12/10
例子:性別與考試成績 考試 及格 不及格 合計 性別 男生 20 60 80 女生 40 120 100 200 計量分析一(莊文忠副教授) 2019/12/10
事件的性質與關係 獨立事件(independent event):各事件之間 發生的機率互不相影響。 相依事件(independent event): A事件和B事 件是獨立事件即為互依事件。換言之,A 事件的發生會影響到B事件發生的機率, 反之亦然。 互斥事件(mutual exclusive event):A事件和B 事件不會同時發生,即兩者的交集為空 集合。 計量分析一(莊文忠副教授) 2019/12/10
兩事件獨立的條件 P(A|B)=P(A) P(B|A)=P(B) P(A∩B)=P(A)×P(B) 若A、B兩事件符合上述任一條件(因任一 條件成立,其他二條件亦必定成立),則A、 B互為獨立。 計量分析一(莊文忠副教授) 2019/12/10
例子:性別與考試成績相互獨立 考試 及格 不及格 合計 性別 男生 0.2 0.4 女生 0.3 0.6 0.5 1.0 計量分析一(莊文忠副教授) 2019/12/10
三事件獨立的條件 P(A∩B)=P(A)×P(B) P(A∩C)=P(A)×P(C) P(B∩C)=P(B)×P(C) P(A∩B ∩C)=P(A)×P(B)×P(C) 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的機率分配 計量分析一(莊文忠副教授) 2019/12/10
隨機變數的類型 間斷/不連續隨機變數(discrete random variable):隨機變數的數值個數是有限的, 個數是無限但可數的。 連續隨機變數(continuous variable):隨機變 數的數值個數是無限且不可數的,通常 以一個區間來表示。 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的例子 隨機實驗 隨機變數X 隨機變數X的可能數值 填答問卷的受訪者 性別 1=男性,2=女性 各縣市治安狀況評比 搶案件數 0,1,2,…10 國文能力測試 考試成績 0,1,2,3,…,100 計量分析一(莊文忠副教授) 2019/12/10
連續隨機變數的例子 隨機實驗 隨機變數X 隨機變數X的可能數值 問卷填答時間 填答時間(分鐘) x≧30 調查家庭收支 個人所得 選舉預測 得票率 53%≦x≦58% 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的機率分配 指隨機變數X的各個數值發生機率(或相對次數)的分布 情形。 例子:過去五年來,甲公司主管每月離職人數 離職人數(X) 相對次數(rf) 機率f(x) 0.15 1 2 0.25 3 0.20 4 5 0.10 合計 1.00 32 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的機率圖 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的機率函數 設間斷隨機變數X,其數值為x1,x2,x3,…,xn,每一 個數值的相對應機率為f(xi)或f(X=xi),f(xi)滿足以下 兩個條件,則稱f(xi)為X之機率函數或機率分配: 1.0≦f(xi)≦1; 2. 根據機率函數可求取某一數值範圍內的機率,即 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的累加機率函數 累加機率函數具有以下的特性: 1.起始點的累加機率為0,即F(x0)=0 x0<x1。 2.累加至最大值的機率為1,即F(xn)=1。 3.累加機率為一遞增函數,即若xj>xi,則 F(xj)>F(xi)。 4.某一數值的機率等於該數值的累加機率減去前一 個數值的累加機率,即f(xi)=F(xi)-F(xi-1),xi-1為xi的 前一個變量,xi-1<xi。 計量分析一(莊文忠副教授) 2019/12/10
例子:離職人數的累加機率 離職人數 相對次數 機率f(x) 累加機率F(x) 0.15 1 0.30 2 0.25 0.55 3 0.20 0.15 1 0.30 2 0.25 0.55 3 0.20 0.75 4 0.90 5 0.10 1.00 合計 計量分析一(莊文忠副教授) 2019/12/10
例子:離職人數的累加機率圖 計量分析一(莊文忠副教授) 2019/12/10
間斷隨機變數的期望值 期望值:重複進行多次的實驗,預期會發生或 觀察得到的數值或結果。 間斷隨機變數的期望值:隨機變數X的各個數 值以其發生機率為權值的加權平均數。 例:預期甲公司主管未來每個月的離職人數 計量分析一(莊文忠副教授) 2019/12/10
例:過去五年來,甲公司主管每月離職人數的穩定程度 X xi-μ (xi-μ)2 f(xi) (xi-μ)2f(xi) -2.35 5.523 0.15 0.828 1 -1.35 1.823 0.273 2 -0.35 0.123 0.25 0.031 3 0.65 0.423 0.20 0.085 4 1.65 2.723 0.408 5 2.65 7.023 0.10 0.702 合計 17.635 2.328 計量分析一(莊文忠副教授) 2019/12/10
二項機率分配(binomial probability distribution) 計量分析一(莊文忠副教授) 2019/12/10
二項機率分配的意涵 二項隨機實驗:一實驗的結果只有兩種互斥的結果, 即成功和失敗。若在同一環境條件下獨立地重複實驗n 次,則此二項實驗具有以下幾個特性: 1.重複n次相同的實驗; 2.每一次實驗的結果只有兩種,即成功(S)或失敗(F); 3.成功的機率P(S)=p,失敗的機率P(F)=1-p(或以q)表示, 且每次實驗的機率均相同; 4.每一次的實驗都是獨立的; 5.隨機變數X定義為n次實驗中成功的次數,X的機率函數 稱為二項機率分配。 計量分析一(莊文忠副教授) 2019/12/10
例子:猜燈謎 根據過去的猜燈謎經驗,李同學猜中的機率為0.3,今 年李同學準備猜三題燈謎,請問三題都猜中的機率是 多少?三題都猜錯的機率是多少? Sol:這是一個二項隨機實驗,因為它符合以下的特性 (1)重複3次相同的實驗; (2)每一次實驗結果只有兩種:猜對(S)或猜錯(F); (3)猜對的機率P(S)=p=0.3, 猜錯的機率P(F)=1-p=0.7 且每一題的機率均相同; (4)每一題猜對或猜錯的結果都是獨立的; (5)隨機變數X定義為3次實驗中猜對的次數, 可用樹狀圖表示。 計量分析一(莊文忠副教授) 2019/12/10
例:猜燈謎結果的樹狀圖 S F (S,S,S) X=2 X=0 第2題 (S,S,F) (S,F,S) (S,F,F) (F,S,S) 第1題 第3題 樣本點 X值 計量分析一(莊文忠副教授) 2019/12/10
二項隨機實驗的機率分配 計量分析一(莊文忠副教授) 2019/12/10
二項隨機實驗的機率分配 此一機率分配滿足二個條件: 1. 2. 二項機率分配可簡單表示為B(X:n,p) 二項機率分配的累加機率函數 例子:至少猜對2題的機率是多少? 計量分析一(莊文忠副教授) 2019/12/10
二項機率分配的特性 各項成功數的機率恰為二項展開式(p+q)n的各項。 成功數的機率為 當x=0,1,2,…,n時的機率恰好為二項展開式的各項, 故稱之。 二項分配的平均數與變異數: 計量分析一(莊文忠副教授) 2019/12/10
連續隨機變數的機率分配 計量分析一(莊文忠副教授) 2019/12/10
連續隨機變數的基本概念 意義:係指隨機變數的數值是無限的,無法像間斷隨 機變數一樣可以單獨列出每一個數值的相對機率,因 為樣本空間內有無數的樣本點,彼此之間是密接在一 起,其機率是以一個區間的面積來計算,而每一個單 獨樣本點的機率為0。例如薪資、時間、容量等。 機率的計算 機率=面積=底×高=單位組距×相對次數 機率總和=總面積=1 若組距不是單位組距(即不等於1)時,則 面積=底×高=組距×相對次數密度 → 相對次數密度=面積÷組距 計量分析一(莊文忠副教授) 2019/12/10
例子:某一所高中學生的身高 身高(x) 單位組距 次數 相對次數 140~145 1 124 0.041 145~150 180 0.060 150~155 235 0.078 155~160 332 0.111 160~165 453 0.151 165~170 572 0.191 170~175 394 0.131 175~180 269 0.090 180~185 172 0.057 185~190 154 0.051 190~195 115 0.038 合 計 3000 1.000 計量分析一(莊文忠副教授) 2019/12/10
例子:直方圖 計量分析一(莊文忠副教授) 2019/12/10
例子:相對次數密度 身高(x) 組距(A) 相對次數密度(B) 相對次數(A×B) 140~145 5 0.008 0.041 145~150 0.012 0.060 150~155 0.016 0.078 155~160 0.022 0.111 160~165 0.030 0.151 165~170 0.038 0.191 170~175 0.026 0.131 175~180 0.018 0.090 180~185 0.011 0.057 185~190 0.010 0.051 190~195 合計 1.000 計量分析一(莊文忠副教授) 2019/12/10
連續隨機變數的基本概念 樣本數愈多時,組距愈小,相對次數直方圖愈趨近 於圓滑的曲線。曲線的高度為機率密度,曲線下方 某一區間的面間即為機率,其總和為1。 連續隨機變數的機率密度函數 設X為連續隨機變數,其值為a≦X≦b,若f(x)滿足下 列二個條件: 1. 2. 則f(x)為X的機率密度函數(probability density function, pdf)。 計量分析一(莊文忠副教授) 2019/12/10
例子:大學生手機使用壽命的機率分配 x f(x) 1年以下 0.40 1~3年 0.15 3~5年 0.10 5~7年 0.05 計量分析一(莊文忠副教授) 2019/12/10
常態分配與標準化常態分配 計量分析一(莊文忠副教授) 2019/12/10
常態分配的意義 資料排序後的次數分布以平均數μ為中心而呈左右對稱 的圖形分布,是一個理論上的曲線,因其狀似鐘形, 又稱為「鐘形分布」,其峰度則取決於標準差和平均 數的大小。一般習慣以X~N(μ,σ2)來表示。 平均數、中位數與眾數是同值,而將常態曲線分成對 稱的兩個部分,各佔總分布的一半。 分布是對稱的,一旦將本分布從中間對折,兩邊會彼 此重疊。 分布的兩端(尾巴),離平均數愈遠,會接近X-軸,不過, 不會接觸到X-軸—總是會有發生的機率,但機率很低。 計量分析一(莊文忠副教授) 2019/12/10
常態分布圖 計量分析一(莊文忠副教授) 2019/12/10
常態分配的機率密度函數 只要知道常態分配的平均數與標準差,即可畫出常 態曲線,及計算某一範圍或區間的機率值(面積), 其公式如下: 計量分析一(莊文忠副教授) 2019/12/10
平均數相同,標準差不同的常態分布 計量分析一(莊文忠副教授) 2019/12/10
平均數不同,標準差相同的常態分布 計量分析一(莊文忠副教授) 2019/12/10
常態分配的特性 平均數=中位數=眾數 常態分布在時有一轉折點,即表示在平均數的兩側 各1個標準差的位置,曲線的曲率(curvature)會改變, 此點即為轉折點。 常態分配曲線的兩尾無限延伸。 偏態係數等於0,峰度係數等於3,為一常態峰。 常態分布的常見機率範圍: 計量分析一(莊文忠副教授) 2019/12/10
常態分布的常見機率範圍 計量分析一(莊文忠副教授) 2019/12/10
常態分配表 計量分析一(莊文忠副教授) 2019/12/10
常態分布的重要性 是社會與自然界中最常見的現象,如身高、智商、成 績等現象多為常態分布。 統計學上有許多問題可在常態分布的假設下獲得解決, 如小樣本的抽樣分配(如卡方分配、t分配、F分配)常假 設母體為常態分配,在統計分析中佔極重要的地位。 構成大樣本推論統計的基礎,大規模的抽樣調查常將 常態分布視為極限式,以便於統計推論的進行。要言 之,常態分布經常是統計推論過程的基本模式。 間斷機率分配在某些條件下可利用常態分布求其近似 值,如二項分配可用常態分布求其機率值。 計量分析一(莊文忠副教授) 2019/12/10
標準化常態分布 意義:設常態分布X~N(μ,σ2),令Z=(X-μ)/σ,則Z 為一標準化常態變數,因X為常態分布,根據常態 分布的加法定理,Z亦為一常態分布,且平均數為0, 變異數為1,可表示成Z~N(0,1)。 計量分析一(莊文忠副教授) 2019/12/10
標準化常態分布的特性 具有常態分布的特性,是常態分布的特 例,平均數為0,變異數為1,標準差為1。 可利用標準化常態分布機率表查得任何 值域內(a≦Z≦b)的機率。 標準化常態分布的機率和等於1,以平均 數Z=0為中心點,左右兩邊的機率各為0.5, 即P(Z>0)=0.5且P(Z<0)=0.5。 計量分析一(莊文忠副教授) 2019/12/10
例子: 設Z為一標準化常態分布,試求P(0≦Z≦0.35)、 P(-0.35≦Z≦0.35)、P(0.25≦Z≦0.35)、 P(Z≧0.35)的機率。 設Z為一標準化常態分布,若P(0≦Z≦a)=0.3962、 P(b≦Z≦0)=0.1103,P(-c≦Z≦c)=0.95試求a、b、 c值。 計量分析一(莊文忠副教授) 2019/12/10
二項分配與常態分配 計量分析一(莊文忠副教授) 2019/12/10
例子: 假設某一旅館有80個客房,平日的住房率為75%, 請求平日一天租出去60個房間的機率為何?至少租 出64個房間的機率為何?最多租出去50個房間的機 率為何? 計量分析一(莊文忠副教授) 2019/12/10
提問與心得分享 計量分析一(莊文忠副教授) 2019/12/10