第五章 離散型隨機變數及其常用的機率分配.

Slides:



Advertisements
Similar presentations
第三章 導函數 ‧ 函數的極限與連續 函數的極限與連續 ‧ 導數及其基本性質 導數及其基本性質 ‧ 微分公式 微分公式 ‧ 高階導函數 高階導函數 總目錄.
Advertisements

Chap 3 微分的應用. 第三章 3.1 區間上的極值 3.2 Rolle 定理和均值定理 3.3 函數的遞增遞減以及一階導數的判定 3.4 凹面性和二階導數判定 3.5 無限遠處的極限 3.6 曲線繪圖概要 3.7 最佳化的問題 3.8 牛頓法 3.9 微分.
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
Chapter 5 隨機變數 Part II. 結束 設 X 為隨機變數, a 、 b 為實數,則 (1) E (aX + b) = aE (X) + b (2) E (g (X) + h (X)) = E (g (X)) + E (h (X)) 設隨機變數 X 的期望值為  ,則 稱為 X 的變異數。變異數也可用.
單元九:單因子變異數分析.
智力測驗計分與解釋 輔導老師 黃曉樺.
第 5 章 離散機率分配.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
第 5 章 離散機率分配.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
遞迴關係-爬樓梯.
商用統計學 Chapter 5 機率分配.
樣本空間與事件 餘事件:不在A中的樣本所構成的事件,即A′.
17 類別資料的分析  學習目的.
第 14 章 Logistic迴歸.
認識倍數(一) 設計者:建功國小 盧建宏.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
第六章--常用的機率分配 間斷機率分配 6.1 二項分配 6.2 超幾何分配 6.3 幾何分配(可跳過) 6.4 Poisson分配
第五章 機率分配 授課教師: 更新.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
4. Probability Theory & Probability Distribution
本章大綱 9.1 Sequence數列 9.2 Infinite Series無窮級數
計數值抽樣檢驗計劃 (MIL-STD-105E)
The Runs Test : A Test for Randomness
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
風險值 Value at Risk (VaR) 區國強.
第六章 機率分配.
單一分配 Uniform distribution
第一章 直角坐標系 1-1 數系的發展.
積分的商業應用 不定積分的商業應用 1. 邊際成本函數  2. 邊際收益函數  3. 邊際利潤函數  4. 若已知 
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
Ch2多項式函數 2-2 多項式的運算與應用 影音錄製:陳清海老師 資料提供:龍騰文化事業股份有限公司.
第一章 直角坐標系 1-3 函數圖形.
第六章 連續型隨機變數及其常用的機率分配.
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生統資訊組
Definition of Trace Function
微積分網路教學課程 應用統計學系 周 章.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Review of Statistics.
The Bernoulli Distribution
4- 第四章.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第一章 貨幣的時間價值.
四、分立隨機變數 (Discrete Random Variables)
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
Introduction to Probability
Chapter 6 離散型機率分配,通常以直方圖之圖形或公式就可以指出其分配。
10328: Coin Toss ★★★☆☆ 題組:Problem Set Archive with Online Judge
統計學: 應用與進階 第3 章: 隨機變數.
13194: DPA Number II ★★☆☆☆ 題組:Problem Set Archive with Online Judge
隨機變數與機率分配 間斷機率分配 聯合機率分配 期望值與變異數 共變異數與相關係數
Chapter 5 隨機變數與機率分配 5.1 隨機變數 5.2 機率分配.
第一章 直角坐標系 1-3 函數及其圖形.
4-1 變數與函數 第4章 一次函數及其圖形.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
機率分配.
第十七講 重積分 應用統計資訊學系 網路教學課程 第十七講.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
機率論(Probability) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/12/10.
Presentation transcript:

第五章 離散型隨機變數及其常用的機率分配

5.1 隨機變數 5.1.1 隨機變數的意義 討論隨機實驗時,有時我們感興趣的,或許並不是確切的發生結 果,因其結果所成的樣本空間較為抽象,真正關心的,可能是將 這些確切結果經由一有意義的實數值函數轉換,進而改以函數值 表示的事件。經實數值函數轉變後以數值表示的事件即稱為實數 值事件( real value event),在實數裏有很多數學運算可應用,如加 法、減法、積分、微分。例如觀察投擲兩枚骰子的實驗中,我們 不在乎是(1,3)或(3,1)或(2,2)〔確切結果〕發生,對我 們更有意義的,則是兩枚骰子總合〔函數〕為4〔函數值〕的事 件。經一特定實數值函數,並以轉換後的函數值來表示事件,則 此實數值函數即稱為隨機變數。

一般而言以大寫英文字母來表示此函數,也就是隨機變數。而以小 寫英文字母來表示函數值,也就是隨機變數可能值。如上述投擲兩 枚骰子實驗,若定義隨機變數Y〔函數〕:其面朝上點數總合。而 其相對的可能值〔函數值〕Y=2,3,4,5,6,7,8,9,10,11,12。並以{Y =}來表示原樣本空間,經此函數轉變後的實數值事件。 定義5.1.1 隨機變數(random variable)即是以樣本空間為定義域而值 域為實數的實數值函數。

【例5.1】 考慮投擲三枚硬幣實驗,定義隨機變數Y:出現正面的次數。試著 將每一樣本點所對應的函數值列出,並列出所有轉換後的實數值事 件,所各自包含的樣本點。

解: 上一章曾經提及,投擲三枚硬幣其樣本空間為:  H:正面 T:反面   S={ HHH,HHT,HTH,HTT,THH,THT,TTH,TTT } 而隨機變數Y定義為出現正面的次數,故其對應關係如本頁圖5-1所 示。由此圖可知,隨機變數的可能值Y=0,1,2,3。也就是說,原樣 本空間經由隨機變數而轉變成4個實數值事件。其各自包含的樣本點 為 {Y=0}={ TTT }     {Y=1}={ THT,TTH,HTT } {Y=2}={ HHT,HTH,THH } {Y=3}={ HHH }

5.1.2 隨機變數的分類 隨機變數可區分為兩大類:離散型隨機變數(discrete type random variable)和連續型隨機變數(continuous type random variable)。當一 隨機變數其可能值的個數為有限個(finite)或是可數的無限多 (countably infinite)時,稱為離散型隨機變數。而若一隨機變數其可 能值為不可數的無限多(uncountably infinite)時,此時稱為連續型隨 機變數。下一例子將可幫助讀者進一步清楚其詳細的分類。

【例5.3】 1. 定義隨機變數X:投擲一枚硬幣次,其出現正面的次數。則X的可能值為=0,1,2,3,…...〔有限個〕。X為離散型隨機變數。 2. 定義隨機變數Y:一小時內某一路口通過之車輛個數。則Y的可能值=0,1,2,3,……..〔可數的無限多〕。Y為離散型隨機變數。 3. 定義隨機變數T:某一電視機之使用壽命。則T的可能值t≧0〔不可數的無限多〕。T為連續型隨機變數。

5.2 離散型隨機變數之機率分配 定義5.2.1 一離散型隨機變數之機率分配(probability distribution),即是以表格、圖表、或公式,將隨機變數所有可能值而成的事件之機一一列出。率, 定義5.2.2 一離散型隨機變數Y之機率分配 則有下列性質: . 0≦ ≦1,對每一可能值。 . =1

【例5.4】 台灣某一大學,企管系大二班。班上成績前五名中,有三名為男同 學,二名為女同學。由於五名同學都十分優秀,老師想以公平之標 準,隨機抽取二人擔任統計學助教。定義隨機變數Y:抽取二人中, 女同學之人數。試以表格、圖表、或公式列出隨機變數Y之機率分 配。

解: 隨機變數Y定義為抽取二人中,女同學之人數。顯而易見的,Y 可能值=0,1,2。欲求Y之機率分配,必先將P (Y=0),P (Y=1), P (Y=2)求出。由於是採隨機抽出,此實驗之所有樣本點,發生 機率皆相同。是故我們試著以古典法,求算事件機率。在解題之 前,先行介紹一組合符號 或 。此值 = = 代表著在個不同的個體中,隨機抽取個,其各種不同可能抽取結 果之總數。故就本題而言,在五名學生中,抽取二名即有 個各 種可能結果。也就是此實驗之樣本空間有 =10個樣本點。

5.2.2 累積分配函數的意義 累積機率F (x),我們又可將之稱為累積分配函數(cumulative distribution function),簡稱 c.d.f.。

5.3 期望值及變異數

5.3.1 離散型隨機變數之期望值 假設考慮投擲一公平骰子36次,進而出現之點數如下:    2,1,2,4,5,6 5,3,1,6,6,3 3,6,4,1,1,5   4,5,3,6,6,3 6,2,1,4,6,1 3,3,5,6,1,6 就以上資料36個數值,我們可計算其樣本平均數為 再將這些資料稍加整理之後,可得如下表所示

經由上表所表示各可能值之次數分配,我們可以行另一方式,求算 該樣本平均數: 計算法則即是為 (樣本平均數)=Σ〔點數(可能值)×相對次數〕

【例5.6】 此隨機變數Y之機率分配為: 考慮投擲三枚公平硬幣,定義隨機變數:三枚公平硬幣正面朝上之 個數。試求隨機變數之期望值。 解: 根據期望值定義 E[y]=

5.3.2 離散型隨機變數之變異數

5.3.3 期望值及變異數之基本定理

【例5.10】 再以例5.6為例,並利用定理5.5,求出隨機變數之變異數。

5.4 二項分配及超幾何分配 在接下來幾小節中,將介紹幾個特殊且常見的機率分配。其中有: 二項分配 (binomial distribution) 超幾何分配(hypergeometric distribution) 幾何分配 (geometric distribution) 負二項分配(negative binomial distribution) 卜瓦松分配(Poisson distribution) 隨機變數的機率分配本是透過此隨機變數所定義的函數關係,由原 實驗樣本空間轉換而來。所以讀者學習這些機率分配時,若能清楚 各原實驗之前提條件,並了解該隨機變數所定義的函數關係,如此 必能收事半功倍之效。

5.4.1 二項分配 考慮一隨機實驗,其可能發生的結果只有單純兩種:其一為“成 功”(S),另外一個便是“失敗”(F)。假設發生結果為“成功”時,令隨機 變數Y=1,而若發生結果為“失敗”時,則令Y=0。換句話說,隨 機變數Y把“成功”對應到實數值1,把“失敗”對應到實數值0。則此隨 機變數Y之機率分配為: P (Y=y)= ,=0,1 其中p為結果發生“成功”的機率,,若符合以上條件,則此隨機實驗 過程稱為伯努利試驗(Bernoulli trial),此隨機變數Y稱為伯努利隨 機變數(Bernoulli random variable),上述機率分配稱為伯努利分配 (Bernoulli distribution)。

對於上述二項實驗之定義,下有幾點略加說明: 1. 所謂個相同試驗,當然指的是“伯努利試驗”。 2. 可能發生結果分類為“成功”、“失敗”,這樣的分類方式,並不 意謂好或壞的價值判斷。其目的只是單純的將結果區分為兩類: 例如檢驗燈炮時,其結果不是良好,就是損壞。投擲一硬幣, 其可能發生結果亦只有正面、反面之分。像這樣的例子都屬於 此限制條件之範疇。 3. 所謂每一試驗彼此互為獨立,意即為每次試驗發生的結果,都不影響其他試驗可能發生的結果。 4. 當=1時,二項實驗即為伯努利試驗,換句話說,伯努利試驗其實為二項實驗之一特例。 簡而言之,若某一實驗符合上述定義之四項特性,即可將該實 驗歸類為二項實驗。

5.4.2 超幾何分配

【例5.16】 在一水塘池中,計有20隻魚,其中有15隻金魚,5隻吳郭魚。今從池 中抽取2隻魚,並定義隨機變數Y表示抽中吳郭魚隻數。試求出: (a) 隨機變數之機率分配 (b) 期望值E [Y],變異數V (Y)

解: (a) 隨機變數Y表示抽中吳郭魚隻數。且一次抽取2隻,如此即可 視為採不放回,故Y必為超幾何隨機變數。根據 定義 5.4.6 N=20,r=5,n=2 P (Y=y)= ,  y=0,1,2

5.4.3 二項分配與超幾何分配的關係 實務上很多抽樣檢驗,都是以一次抽取,也就是抽取不放回方式來 進行。理論上我們應以超幾何分配來求算機率,不過在 例5.13中我 們曾經提及,當母體所含個數與抽取樣本個數相差很大時,此時雖 採不放回方式,不過試驗間還是逼近“獨立”,故依舊以二項分配來 估算,為什麼呢?玆以下例說明:

【例5.18】 科學園區某一工廠,元月份共出產產品1000件,可惜此批產品中有 100件為不良品。令隨機變數Y表示抽取5件中,不良品個數。則分別 以(a)超幾何分配(b)二項分配,求算機率並比較差異! 解: (a) 採超幾何分配求算,N=1000,r=100,n=5 P (Y=y)= ,   y=0,1,2,3,4,5

由上可知,當N,n差距很大時,分別用二項分配及超幾何分配求算 的機率值非常接近,可是求算過程中,經由超幾何分配可比起二項 分配計算繁雜的多。所以當母體所含物體個數與抽取樣本個數差距 很大時,以二項分配估算 b(n;p=n/N)顯得容易的多,且又逼近 超幾何分配求算值。

5.5 幾何分配及負二項分配 5.5.1 幾何分配 考慮一隨機實驗,其包含著連串的伯努利試驗:每一次試驗依 舊只有“成功”(S )、“失敗”()兩種可能,各試驗彼此獨立,“成功” 的機率固定為。跟二項分配的實驗前提限制,幾乎相同,唯一 不同的是,此時我們定義一新的隨機變數Y為直到第一次“成 功”(S )出現,所已執行試驗之總次數。由於此定義方式,使得不 再像二項實驗中,確切包含著個伯努利試驗。相對的,在此實 驗中可能包含著1個、2個,甚至於無限個伯努利試驗。我們稱 此隨機變數Y為幾何隨機變數(geometric random variable)。

考慮與幾何分配相同的實驗前提限制,而與幾何分配所不同的是, 此時我們再改令一隨機變數X表示直到第次“成功”出現,所已執 行的試驗總次數。由於此定義方式,此實驗至少包含個,甚至也 包含了無限個伯努利試驗。此隨機變數跟幾何隨機變數相仿,都 含有無限但可計數個可能值。此時我們稱此隨機變數X為負二項 隨機變數(negative binomial random variable)。而當負二項隨機變數 之“成功”次數=1時,其實就是幾何隨機變數之定義。

負二項隨機變數X,其可能值x=,r+1,r+2,……。若令 X=x,意指第r次“成功”(S )出現時,總試驗次數已達次,換句話 說,第次試驗,也就是最後一次試驗,必發生“成功”(S ),而前面 的x-1次試驗中,必發生了x-1次“成功”(S ),-次“失敗”(F )。 若考慮其一排列方式: 因“成功”(S )的機率為,且各試驗之間彼此獨立。如上述之排列方 式,其發生的機率為 其中

5.6卜瓦松分配 5.6.1 卜瓦松分配的意義 考慮一隨機實驗,此實驗特色為,在某一特定區間內(一段時 間、一段距離、一部分面積、體積),觀察某特定“稀少”事件 發生的次數。所謂“稀少”,意指該事件發生的機率低,故發生 的次數少,不過理論上而言,此稀少事件發生的次數,也可能 至無限次,只不過其可能性非常的低。若令隨機變數Y表示在 此實驗中,此特定事件發生的次數。則此觀察過程,我們稱之 為卜瓦松實驗(Poisson experiment),隨機變數Y稱為卜瓦松 隨機變數(Poisson random variable),其可能值Y=0,1,2,…..為 無限但可數。

卜瓦松實驗有下列特性: 1. 在一單位區間,如單位時間或單位面積內,此特定稀少事件發生 平均次數(λ),通常為已知且固定。 2. 此事件在單位區間內發生平均次數(λ),通常與區間大小(t) 成正比。 3. 不管此事件在該區間中何點發生,發生的機率必皆相同。 4. 假設此實驗可分割成極小的區間,每一區間至多可發生一件此特 定事件(成功),或是無該事件發生(失敗)。換句話說,每一小區間, 可能發生結果只有兩類。 5. 事件在各小區間中發生與否,相互獨立。

【例5.23】 台北市每天平均一小時內,發生一次搶案。若令Y表示一小時內, 發生搶案次數。假設Y符合卜瓦松分配,試問: (a) 一小時內,完全無搶案發生的機率。 (b) 一小時內,發生搶案超過兩次的機率。 (c) 兩小時內,恰巧只發生一次搶案的機率。 

解: (a) 由題目可知,Y符合卜瓦松分配,λ=1 一小時內,完全無搶案發生,即 Y=0 P (Y=0)= (b) 一小時內,發生搶案超過兩次,即 Y>2 P (Y>2)=1-P (Y=0)-P (Y=1)-P (Y=2)

(c) 令卜瓦松隨機變數X表示兩小時內發生搶案的次數。根據特性 第二點,其平均搶案發生次數λ=2。 兩小時內,恰巧只發生一次搶案,即 X=1 P (X=1)=

5.6.2 卜瓦松分配與二項分配的關係 先前我們曾經提及卜瓦松實驗的特性,由這些特性可知,卜瓦松實 驗可經由某特定方式分割成個小區間(很大,甚至為無限),使得分割 後實驗,一一符合上述卜瓦松實驗特性。而經由分割後的卜瓦松實 驗P( ),由特性3,4,5點可看出,類似於二項實驗b(n;p=λ/n)。 換句話說,卜瓦松分配相當類似二項分配,並且可用來估計,很大; 相對很小的二項分配。通常二項實驗很大,很小時,因其計算過程 可能相當繁雜,所以改用卜瓦松分配P(λ=np)來估計機率值,則 顯得較為容易。理論上,由數理可證明:當時,二項分配趨近於卜 瓦松分配

事實上,當二項分配n很大,p很小時,當 , ,且 np≦7時,用卜瓦松分配P(λ=np)來估計二項分配,較為準確, 結果相當逼近用二項分配求算值。

5.7 總結