統計學: 應用與進階 第6 章: 常用的連續隨機變數.

Slides:



Advertisements
Similar presentations
發現生命的力量 — 陳樹菊阿嬤,來了 … 《不凡的慷慨》書籍賞析. 你所知道的陳樹菊  2010 《富比世》雜誌亞洲慈善英雄! 2010 美國《時代》雜誌最具影響力百大人物! 《讀者文摘》亞洲英雄!  導演李安﹕「她的生活稱不上富裕,仍然陸續捐贈 了將近一千萬台幣幫助數個不同的單位 … 」
Advertisements

工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
1 第六章 機率分配. 2 隨機變數 機率分配函數 常用的機率分配 3 隨機變數 (random variable) 將隨機實驗中每一個樣本點對應至實數值 之 “ 函數 ” 隨機變數 f.
單元九:單因子變異數分析.
Time Objectives By the end of this chapter, you will be able to
第七章 連續機率分配.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
第二章:随机变量 上节课内容 本节课内容 概率理论 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 概率公理及推论
蘭亭集序 第一段 永和九年,歲在癸丑,暮春之初,會于會稽山陰之蘭亭,脩禊事也。群賢畢至,少長咸集。此地有崇山峻嶺,茂林脩竹,又有清流激湍,映帶左右。引以為流觴曲水,列坐其次。雖無絲竹管絃之盛,一觴一詠,亦足以暢敘幽情。
養生主 莊子.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
Excel Functions and Probability Distribution
常用的機率分配 6.1 二項分配 6.2 超幾何分配 6.3 幾何分配 6.4 Poisson分配 6.5 負二項分配 6.6 均勻分配
第 6 章 連續機率分配.
Chapter 4 Class work & Homework By: Prof. Y. Peter Chiu 2 / 1 / 2011
第六章--常用的機率分配 間斷機率分配 6.1 二項分配 6.2 超幾何分配 6.3 幾何分配(可跳過) 6.4 Poisson分配
第三章 隨機變數.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
第3.1节 随机变量及其分布(2) 连续型 一、随机变量的定义 二、分布函数的性质 三、离散型随机变量 四、连续型随机变量
假設檢定.
Linear Programming: Introduction and Duality
Population proportion and sample proportion
6.2 常態機率分配 常態機率分配(normal probability distribution)可以說是最重要的連續機率分配。
模式识别 Pattern Recognition
本章大綱 9.1 Sequence數列 9.2 Infinite Series無窮級數
Continuous Probability Distributions
Properties of Continuous probability distributions
Continuous Probability Distributions
Sampling Theory and Some Important Sampling Distributions
風險值 Value at Risk (VaR) 區國強.
Time Objectives By the end of this chapter, you will be able to
第十四單元 弧長與旋轉體的表面積.
Interval Estimation區間估計
單一分配 Uniform distribution
第一章 直角坐標系 1-1 數系的發展.
積分的商業應用 不定積分的商業應用 1. 邊際成本函數  2. 邊際收益函數  3. 邊際利潤函數  4. 若已知 
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國立台灣大學流行病學與預防醫學研究所 國家衛生研究院生物統計與生物資訊組
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第一章.
Mechanics Exercise Class Ⅰ
The Normal Distribution and Other Continuous Distributions
第六章 連續型隨機變數及其常用的機率分配.
Definition of Trace Function
微積分網路教學課程 應用統計學系 周 章.
7-2 抽樣分配(sampling distribution)
The Bernoulli Distribution
Some Important Probability Distributions
Ogive plot example 說明者:吳東陽 2003/10/10.
五.連續變數及常態分佈 (Continuous Random Variables and Normal Distribution)
高三家長升學講座 「個人申請」審查資料準備方向
4- 第四章.
1-1 隨機的意義– P.1.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
統計學: 應用與進階 第3 章: 隨機變數.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
隨機變數與機率分配 間斷機率分配 聯合機率分配 期望值與變異數 共變異數與相關係數
第三章 指數與對數 3-1 指數 3-2 指數函數及其圖形 3-3 對數 3-4 對數函數及其圖形 3-5 常用對數 回總目次.
第七章 计量资料的统计分析.
4-1 變數與函數 第4章 一次函數及其圖形.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Gaussian Process Ruohua Shi Meeting
第十七講 重積分 應用統計資訊學系 網路教學課程 第十七講.
Presentation transcript:

統計學: 應用與進階 第6 章: 常用的連續隨機變數

均勻隨機變數 指數隨機變數 指數隨機變數與Poisson 隨機變數之間的關係 常態隨機變數

均勻隨機變數 如果隨機變數X 的實現值在區間[l , h] 中的任何次區間(subinterval) 的機率值為該次區間佔[l , h] 區間之比率, 則稱隨機變數X 為在[l , h]間的均勻隨機變數(uniform random variables),或稱隨機變數X 服從均勻分配(uniform distribution), 我們以X ∼ U[l , h] 表示之

均勻隨機變數 機率密度函數

均勻隨機變數重要性質X ∼ U[l , h] X 的CDF: 若X ∼ U[0, 1], 稱之為標準均勻隨機變數(standard uniform random variables), 其CDF為

均勻隨機變數重要性質X ∼ U[l , h] X 的期望值: X 的變異數:

均勻隨機變數重要性質X ∼ U[l , h] X 的中位數: x0.5 = E(X) 因此, 我們可以解出 亦即均勻隨機變數的中位數等於期望值

均勻隨機變數的(a) pdf 與(b) CDF

均勻隨機變數線性變換不變性 若X ∼ U[0, 1] 且Y = aX + b, a > 0 則 Y ∼ U[b, a + b]

均勻隨機變數線性變換不變性 若X ∼ U[0, 1] 且W = (h − l )X + l 則 W ∼ U[l , h] 任何一個一般化的均勻隨機變數W ∼ U[l , h],我們都可以將W 寫成標準均勻隨機變數 X ∼ U[0, 1] 的線性函數: W = (h − l )X + l

均勻隨機變數線性變換不變性 若W ∼ U[l , h] 且Z = aW + b, a > 0 則 Z ∼ U[al + b, ah + b]

均勻隨機變數的應用 網購賣家的底價為$10,000 競標對手的出價為X, 簡單假設 X ∼ U[10000, 15000] 試問 如果你出價$12,000, 試問你網購成功的機率? 如果你出價$14,000, 試問你網購成功的機率? 如果你想要極大化你的網購成功機率, 請問你該 出價多少?

指數隨機變數 在間斷隨機分配中, 我們介紹過Poisson 分配,衡量的是一段期間內, 事件發生次數的機率, 譬如說, 一小時內出現的公車班次 相對應的, 我們也可以衡量兩班公車之間的等待時間, 而刻劃等待時間的機率分配即為指數分配

指數隨機變數 我們稱隨機變數X 為一指數隨機變數(exponential random variables), 如果其機率密度函數為 supp(X) = {x|x ∈ [0,∞)}, 並以X ∼ exp(θ)表示之

指數隨機變數的pdf ( = 0.2 )

指數隨機變數的CDF x 分鐘內公車會到達 至少要等x 分鐘公車才會到達

標準指數隨機變數 若W ∼exp(1), 則

指數隨機變數的不變性 (invariance under positive scaling) 若W ∼ exp(1) 且 X = θW, θ > 0, 則 X ∼ exp(θ) E(X)=E(θW)= θ E(1)= θ V(X)=V(θW)= θ2 E(1)= θ2

θ的意義 指數隨機變數除了用來刻劃「等待時間」, 也可用來刻劃「存續時間」(length of life or duration) 因此, 參數 θ = E(X) 除了可以詮釋為預期等待時間, 也可以看做是預期存續時間, 或稱預期壽命

指數隨機變數的無憶性 若X ∼ exp(θ), P(X > m + n|X > m) = P(X > n) 也就是說, 給定你已經等了m 分鐘, 然後你得至少再等n 分鐘的條件機率P(X > m + n|X > m) 等同於阿慶至少再等n分鐘的非條件機率P(X > n)

指數隨機變數vs. Poisson 隨機變數 指數分配與Poisson 分配猶如一體的兩面, 令T 代表從零時(原點) 開始直到第一次事件發生的等待時間。舉例來說, T 代表今天第一班公車到來前的等待時間

指數隨機變數vs. Poisson 隨機變數 等待時間T 的機率分配為: F(t) = P(T ≤ t) = 1 − P(T > t)

指數隨機變數vs. Poisson 隨機變數 假設根據過去經驗, 單位時間[0, 1] 內, 平均有 λ 輛的公車會抵達, (亦即[0, t] 期間有t 輛的公車會抵達) 令X 代表在[0, t] 的區間內公車的抵達班次,根據Poisson 分配, 其機率為

指數隨機變數vs. Poisson 隨機變數 因此, 在[0, t] 的區間內沒有公車抵達(X = 0)的機率就是 P(X = 0) = P(在[0, t] 的區間內沒有公車抵達) = 從而,F(t) = 1 − P(在[0, t] 的區間內沒有公車抵達) = 1 −

Exponential Distribution Example Example: Customers arrive at the service counter at the rate of 15 per hour. What is the probability that the arrival time between consecutive customers is less than three minutes? The mean number of arrivals per hour is 15, so λ = 1/θ=60/4 =15 Three minutes is 0.05 hours P(arrival time < .05) = 1 – e-λX = 1 – e-(15)(0.05) = 0.5276 So there is a 52.76% probability that the arrival time between successive customers is less than three minutes

Example Suppose the earthquakes occur in the eastern part of Taiwan un accordance with the assumptions of the Poisson probability distribution at a rate of 2 per day. Find the probability that at least 3 earthquakes occur during the next 2 days. Find the probability distribution of the time, starting from now , until the next earthquake.

Example Ans: λ = 2次/天 表示在未來兩天發生地震的次數

Example Ans: 令T表從現在開始到下次地震發生所需時間

常態分配(normal distribution) 又稱Gaussian分配(Gaussian distribution)。這是因為德國數學家Johann Carl Friedrich Gauss (1777–1855)在常態分配的發展歷史中, 佔有決定性的地位 Gauss 導出了常態分配作為量測誤差的機率分配。到了十九世紀中葉, 常態分配已被視為自然界各種觀察所必見的分配, 在大多數的情況下,觀測值資料的次數分配(empirical distribution)多近似於常態分配, 是故此分配以「常態」命名之

Johann Carl Friedrich Gauss (1777–1855)

常態隨機變數 X 為期望值E(X) = μ, 變異數Var (X) = 的常態隨機變數, 若其機率密度函數為 supp(X) = {x| −∞ < x < ∞}, = 3.14159為圓周率, 一般以X ∼ N(μ, ) 表示之 參數μ 既是X 的期望值, 也是中位數與眾數

常態分配: 實線為N(0, 1); 虛線為N(0, 9)

有關常態分配的幾個重要事實 常態分配機率密度函數為鐘型(bell shaped curve) 常態分配機率密度函數的最大值為Φ(μ) (亦即期望值等於眾數) 常態分配機率密度函數對稱於期望值, 期望值左右兩側密度函數下的面積分別為1/2 (亦即期望值等於中位數) 常態分配機率密度函數尾端部分趨近於±∞ μ 增加(減少) 使整個機率密度函數右移(左移)

標準常態隨機變數 將常態隨機變數X 標準化 則稱Z 為標準常態隨機變數(standard normal random variables), 具有機率密度函數為

標準常態隨機變數 我們以Z ∼ N(0, 1) 表示之

我們通常以希臘字母 與 分別代表標準常態隨機變數的機率密度函數與分配函數:

有關標準常態分配的幾個重要數字 若X ∼ N(0, 1), 則 P(X ∈ ± 1 ) = 0.683 P(X ∈ ± 2) = 0.955

標準常態隨機變數的機率值之計算 對於標準常態隨機變數Z ∼ N(0, 1), 給定a > 0, 我們可以透過查表計算Φ(a) = P(Z ≤ a) 的機率值 以下常態分配的對稱性質可以幫助我們查表: P(Z ≤ 0) = P(Z ≥ 0) = 0.5 P(Z ≤ −a) = P(Z ≥ a) P(−a ≤ Z ≤ 0) = P(0 ≤ Z ≤ a)

Normal Distribution Probability Probability is area under curve! f ( x ) x c d

The Standard Normal Table: P(0 < z < 1.96) Standardized Normal Probability Table (Portion) .06 Z .04 .05 Z m = 0 s = 1 1.96 1.8 .4671 .4678 .4686 .4750 1.9 .4750 .4738 .4744 2.0 .4793 .4798 .4803 2.1 .4838 .4842 .4846 Shaded area exaggerated Probabilities

The Standard Normal Table:P(–1.26  z  1.26) Standardized Normal Distribution s = 1 P(–1.26 ≤ z ≤ 1.26) = .3962 + .3962 = .7924 .3962 .3962 –1.26 1.26 Z m = 0 Shaded area exaggerated

The Standard Normal Table:P(z > 1.26) Standardized Normal Distribution s = 1 P(z > 1.26) = .5000 – .3962 = .1038 .5000 .3962 1.26 Z m = 0

The Standard Normal Table:P(–2.78  z  –2.00) Standardized Normal Distribution s = 1 P(–2.78 ≤ z ≤ –2.00) = .4973 – .4772 = .0201 .4973 .4772 –2.78 –2.00 Z m = 0 Shaded area exaggerated

The Standard Normal Table:P(z > –2.13) Standardized Normal Distribution s = 1 P(z > –2.13) = .4834 + .5000 = .9834 .4834 .5000 –2.13 Z m = 0 Shaded area exaggerated

Standardize the Normal Distribution One table! m = 0 s = 1 Z Standardized Normal Distribution s m X

Non-standard Normal μ = 5, σ = 10: P(5 < X< 6.2) Normal Distribution X m = 5 s = 10 6.2 Z m = 0 s = 1 .12 Standardized Normal Distribution Shaded area exaggerated .0478

Non-standard Normal μ = 5, σ = 10: P(3.8  X  5) Shaded area exaggerated Normal Distribution X m = 5 s = 10 3.8 Z m = 0 s = 1 -.12 Standardized Normal Distribution .0478

Non-standard Normal μ = 5, σ = 10: P(2.9  X  7.1) Shaded area exaggerated 5 s = 10 2.9 7.1 X Normal Distribution s = 1 -.21 Z .21 Standardized Normal Distribution .1664 .0832

Non-standard Normal μ = 5, σ = 10: P(X  8) Shaded area exaggerated X m = 5 s = 10 8 Normal Distribution Z = 0 .30 Standardized Normal Distribution m s = 1 .5000 .3821 .1179

Non-standard Normal μ = 5, σ = 10: P(7.1  X  8) Shaded area exaggerated m = 5 s = 10 8 7.1 X Normal Distribution m = 0 s = 1 .30 Z .21 Standardized Normal Distribution .1179 .0347 .0832

例子: 給定X ∼ N(5, 64), 試求機率值P(X ≥ 17) 若 則 因此,

Normal Distribution Thinking Challenge You work in Quality Control for GE. Light bulb life has a normal distribution with = 2000 hours and = 200 hours. What’s the probability that a bulb will last A. between 2000 and 2400 hours? B. less than 1470 hours? Allow students about 10-15 minutes to solve this.

X Z Solution* P(2000  X  2400) .4772 m = 2000 s = 200 2400 m = 0 s Normal Distribution X m = 2000 s = 200 2400 Standardized Normal Distribution Z m = 0 s = 1 2.0 .4772

X Z Solution* P(X  1470) .0040 m = 2000 s = 200 1470 m = 0 s = 1 Normal Distribution Z m = 0 s = 1 -2.65 Standardized Normal Distribution .5000 .0040 .4960

Finding Z Values for Known Probabilities What is Z, given P(Z) = .1217? Shaded area exaggerated Z m = 0 s = 1 ? .1217 Standardized Normal Probability Table (Portion) Z .00 0.2 0.0 .0000 .0040 .0080 0.1 .0398 .0438 .0478 .0793 .0832 .0871 .1179 .1255 .01 0.3 .1217 .31

有關常態分配的幾個重要事實 增加(減少), 使分配更分散(集中), 機率密度函數越平坦(陡峭) 若X ∼ N(μ, ), 則 P(X ∈ μ ± σ ) = 0.683 P(X ∈ μ ± 2 σ) = 0.955 P(X ∈ μ ± 3 σ) = 0.997

Empirical Rules What can we say about the distribution of values around the mean? For any normal distribution: f(X) μ ± 1σ encloses about 68.26% of X’s σ σ X μ-1σ μ μ+1σ 68.26%

The Empirical Rule μ ± 2σ covers about 95% of X’s 3σ 3σ 2σ 2σ μ x μ x 95.44% 99.73%

常態隨機變數的重要性質 若X ∼ N(μ, ), 則 這個性質告訴我們常態隨機變數不會隨線性轉換而改變其分配性質。亦即, 常態隨機變數之線性轉換不變性

常態隨機變數的重要性質 若 這個性質告訴我們將獨立的常態隨機變數加總,仍為常態隨機變數

若 這是一個常用且重要的性質, i.i.d. 常態隨機變數的平均數亦為常態隨機變數

更一般化的性質 若 為獨立的常態隨機變數, 且 則 或是

重要性質 若X, Y 均為常態隨機變數, 則X, Y 為獨立的充分且必要條件為 Cov(X, Y) = 0. 一般而言, X, Y 獨立隱含X, Y 零相關, 反之卻不然。然而, 若X, Y 均為常態隨機變數, 則X, Y 零相關隱含X, Y 獨立