Download presentation
Presentation is loading. Please wait.
1
統計學: 應用與進階 第6 章: 常用的連續隨機變數
2
均勻隨機變數 指數隨機變數 指數隨機變數與Poisson 隨機變數之間的關係 常態隨機變數
3
均勻隨機變數 如果隨機變數X 的實現值在區間[l , h] 中的任何次區間(subinterval) 的機率值為該次區間佔[l , h] 區間之比率, 則稱隨機變數X 為在[l , h]間的均勻隨機變數(uniform random variables),或稱隨機變數X 服從均勻分配(uniform distribution), 我們以X ∼ U[l , h] 表示之
4
均勻隨機變數 機率密度函數
5
均勻隨機變數重要性質X ∼ U[l , h] X 的CDF:
若X ∼ U[0, 1], 稱之為標準均勻隨機變數(standard uniform random variables), 其CDF為
6
均勻隨機變數重要性質X ∼ U[l , h] X 的期望值: X 的變異數:
7
均勻隨機變數重要性質X ∼ U[l , h] X 的中位數: x0.5 = E(X) 因此, 我們可以解出
亦即均勻隨機變數的中位數等於期望值
8
均勻隨機變數的(a) pdf 與(b) CDF
9
均勻隨機變數線性變換不變性 若X ∼ U[0, 1] 且Y = aX + b, a > 0 則 Y ∼ U[b, a + b]
10
均勻隨機變數線性變換不變性 若X ∼ U[0, 1] 且W = (h − l )X + l 則 W ∼ U[l , h]
任何一個一般化的均勻隨機變數W ∼ U[l , h],我們都可以將W 寫成標準均勻隨機變數 X ∼ U[0, 1] 的線性函數: W = (h − l )X + l
11
均勻隨機變數線性變換不變性 若W ∼ U[l , h] 且Z = aW + b, a > 0 則
Z ∼ U[al + b, ah + b]
12
均勻隨機變數的應用 網購賣家的底價為$10,000 競標對手的出價為X, 簡單假設 X ∼ U[10000, 15000] 試問
如果你出價$12,000, 試問你網購成功的機率? 如果你出價$14,000, 試問你網購成功的機率? 如果你想要極大化你的網購成功機率, 請問你該 出價多少?
13
指數隨機變數 在間斷隨機分配中, 我們介紹過Poisson 分配,衡量的是一段期間內, 事件發生次數的機率, 譬如說, 一小時內出現的公車班次 相對應的, 我們也可以衡量兩班公車之間的等待時間, 而刻劃等待時間的機率分配即為指數分配
14
指數隨機變數 我們稱隨機變數X 為一指數隨機變數(exponential random variables), 如果其機率密度函數為
supp(X) = {x|x ∈ [0,∞)}, 並以X ∼ exp(θ)表示之
15
指數隨機變數的pdf ( = 0.2 )
16
指數隨機變數的CDF x 分鐘內公車會到達 至少要等x 分鐘公車才會到達
17
標準指數隨機變數 若W ∼exp(1), 則
18
指數隨機變數的不變性 (invariance under positive scaling)
若W ∼ exp(1) 且 X = θW, θ > 0, 則 X ∼ exp(θ) E(X)=E(θW)= θ E(1)= θ V(X)=V(θW)= θ2 E(1)= θ2
19
θ的意義 指數隨機變數除了用來刻劃「等待時間」, 也可用來刻劃「存續時間」(length of life or duration)
因此, 參數 θ = E(X) 除了可以詮釋為預期等待時間, 也可以看做是預期存續時間, 或稱預期壽命
20
指數隨機變數的無憶性 若X ∼ exp(θ), P(X > m + n|X > m) = P(X > n)
也就是說, 給定你已經等了m 分鐘, 然後你得至少再等n 分鐘的條件機率P(X > m + n|X > m) 等同於阿慶至少再等n分鐘的非條件機率P(X > n)
21
指數隨機變數vs. Poisson 隨機變數 指數分配與Poisson 分配猶如一體的兩面,
令T 代表從零時(原點) 開始直到第一次事件發生的等待時間。舉例來說, T 代表今天第一班公車到來前的等待時間
22
指數隨機變數vs. Poisson 隨機變數 等待時間T 的機率分配為: F(t) = P(T ≤ t) = 1 − P(T > t)
23
指數隨機變數vs. Poisson 隨機變數 假設根據過去經驗, 單位時間[0, 1] 內, 平均有 λ 輛的公車會抵達, (亦即[0, t] 期間有t 輛的公車會抵達) 令X 代表在[0, t] 的區間內公車的抵達班次,根據Poisson 分配, 其機率為
24
指數隨機變數vs. Poisson 隨機變數 因此, 在[0, t] 的區間內沒有公車抵達(X = 0)的機率就是
P(X = 0) = P(在[0, t] 的區間內沒有公車抵達) = 從而,F(t) = 1 − P(在[0, t] 的區間內沒有公車抵達) = 1 −
25
Exponential Distribution Example
Example: Customers arrive at the service counter at the rate of 15 per hour. What is the probability that the arrival time between consecutive customers is less than three minutes? The mean number of arrivals per hour is 15, so λ = 1/θ=60/4 =15 Three minutes is 0.05 hours P(arrival time < .05) = 1 – e-λX = 1 – e-(15)(0.05) = So there is a 52.76% probability that the arrival time between successive customers is less than three minutes
26
Example Suppose the earthquakes occur in the eastern part of Taiwan un accordance with the assumptions of the Poisson probability distribution at a rate of 2 per day. Find the probability that at least 3 earthquakes occur during the next 2 days. Find the probability distribution of the time, starting from now , until the next earthquake.
27
Example Ans: λ = 2次/天 表示在未來兩天發生地震的次數
28
Example Ans: 令T表從現在開始到下次地震發生所需時間
29
常態分配(normal distribution) 又稱Gaussian分配(Gaussian distribution)。這是因為德國數學家Johann Carl Friedrich Gauss (1777–1855)在常態分配的發展歷史中, 佔有決定性的地位 Gauss 導出了常態分配作為量測誤差的機率分配。到了十九世紀中葉, 常態分配已被視為自然界各種觀察所必見的分配, 在大多數的情況下,觀測值資料的次數分配(empirical distribution)多近似於常態分配, 是故此分配以「常態」命名之
30
Johann Carl Friedrich Gauss (1777–1855)
31
常態隨機變數 X 為期望值E(X) = μ, 變異數Var (X) = 的常態隨機變數, 若其機率密度函數為
supp(X) = {x| −∞ < x < ∞}, = 為圓周率, 一般以X ∼ N(μ, ) 表示之 參數μ 既是X 的期望值, 也是中位數與眾數
32
常態分配: 實線為N(0, 1); 虛線為N(0, 9)
33
有關常態分配的幾個重要事實 常態分配機率密度函數為鐘型(bell shaped curve)
常態分配機率密度函數的最大值為Φ(μ) (亦即期望值等於眾數) 常態分配機率密度函數對稱於期望值, 期望值左右兩側密度函數下的面積分別為1/2 (亦即期望值等於中位數) 常態分配機率密度函數尾端部分趨近於±∞ μ 增加(減少) 使整個機率密度函數右移(左移)
34
標準常態隨機變數 將常態隨機變數X 標準化 則稱Z 為標準常態隨機變數(standard normal random variables), 具有機率密度函數為
35
標準常態隨機變數 我們以Z ∼ N(0, 1) 表示之
36
我們通常以希臘字母 與 分別代表標準常態隨機變數的機率密度函數與分配函數:
37
有關標準常態分配的幾個重要數字 若X ∼ N(0, 1), 則 P(X ∈ ± 1 ) = 0.683 P(X ∈ ± 2) = 0.955
38
標準常態隨機變數的機率值之計算 對於標準常態隨機變數Z ∼ N(0, 1), 給定a > 0, 我們可以透過查表計算Φ(a) = P(Z ≤ a) 的機率值 以下常態分配的對稱性質可以幫助我們查表: P(Z ≤ 0) = P(Z ≥ 0) = 0.5 P(Z ≤ −a) = P(Z ≥ a) P(−a ≤ Z ≤ 0) = P(0 ≤ Z ≤ a)
39
Normal Distribution Probability
Probability is area under curve! f ( x ) x c d
40
The Standard Normal Table: P(0 < z < 1.96)
Standardized Normal Probability Table (Portion) .06 Z .04 .05 Z m = 0 s = 1 1.96 1.8 .4671 .4678 .4686 .4750 1.9 .4750 .4738 .4744 2.0 .4793 .4798 .4803 2.1 .4838 .4842 .4846 Shaded area exaggerated Probabilities
41
The Standard Normal Table:P(–1.26 z 1.26)
Standardized Normal Distribution s = 1 P(–1.26 ≤ z ≤ 1.26) = = .7924 .3962 .3962 –1.26 1.26 Z m = 0 Shaded area exaggerated
42
The Standard Normal Table:P(z > 1.26)
Standardized Normal Distribution s = 1 P(z > 1.26) = – .3962 = .1038 .5000 .3962 1.26 Z m = 0
43
The Standard Normal Table:P(–2.78 z –2.00)
Standardized Normal Distribution s = 1 P(–2.78 ≤ z ≤ –2.00) = – .4772 = .0201 .4973 .4772 –2.78 –2.00 Z m = 0 Shaded area exaggerated
44
The Standard Normal Table:P(z > –2.13)
Standardized Normal Distribution s = 1 P(z > –2.13) = = .9834 .4834 .5000 –2.13 Z m = 0 Shaded area exaggerated
45
Standardize the Normal Distribution
One table! m = 0 s = 1 Z Standardized Normal Distribution s m X
46
Non-standard Normal μ = 5, σ = 10: P(5 < X< 6.2)
Normal Distribution X m = 5 s = 10 6.2 Z m = 0 s = 1 .12 Standardized Normal Distribution Shaded area exaggerated .0478
47
Non-standard Normal μ = 5, σ = 10: P(3.8 X 5)
Shaded area exaggerated Normal Distribution X m = 5 s = 10 3.8 Z m = 0 s = 1 -.12 Standardized Normal Distribution .0478
48
Non-standard Normal μ = 5, σ = 10: P(2.9 X 7.1)
Shaded area exaggerated 5 s = 10 2.9 7.1 X Normal Distribution s = 1 -.21 Z .21 Standardized Normal Distribution .1664 .0832
49
Non-standard Normal μ = 5, σ = 10: P(X 8)
Shaded area exaggerated X m = 5 s = 10 8 Normal Distribution Z = 0 .30 Standardized Normal Distribution m s = 1 .5000 .3821 .1179
50
Non-standard Normal μ = 5, σ = 10: P(7.1 X 8)
Shaded area exaggerated m = 5 s = 10 8 7.1 X Normal Distribution m = 0 s = 1 .30 Z .21 Standardized Normal Distribution .1179 .0347 .0832
51
例子: 給定X ∼ N(5, 64), 試求機率值P(X ≥ 17)
若 則 因此,
52
Normal Distribution Thinking Challenge
You work in Quality Control for GE. Light bulb life has a normal distribution with = 2000 hours and = 200 hours. What’s the probability that a bulb will last A. between 2000 and hours? B. less than 1470 hours? Allow students about minutes to solve this.
53
X Z Solution* P(2000 X 2400) .4772 m = 2000 s = 200 2400 m = 0 s
Normal Distribution X m = 2000 s = 200 2400 Standardized Normal Distribution Z m = 0 s = 1 2.0 .4772
54
X Z Solution* P(X 1470) .0040 m = 2000 s = 200 1470 m = 0 s = 1
Normal Distribution Z m = 0 s = 1 -2.65 Standardized Normal Distribution .5000 .0040 .4960
55
Finding Z Values for Known Probabilities
What is Z, given P(Z) = .1217? Shaded area exaggerated Z m = 0 s = 1 ? .1217 Standardized Normal Probability Table (Portion) Z .00 0.2 0.0 .0000 .0040 .0080 0.1 .0398 .0438 .0478 .0793 .0832 .0871 .1179 .1255 .01 0.3 .1217 .31
56
有關常態分配的幾個重要事實 增加(減少), 使分配更分散(集中), 機率密度函數越平坦(陡峭) 若X ∼ N(μ, ), 則
P(X ∈ μ ± σ ) = 0.683 P(X ∈ μ ± 2 σ) = 0.955 P(X ∈ μ ± 3 σ) = 0.997
57
Empirical Rules What can we say about the distribution of values around the mean? For any normal distribution: f(X) μ ± 1σ encloses about 68.26% of X’s σ σ X μ-1σ μ μ+1σ 68.26%
58
The Empirical Rule μ ± 2σ covers about 95% of X’s
3σ 3σ 2σ 2σ μ x μ x 95.44% 99.73%
59
常態隨機變數的重要性質 若X ∼ N(μ, ), 則 這個性質告訴我們常態隨機變數不會隨線性轉換而改變其分配性質。亦即, 常態隨機變數之線性轉換不變性
60
常態隨機變數的重要性質 若 這個性質告訴我們將獨立的常態隨機變數加總,仍為常態隨機變數
61
若 這是一個常用且重要的性質, i.i.d. 常態隨機變數的平均數亦為常態隨機變數
62
更一般化的性質 若 為獨立的常態隨機變數, 且 則 或是
63
重要性質 若X, Y 均為常態隨機變數, 則X, Y 為獨立的充分且必要條件為 Cov(X, Y) = 0.
一般而言, X, Y 獨立隱含X, Y 零相關, 反之卻不然。然而, 若X, Y 均為常態隨機變數, 則X, Y 零相關隱含X, Y 獨立
Similar presentations