Properties of Continuous probability distributions 觀念 嚴格來說,因為測量的侷限,所有的變數皆為「非連續」discrete。 但當某一個變數的變量的數目很多,每一個變量出現的機率很低時,我們通常把它當作「連續」變數來處理。 例如:收入、所得、學校成績等。 社會統計(上) ©蘇國賢2000
Approximating a continuous distribution 觀念 取100人的樣本並紀錄其完成工作的時間如下: 社會統計(上) ©蘇國賢2000
Approximating a continuous distribution 觀念 以直方圖來表達: 社會統計(上) ©蘇國賢2000
Approximating a continuous distribution 觀念 將樣本擴大至1,000 社會統計(上) ©蘇國賢2000
Approximating a continuous distribution 觀念 將樣本擴大至10,000 社會統計(上) ©蘇國賢2000
Approximating a continuous distribution 觀念 將樣本擴大至100,000,隨著樣本數的增加,每一個變量之間的間隔愈小,曲線愈趨於平滑。 這個曲線可以被視為是根據母體(試驗重複很多次)的相對次數分配所畫出來的直方圖。 社會統計(上) ©蘇國賢2000
Density Function 觀念 若某一連續隨機變數X的機率分配可以用數學函數f(x)及其所對應的平滑的曲線表達,則f(x)為X的機率密度函數(density function)。 社會統計(上) ©蘇國賢2000
Density Function 設X為一連續r.v.,若函數f(x)滿足下列條件: 則稱f(x)為機率密度函數。 定義 設X為一連續r.v.,若函數f(x)滿足下列條件: 則稱f(x)為機率密度函數。 相當於間斷型隨機變數的加總符號Σ 社會統計(上) ©蘇國賢2000
Density Function 任何機率分配所有的“相對次數”的和為? 也就是說,曲線底下的面積和為1 觀念 ©蘇國賢2000 社會統計(上) ©蘇國賢2000
Density Function 界於a與b之間曲線下的面積如何計算? 步驟一,先將a至b的區間切割成n等分: x1 x2 a b 觀念 社會統計(上) ©蘇國賢2000
Density Function 第一塊長方形區域的面積為: f(x2) f(x1) 第二塊長方形區域的面積為: x1 x2 a b 觀念 社會統計(上) ©蘇國賢2000
Density Function 觀念 若將a至b之間的區間做更細的切割,則長方形的面積和將為愈來愈趨近於曲線下的面積。如將上圖的五等分再細分成十等分。 f(x1) x1 x2 a b 社會統計(上) ©蘇國賢2000
Density Function 若再進一步細分成n份,則 f(x1) 當n趨近於無限大時,則 a b 觀念 ©蘇國賢2000 社會統計(上) ©蘇國賢2000
Density Function 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d 定義 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d 社會統計(上) ©蘇國賢2000
Density Function 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b 定義 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b 因為連續函數的變量x有無限個不同的值,任一特定變量a出現的機率等於1/∞ 社會統計(上) ©蘇國賢2000
Expected value 觀念 一非連續隨機變數(discrete r.v.)的變量為x1,x2,…xn,且每個變量的相對應的機率為p1,p2,…pn,則此隨機變數的期望值為: f(x1)=p1 x1 x2 a b 社會統計(上) ©蘇國賢2000
Expected value 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a 觀念 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a b n個區間的範圍分別為: 社會統計(上) ©蘇國賢2000
Expected value p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率… 觀念 p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率… P2=f(x2) P1 p2為函數f曲線介於x1與x2之下的面積 x1 x2 x0 b p1為函數f曲線介於xo與x1之下的面積 社會統計(上) ©蘇國賢2000
Expected value 觀念 P2=f(x2) P1 x1 x2 x0 b 社會統計(上) ©蘇國賢2000
Expected value 當n趨於無限大,x趨近於0時: x1 x2 x0 a b P2=f(x2) P1 定義 ©蘇國賢2000 社會統計(上) ©蘇國賢2000
Variance 非連續變數的變異數: 連續變數的變異數: x1 x2 x0 a b P2=f(x2) P1 定義 ©蘇國賢2000 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 定義 Random variable x has the uniform distribution if its probability density function is defined by: We say that x is uniformly distributed random variable or that x is uniformly distributed. 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 定義 若X為一連續r.v.,若其機率密度函數為: 則稱X之機率分配為均勻分配,記做U(a, b) f(x) X a b 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 定義 Let X be a uniform random variable defined over the interval [a,b] f(x) X a b 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 定義 若r.v. X介於a,b之間為均勻分配,c,d為介於a,b中的任意數, 且a≦c ≦d ≦b 則P(c ≦X ≦d)為介於c,d,之間的長方形面積,長方形的寬為(d - c),高為1/(b - a) f(x) X c d a b 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 例題 例題:若r.v. X~U(a, b),且E(X)=1, Var(X)=3/4,求P(X>0) 。「政大保研」 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 例題 例題:If X is uniformly distributed over (0,10), calculate the probability that (a) X <3 (b) X>6 (c) 3 < X< 8 f(x) X 3 6 8 10 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 例題 例題:262巴士從早上七點開始每隔15分鐘一班,到站時間為7:00, 7:15, 7:30, 7:45等。蘇老師每天早上在介於7點和7:30之間抵達車站,且蘇老師到站的時間為均勻分配,求蘇老師(a)等車少於五分鐘的機率(b)等車超過10分鐘的機率。 設蘇老師在早上七點X分到站,X~U(0,30) 若蘇老師在7:10-7:15之間或7:25-7:30之間到站,則等車的時間將少於五分鐘。 f(x) X 7 7:15 7:30 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 例題 (a)等車少於五分鐘的機率: f(x) X 7 7:15 7:30 社會統計(上) ©蘇國賢2000
Continuous Uniform Distribution連續型均勻分配 例題 (b)等車時間超過十分鐘的機率: 若蘇老師到站時間為7:00-7:05或7:15-7:20之間,則等車時間才有可能長過十分鐘。 f(x) X 7 7:15 7:30 社會統計(上) ©蘇國賢2000
應用 一個活動範圍限定於[a, b]之間的海水浴場, 沙灘上有甲、乙兩個賣冰淇淋的小販要決定販賣的最佳位置。假設想吃冰淇淋的人的分佈為均勻分配,且行走距離為購買冰淇淋的唯一考量,請問甲、乙的最佳販售位置為? f(x) X a b 社會統計(上) ©蘇國賢2000
應用 如果甲乙分佔海灘的兩端,則市場被平均瓜分。 甲 乙 但如果甲向右邊移動,則他可以吸引到原先乙的部分顧客,且不會流失他原有的顧客。 f(x) a b 海灘中點 社會統計(上) ©蘇國賢2000
應用 假設甲向右移動至新的位置,則藍色部分的顧客都成為甲的顧客。 甲 乙 f(x) 此時甲的行為會迫使乙向左邊逼近,以搶回被甲掠奪的顧客。 a b 海灘中點 社會統計(上) ©蘇國賢2000
應用 最後的穩定均衡點為? 甲 乙 f(x) a b 海灘中點 社會統計(上) ©蘇國賢2000
應用 泛藍與泛綠在此次總統大選中要決定對中國的政策,可以在「統」與「獨」兩個極端中選擇適當位置,假設中間選民在統獨之間偏好為均勻分配,請問藍綠的最佳位置為? 台獨 統一 泛藍 泛綠 社會統計(上) ©蘇國賢2000
Normal Distribution常態分配 定義 A random variable X has the normal distribution if its probability density function is defined by: We say that X is normally distributed with parameter μ and σ, denote X~N(μ, σ2) 社會統計(上) ©蘇國賢2000
常態分配之重要性質 The curve is bell shaped and symmetric about the value X=μ 觀念 X=μ The curve is bell shaped and symmetric about the value X=μ The curve extends from -∞ to +∞ 社會統計(上) ©蘇國賢2000
常態分配之重要性質 觀念 X=μ The total area under the curve is 1. (this is required for all density function) The curve is always above X-axis (f(x) ≧0, for all x) μ=.Md=Mo 社會統計(上) ©蘇國賢2000
常態分配之重要性質 觀念 不同μ,相同σ μ1 μ2 μ3 相同μ,不同σ μ μ為位置參數,σ為形狀參數 社會統計(上) ©蘇國賢2000
Page 265, Figure 6.2 社會統計(上) ©蘇國賢2000
常態分配之重要性質 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2) 觀念 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2) 若X~N(μ1, σ12) ,Y~N(μ2, σ22),且X與Y獨立,則Z=X+Y之分配為 Z~N(μ1+μ2, σ12+ σ22) 社會統計(上) ©蘇國賢2000
標準常態分配 Standard normal distribution 觀念 A random variable is said to have the standard normal distribution if it has the normal distribution with mean μ=0 and σ2=1. Z~N(0, 1) σ=1 μ=0 社會統計(上) ©蘇國賢2000
Page 266, Figure 6.4 社會統計(上) ©蘇國賢2000
Normally distributed variables and Normal-Curve Areas For a normally distributed variable, the percentage of all possible observations that lie within an specified range equals the corresponding area under its associated normal curve, expressed as a percentage. This result holds approximately for a variable that is approximately normally distributed. 社會統計(上) ©蘇國賢2000
Page 274, Figure 6.12 社會統計(上) ©蘇國賢2000
Page 276, Table 6.2 社會統計(上) ©蘇國賢2000
Page 291, Table 6.4 社會統計(上) ©蘇國賢2000
Page 291, Figure 6.23 社會統計(上) ©蘇國賢2000
Page 299, Figure 6.25 社會統計(上) ©蘇國賢2000
Page 300, Figure 6.27 社會統計(上) ©蘇國賢2000
Page 301, Procedure 6.3 社會統計(上) ©蘇國賢2000
標準常態分配曲線下的面積 觀念 34.1% 34.1% 13.6% 2.1% 社會統計(上) ©蘇國賢2000
標準常態分配曲線下的面積 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z z) 觀念 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z z) P(Z< -z) = P(Z > z) 社會統計(上) ©蘇國賢2000
Z介於零與一正數之間 例題:Find P(0≦Z≦0.62)=? 查表可知, P(Z<0.62) =.7324 P(Z<0) =0.5 P(0≦Z≦0.62)= 0.7324 -0.5= 0.2324 z =0.5 z =0.62 社會統計(上) ©蘇國賢2000
Z介於零與一負數之間 Z~N(0,1), find P(-1.67Z 0)? 查表可知, P(Z<-1.67) =.0475 例題 Z~N(0,1), find P(-1.67Z 0)? 查表可知, P(Z<-1.67) =.0475 P(-1.67Z 0)= 0.5 – 0.0475 =0.4525 Z=-1.67 社會統計(上) ©蘇國賢2000
Z介於一負數與正數之間 Z~N(0,1), find P(-1.21Z 2.15)? P(Z 2.15) =0.9842 例題 Z~N(0,1), find P(-1.21Z 2.15)? P(Z 2.15) =0.9842 P(Z<-1.21) = 0.1131 Z=2.15 Z=-1.21 社會統計(上) ©蘇國賢2000
Z大於一正數 Z~N(0,1), find P(Z >1.64)? P(Z<1.64) = 0.9495 例題 Z~N(0,1), find P(Z >1.64)? P(Z<1.64) = 0.9495 P(Z>1.64) = 1 – P(Z<1.64) Z=1.64 社會統計(上) ©蘇國賢2000
Z大於或小於4 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0 例題 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0 社會統計(上) ©蘇國賢2000
給定面積,求Z? 例題 Z~N(0,1), find value z1 and z2 such that the area to the right of z2 is 0.025 and the area to the left of z1 is 0.025? P(Z>z2)=0.025 P(Z<z2)=.9750 查表得知z2=1.96 z1 z2 社會統計(上) ©蘇國賢2000
另一種標準常態分配曲線下的面積的TABLE 例題 查表Table A.5 Area under the standard normal distribution from 0 to z 小數點第二位 P(0≦Z≦0.62) 小數點第一位 社會統計(上) ©蘇國賢2000
標準常態分配中常用的累積機率 例題 右表為常用的數據,可以熟記 社會統計(上) ©蘇國賢2000
求一般常態分配的面積 已知標準常態分配N(0,1)的面積,可以設法將任意常態分配N(μ, σ2)轉換成N(0,1),利用查表即可求面積 觀念 社會統計(上) ©蘇國賢2000
標準化standardizing transformation 觀念 X ~N(μ, σ2),then standardized score or Z score = Z ~N(0, 1) 社會統計(上) ©蘇國賢2000
Page 268, Figure 6.6 社會統計(上) ©蘇國賢2000
Page 269, Figure 6.7 社會統計(上) ©蘇國賢2000
Page 280, Procedure 6.1 社會統計(上) ©蘇國賢2000
Page 281, Figure 6.19 社會統計(上) ©蘇國賢2000
Page 282, Key Fact 6.4/Figure 6.20 社會統計(上) ©蘇國賢2000
Page 283, Procedure 6.2 社會統計(上) ©蘇國賢2000
給定常態分配,求介於兩數的機率? 例題 Suppose X~N(10,25), find the area under the curve between x1=12 and x2=16? 10 12 16 P(.4<Z<1.2)=.3849 -.1554 =.2295 u=0 z1=0.4 z2=1.2 社會統計(上) ©蘇國賢2000
給定常態分配,求介於兩數的機率? 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ? 例題 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ? 400 80 100 120 P(80<X<120) =P(-1<Z<1) = .3413 +.3413 社會統計(上) ©蘇國賢2000
給定面積,求原始分數? 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何? 例題 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何? 11.5 P(Z<z0) = 0.975 250 社會統計(上) ©蘇國賢2000