Presentation is loading. Please wait.

Presentation is loading. Please wait.

此幻灯片可在网址 http://www.appmath.cn 上下载 概率论与数理统计讲义 第7讲 此幻灯片可在网址 http://www.appmath.cn 上下载.

Similar presentations


Presentation on theme: "此幻灯片可在网址 http://www.appmath.cn 上下载 概率论与数理统计讲义 第7讲 此幻灯片可在网址 http://www.appmath.cn 上下载."— Presentation transcript:

1 此幻灯片可在网址 http://www.appmath.cn 上下载
概率论与数理统计讲义 第7讲 此幻灯片可在网址 上下载

2 第四节 连续型随机变量

3 首先介绍物理学中的“线密度”的定义, 有一根粗细均匀的铁丝或者铁棒,每厘米长度的质量为1克,这被称为铁丝的线密度f=1,则对于长二厘米的铁丝,质量就是2克,半厘米的铁丝,质量就是0.5克。一般而言,铁丝的长度l乘上线密度f,就是铁丝的质量m m=lf

4 如果另外一根粗一些的铁丝, 线密度为 f=2克/厘米, 因此2厘米长就是4克, 半厘米长就是1克, 等等.

5 如果有一根不均匀的铁丝, 因此把它放在x轴上, 它的线密度就是x的函数f(x), 这个时候, 也可以认为, 在给定的一点x0处很短的一段, 也就是长度为Dx, 但是Dx特别短, 也可以认为这一段的密度值是近似不变的, 就是f(x0), 因此这特别短的一段的质量,就近似等于f(x0)Dx, Dx x0

6 因此这特别短的一段的质量,就近似等于f(x0)Dx, 因此这段铁丝的从a到b之间的一段的质量m, 根据定积分的知识就有

7 定义 对于随机变量X的分布函数F(x), 使对于任意实数x, 有
则X称为连续型随机变量, 其中函数f(x)称为X的概率密度函数, 简称概率密度. (显然, 改变概率密度f(x)在个别点的函数值不影响分布函数F(x)的取值. )

8 由定义知道, 概率密度f(x)具有以下性质: 1 f(x)0. 2
3 对于任意实数x1,x2,x1x2, 有 4 若f(x)在点x连续, 则有F' (x)=f(x).

9 性质3如图所示 f(x) x x1 x2 O 由性质4, 对于f(x)的连续点x, 有

10 例1 设连续型随机变量X具有概率密度 (1) 确定常数k; (2) 求X的分布函数; (3) 求P{3/2<X5/2}. 解 (1) 由 解得k=-1/2

11 例1 设连续型随机变量X具有概率密度 (1) 确定常数k; (2) 求X的分布函数; (3) 求P{3/2<X5/2}. 解 (2) X的分布函数为

12 例1 设连续型随机变量X具有概率密度 (1) 确定常数k; (2) 求X的分布函数; (3) 求P{3/2<X5/2}. 解 (3)

13 应用数学家园网站的在线计算给出了对函数的绘制曲线及定积分的计算
应用数学家园网站的在线计算给出了对函数的绘制曲线及定积分的计算. 而输入函数的语法, 则是类似计算机的高级语言的语法, 就是加减乘除乘方分别用字符+,-,*,/,^表示, 且可以用圆括号改变计算次序, 例如, 函数 就写成: e^x*(1-sin(x))/(1+x^2)

14 尤其是, 定义了四个关系二元函数 GE(a,b) 大于或等于 greater or equal GT(a,b) 大于 greater LE(a,b) 小于或等于 less or equal LT(a,b) 小于 less 其中a和b都是关于x的表达式, 如果满足关系, 函数就返回1, 否则函数就返回零. 例如, GE(a,b)当ab时就返回1, 否则就返回0. 其它关系函数依此类推. 这样,利用关系函数可以描述任何分段函数.

15 在本例中,由于最后得出的参数k = -1/2,因此概率密度函数为:
用家园网站的函数语法就是f(x)的字串为 ((-1/2)*x+1)*GE(x,0)*GE(2,x) 这样在定积分功能网页中就可以计算随机变量落在任何区间里的概率了.

16 而在此例中算出的分布函数为 用"家园网站"的语言可描述为 ((-1/4)*x^2+x)*GE(x,0)*GT(2,x)+GE(x,2) 可在"绘制曲线4"功能网页中绘制此函数的图形. 也可在"函数值计算"网页中计算函数在任何一点的值.

17 关于概率密度方面, 出题老师是怎么出题的. 首先还是胡乱假设一个区间(a,b)或者[a,b], 开区间闭区间无所谓, X就是在这个区间内取值, 在这个区间外是不可能, a<b. 经常选的区间就有(0,1), (0,2), (1,4), (-2,0), (-1,1), 等等等等. x a b

18 在区间(a,b)中胡乱定义一个非负函数f1(x), 这个函数是初等函数且一定有原函数, 例如可以是2x, 1-x, -x+2, x2, 1-x2, x-x2, sin x, cos x, 等等, 但一定要保证f1(x)0 f1(x) x a b

19 但一定要保证f1(x)0, 说的是在(a,b)区间内. 当然f1(x)在(a,b)内的积分不一定是1, 假设 则令 可保证

20 这时候就可以假设随机变量X的概率密度为 f (x) f2(x) x a b

21 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果x1<a, x2>b, 则P{x1<X<x2}=1

22 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果x1<x2<a, 则P{x1<X<x2}=0
b

23 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果b<x1<x2, 亦有P{x1<X<x2}=0
a b

24 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果a<x1<x2<b 就有

25 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果x1<a<x2<b 就有

26 f(x)定好后就要计算概率P{x1<X<x2}, x1<x2, 如果a<x1<b<x2 就有

27 计算有关一个数d的概率P{X<d}, P{X>d} 如果d<a则P{X<d}=0, P{X>d}=1
f (x) f2(x) x d a b

28 计算有关一个数d的概率P{X<d}, P{X>d} 如果d>b则P{X<d}=1, P{X>d}=0
f (x) f2(x) x a b d

29 计算有关一个数d的概率P{X<d}, P{X>d} 如果a<d<b则
f (x) f2(x) x a d b

30 在前面的讨论中将任意的>改为或者将任意的<改为计算办法都不变.

31 为了确定f(x)对应的分布函数F(x), 首先可以肯定的是当x<a时, F(x)=0, 当x>b时, F(x)=1, 而当a<x<b时, 假设中间这一段的分布函数为F2(x),

32 为了确定f(x)对应的分布函数F(x), 首先可以肯定的是当x<a时, F(x)=0, 当x>b时, F(x)=1, 而当a<x<b时, 假设中间这一段的分布函数为F2(x),

33 F(x) F2(x) 1 x a b

34 F2(x)一定是f2(x)的一个原函数, 即F2'(x)=f2(x), 而f2(x)的原函数有无穷多个, 假设其中的一个为G(x), 则必有F2(x)=G(x)+c, 但是c不能够乱取, 必须导致F2(x)满足F(x)的连续性要求. F(x) F2(x) 1 x a b

35 F(x) F2(x) 1 x a b

36 利用F(x)计算概率P{x1<X<x2}, x1<x2, 当a<x1<x2<b, P{x1<X<x2}=F2(x2)-F2(x1)

37 利用F(x)计算概率P{x1<X<x2}, x1<x2, 当x1<a<x2<b, P{x1<X<x2}=F2(x2)

38 利用F(x)计算概率P{x1<X<x2}, x1<x2, 当a<x1<b<x2 P{x1<X<x2}=1-F2(x1)

39 有关一个数d的概率, 当d<a, P{X<d}=0, P{X>d}=1, 当d>b, P{X<d}=1, P{X>d}=0, 当x1<x2, 当a<d<b, P{X<d}=F2(x), P{X>d}=1-F2(x). F(x) F2(x) 1 x a b

40 对于连续型随机变量X, 需要指出的是: 其一, 分布函数F(x)是一个连续函数; 其二, X取任一指定实数值a的概率均为0, 即P{X=a}=0. 这样, 我们在计算连续型随机变量落在某一区间的概率时, 可以不必区分该区间是开区间或闭区间. 例如有 P{a<Xb}=P{aXb}=P{a<X<b}, 此外, 尽管P{X=a}=0, 但{X=a}并不是不可能事件. 同样地, 一个事件的概率为1, 并不意味着这个事件一定是必然事件. 下面介绍三种重要的连续型随机变量.

41 (一) 均匀分布 所谓均匀分布, 就是随机变量X在某个区间上的几何试验概型上导致的分布, 就是说,落在此区间内的任何一个区域的概率, 和这个区域的长度成正比, 是这个区域的长度除以区间的长度. 因此它的概率密度为 这时称X在区间(a,b)上服从均匀分布, 记为X~U(a,b).

42 易知f(x)0, 且 由(2)式得X的分布函数为

43 f(x) F(x) 1 a x a x O b b 上图是f(x)和F(x)的图形. 均匀分布在实际问题中较为常见. 例如一个随机数(即任意取的一个实数)取整后产生的误差以及前面提到的乘客候车时的等候时间等都服从均匀分布.

44 例如, 假设X~U(1,5), 则用应用数学家园网站的语言, 概率密度函数为. (1/4). GT(x,1)
例如, 假设X~U(1,5), 则用应用数学家园网站的语言, 概率密度函数为 (1/4)*GT(x,1)*GT(5,x) 而分布函数描述为 (x-1)/4*GT(x,1)*GT(5,x)+GE(x,5)

45 (二) 指数分布 设连续型随机变量X的概率密度为
其中l>0为常数, 则称X服从参数为l的指数分布, 记为X~E(l). 易知f(x)0, 且 由(3)式得X的分布函数为

46 F(x) f(x) l 1 x x O O 指数分布的概率密度和分布函数的图形如上图所示. 这里, 我们指出电子元件的寿命及顾客排队时等候服务的时间均服从指数分布. 指数分布在可靠性理论与排队论中有广泛的应用.

47 解 由题意, X的概率密度为

48 解 由题意, X的概率密度为 于是 各元件的寿命是否超过1000小时是独立的, 因此3个元件使用1000小时都未损坏的概率为 e-3, 从而至少有一个已损坏的概率为1-e-3.

49 以此例来讲, 概率密度函数对应的字串为. (1/1000). e^(-x/1000). GT(x,0) 而分布函数对应的字串就是
以此例来讲, 概率密度函数对应的字串为 (1/1000)*e^(-x/1000)*GT(x,0) 而分布函数对应的字串就是 (1-e^(-x/1000))*GT(x,0)

50 (三) 正态分布 设连续型随机变量X的概率密度为
其中m,s(s>0)为常数, 则称X服从参数为m,s的正态分布, 记为X~N(m,s2). 显然f(x)0, 利用广义积分公式(普阿松积分) 可证

51 x s=1.5 s=1.0 s=0.5 f(x) 0.798 0.399 0.266 O m 图2-11 正态分布概率密度的图形.

52 由图2-11可以清楚地看出, 函数f(x)的图形关于直线x=m对称, f(x)在x=m处取得最大值
由图2-11可以清楚地看出, 函数f(x)的图形关于直线x=m对称, f(x)在x=m处取得最大值. 当m固定时, s的值越小, f(x)的图形就越尖; 反之, s的值越大, f(x)的图形就越平. 当然, f(x)的图形越尖, 随机变量X落在点m附近的概率也越大. 形象地说, 正态随机变量的分布规律呈现出"中间大, 两头小"的态势. 由(4)式得X的分布函数为

53 正态分布的分布函数: F(x) 1 0.5 m x O

54 特别地, 当m=0, s=1时, 称X服从标准正态分布, 记为X~N(0,1), 其概率密度和分布函数分别用j(x), F(x)表示, 即有
易知F(-x)=1-F(x). 人们编制了F(x)的函数表, 可供查用(见附表2).

55 引理 若X~N(m,s2), 则 (引理的证明将在下一节给出.)

56 如果X~N(0,1)则用家园网站的语言描述的概率密度函数为 (2. p)^(-1/2)
如果X~N(0,1)则用家园网站的语言描述的概率密度函数为 (2*p)^(-1/2)*e^(-x^2/2) 可以用定积分网页来计算X落在某个区间的概率. 此外,还有专门的计算正态分布的有关概率的网页.

57 例3 已知X~N(8,42), 求P{X16}, P{X0}及P{12<X20}. 解 由引理及(5)式, 查表得

58 也可以使用家园网站的定积分网页计算, 当X~N(8,42)时, 概率密度的描述字串为. 1/((2. p)^(1/2). 4)
也可以使用家园网站的定积分网页计算, 当X~N(8,42)时, 概率密度的描述字串为 1/((2*p)^(1/2)*4)*e^(-(x-8)^2/(2*4^2))

59 例4 设X~N(m,s2), 求X落在区间(m-ks, m+ks)内的概率(k=1,2,3)
例4 设X~N(m,s2), 求X落在区间(m-ks, m+ks)内的概率(k=1,2,3). 解 P{|X-m|<ks}=P{m-ks<X<m+ks} =F(k)-F(-k) =2F(k)-1, 于是 P{|X-m|<s}=2F(1)-1=0.6826, P{|X-m|<2s}=2F(2)-1=0.9544, P{|X-m|<3s}=2F(3)-1=0.9973, 则 P{|X-m|3s}=1-P{|X-m|<3s}=0.0027<0.003.

60 P{|X-m|3s}=1-P{|X-m|<3s}=0. 0027<0. 003
P{|X-m|3s}=1-P{|X-m|<3s}=0.0027< 由此可见, X落在(m-3s, m+3s)以外的概率小于3‰. 由于这一概率很小, 在实际问题中常认为它是不会发生的, 基本上可以把区间(m-3s, m+3s)看作是随机变量X实际可能的取值区间. 这一说法称之为正态分布的"3s"原则.

61 在自然现象和社会现象中, 大量随机变量都服从或近似服从正态分布. 例如, 人的身高与体重, 测量产生的误差, 海洋波浪的高度等等
在自然现象和社会现象中, 大量随机变量都服从或近似服从正态分布. 例如, 人的身高与体重, 测量产生的误差, 海洋波浪的高度等等. 事实上, 正态分布是概率论与数理统计中最重要的一种分布, 这一点我们将在第五章里进一步地说明.

62 为了便于今后在数理统计中的应用, 对于标准正态随机变量, 按如下方式引入上a分位点的定义
为了便于今后在数理统计中的应用, 对于标准正态随机变量, 按如下方式引入上a分位点的定义. 设X~N(0,1), 若ua满足条件P{X>ua}=a, 0<a<1, 则称点ua为标准正态分布的上a分位点. x a ua j(x) ua的值可通过查附表2得到.

63 由j(x)的图形的对称性可知: u1-a=-ua
0.001 0.005 0.01 0.025 0.05 0.10 ua 3.090 2.576 2.327 1.960 1.645 1.282 由j(x)的图形的对称性可知: u1-a=-ua

64 作业: 第57页(老版第54页)开始 习题2-4, 第1,3,4,7题


Download ppt "此幻灯片可在网址 http://www.appmath.cn 上下载 概率论与数理统计讲义 第7讲 此幻灯片可在网址 http://www.appmath.cn 上下载."

Similar presentations


Ads by Google