Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全

Similar presentations


Presentation on theme: "第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全"— Presentation transcript:

1 第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 电子邮件:qkdong@xidian.edu.cn
本科生必修课:概率论与数理统计 第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 个人主页:

2 第二章 随机变量及其分布 §2.1 随机变量 §2.2 离散型随机变量及其概率分布 §2.3 随机变量的分布函数 §2.4 连续型随机变量及其概率密度 §2.5 随机变量的函数的分布

3 §2.1 随机变量 对于错综复杂的随机现象,如信道噪声、随机信号、测量误差等实际问题难以简单处理。为了更好的用数学方法来分析随机现象地统计规律性,人们将随机试验的结果与实数对应起来(结果数量化),从而引入随机变量的概念 例1:将一枚硬币抛掷三次,观察正反面出现的情况,并考虑每次试验当中正面出现的次数,样本空间是 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} 以X记三次投掷得到正面H的总数,那么对于样本空间S中的每一个样本点e,X都有一个数与之对应

4 §2.1 随机变量 例1:将一枚硬币抛掷三次,观察正反面出现的情况,并考虑每次试验当中正面出现的次数,样本空间是
S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} 以X记三次投掷得到正面H的总数,那么对于样本空间S中的每一个样本点e,X都有一个数与之对应 X是定义在样本空间上的单值实值函数,定义域是样本空间,值域为{0,1,2,3}.使用函数的符号可将X写成

5 §2.1 随机变量 例2:随机试验:袋中装有编号分别为1,2,3的3只球,在袋中任取一只,放回,然后再取一只球,记录他们的编号
样本点:是一个编号的数对:(i,j),i,j=1,2,3 样本空间:S={e}={(i,j)|i,j=1,2,3} 现在关心的是两个球的号码之和,记做X,则对于每一个样本点e,X都有一个值与之对应 即从样本空间到实数集合上的一个映射 X:S→R X是一个定义在样本空间S上的单值实值函数, 其定义域是样本空间;值域是实数集合{2,3,4,5,6} 因此X可写成 X=X(e)=X((i,j))=i+j,i,j=1,2,3.

6 §2.1 随机变量 定义: 设随机试验的样本空间为S={e}。X=X{e}是定义在样本空间S上的实值单值函数。称X=X{e}为随机变量

7 §2.1 随机变量 关于随机变量需要注意的几个方面 X是一个单值实值函数,定义域是样本空间S,值域是X的所有可能取值RX。
注意随机变量的值域不同于样本空间 (2)如果随机试验结果本身是一个数,则直接令X=X(e)=e,X是一个随机变量 如灯泡的寿命T,某学校学生的体重W,掷骰子的点数等等 随机变量的取值可以是有限的,可列的,或不可列的 (3) 随机变量的取值随试验结果而定,是样本点的函数,因此随机变量X(e)的取值是随机出现的,有一定的概率

8 §2.1 随机变量 随机事件的描述 例如 当然关心的X取值也可能有多个,用关于X的表达式来表示
例1中X的取值为2,记做{X=2},对应的样本点集合为A={HHT,HTH,THH}这是一个随机事件 当且仅当A发生时有{X=2},我们称概率P(A)为{X=2}的概率,即P{X=2}=P(A)=3/8 当然关心的X取值也可能有多个,用关于X的表达式来表示 如{X1}表示随机事件B={TTT,TTH,THT,HTT} P{ X1}=P(B)=4/8 一般的,若L是一个实数集合,将X在L上取值写成{XL},则{XL}表示事件B={e| X(e)L },此时有P{ XL }=P(B)

9 §2.2 离散型随机变量及其概率分布 本节学习基于随机变量来描述随机现象的一般问题 随机变量的类别:设F(x)是分布函数

10 §2.2 离散型随机变量及其概率分布 离散型随机变量的例子: 将一枚硬币抛掷三次,观察出现正面的次数: 某电话交换台一分钟内收到的呼叫次数:
随机变量的全部可能取值仅有4个:0,1,2,3 某电话交换台一分钟内收到的呼叫次数: 可列无限多个(理想状态下) 某城市120急救电话台一昼夜收到的呼叫次数 而灯泡的寿命T所有可能取值充满一个区间,无法按一定次序一一列出,非离散型随机变量

11 §2.2 离散型随机变量及其概率分布 掌握离散随机变量X的统计规律,只需知道X的两个问题 分布律:
(1) X所有可能的取值,我们可以通过随机试验的样本空间S来得到 (2) 每一个可能取值的概率,它们构成分布律的概念 在后面我们会进一步学习X的数字特征等概念 分布律: 设离散型随机变量X的所有可能取值为xk(k=1,2,…),X取各个可能值的概率,即事件{X=xk}的概率为 P{X=xk}=pk,k=1, 2, … 由概率的定义,pk满足如下两个条件: (1) 非负性:pk0; (2) 规范性: =1 则称P{X=xk}=pk,k=1,2,…为离散型随机变量X的分布律

12 §2.2 离散型随机变量及其概率分布 分布律也可表示为表格的形式 分布律含义:由分布律定义中的条件,概率1以一定的规律分布在各个可能值上
X x1 x2 … xn … pk p1 p2 … pn … 分布律含义:由分布律定义中的条件,概率1以一定的规律分布在各个可能值上 规范性的证明: {X=x1}∪{X=x2}∪…是必然事件,与样本空间相对应,且{X=xk}∩{X=xj}=Φ,k≠j 所以,1=P({X=x1}∪{X=x2}∪…)

13 §2.2 离散型随机变量及其概率分布 例 1设随机变量 X 的分布律为: P(X=n)=c/4n (n=1,2,…,), 求常数c. 解:由规范性 1= = = (c/4)/(1-1/4) =c/3  c=3

14 §2.2 离散型随机变量及其概率分布 几种重要的离散型随机变量的分布律 (一)(0-1)分布 设随机变量X只可能取两个值0与1,它的分布律是
P{X=k}=pk(1-p)1-k,k=0,1,0<p<1, 则称X服从(0-1)分布或两点分布,记作 b(1,p) 应用:(0-1)分布是经常遇到的一种分布 一般的对于一个随机试验,如果它的样本空间只包含两个元素,即S={e1,e2},总能在S上定义一个服从(0-1)分布的随机变量描述这个随机试验结果 X=X(e)= 例如:对新生儿的性别进行登记 抛一枚硬币,观察其正面和反面出现的情况

15 §2.2 离散型随机变量及其概率分布 (二)伯努利试验、二项分布 伯努利试验Bernouli
设试验E只有两个可能结果:A及 ,则称E为伯努利试验。设P(A)=p (0<p<1),则P( )=1-p。将试验E独立地重复地进行n次,则称这一串重复的独立试验为n重伯努利试验 其中,“重复”是指每次试验都有P(A)=p “独立”是指各次试验的结果A互不影响,相互独立 n重伯努利试验应用非常广泛,是研究最多的模型之一 (0-1)分布的模型就是1重伯努利实验 E :抛一枚硬币,观察H和T出现情况,将E独立进行n次,观察H次数 而一些不放回抽样的随机试验则可能不满足这种独立性,也就不是n重伯努利试验。

16 §2.2 离散型随机变量及其概率分布 伯努利试验的分布律
以X表示n重伯努利试验中事件A发生的次数(比如n次抛币试验中正面出现的频数),求X的分布律,即求 1)X的所有可能取的值为0,1,2,...,n 2)X的分布律,即求对任意的k(0kn),概率P{X=k} 解:P{X=k}即相当于求在n次试验中,有k次试验事件A发生,另外n-k次试验事件A不发生的概率

17 §2.2 离散型随机变量及其概率分布 首先看一下事件A在某指定k次试验中发生,比如在第i1,i2,...,ik次试验中A发生,而其余n-k次试验中不发生的概率。由于这n次试验是相互独立的,则相应概率为 p•p•...•p•(1-p)•(1-p)•...•(1-p)=pk(1-p)n-k i1 i ik 这样的指定方式共有 种两两互不相容的方式(两两不同的方式) 因此n次试验中事件A发生k次的概率为 pk(1-p)n-k,令q=1-p有 P{X=k}= pkqn-k,k=0,1,...,n

18 §2.2 离散型随机变量及其概率分布 分布律的两个条件的验证: P{X=k}= pkqn-k0,k=0,1,2,...,n 而
即非负性和归一性均满足 所以P{X=k}= pkqn-k,k=0,1,...,n即为所求分布 由于pkqn-k恰好是(p+q)n的二项展开式中出现pk的那一项,故称随机变量X服从参数为n,p的二项分布,记为 X~b(n,p),n=1时化为(0-1)分布

19 §2.2 离散型随机变量及其概率分布 Matlab实验 已知Y~b(20, 0.2)求Y分布率的值,并划出图形
binopdf(10,20,0.2) x=0:1:20; y=binopdf(x,20,0.2) plot(x,y, ‘r.’) Matlab实验 结果: ans = y =

20 §2.2 离散型随机变量及其概率分布 二项分布中的概率最大项: 先求分布律中的极大值点,它应该满足如下不等式组
1)P{X=k}= pkqn-k pk-1qn-k+1=P{X=k-1} 2)P{X=k}= pkqn-k pk+1qn-k-1=P{X=k+1} 由1)得k≤(n+1)p 由2)得k≥(n+1)p-1 联立1)和2) 有(n+1)p-1≤k≤(n+1)p 当(n+1)p为整数时,k=(n+1)p和(n+1)p-1时取得最大值 当(n+1)p为非整数,k=[(n+1)p]时取得最大值 二项分布的一般图示:

21 §2.2 离散型随机变量及其概率分布 例2:近似二项分布 解:
按规定,某种型号的电子元件的使用寿命超过1500小时的为一级品。已知某一大批产品的一级品率为0.2,现在随机抽取20只,问20只元件中恰有k只为一级品的概率是多少? 解: 本题是不放回抽样问题,由于元件总数很大,而抽查元件数量远远小于元件总数,可以近似当作放回抽样来处理。 A:抽取一只元件是一级品 P(A)=0.2 如果看作放回抽样,每次检查元件是相互独立的,则检查20只元件相当于做20重伯努利试验,以X记20只元件中一级品的只数,那么随机变量X服从二项分布,即X~b(20, 0.2)即有 P{X=k}= k0.820-k,k=0,1,2,...,20.

22 §2.2 离散型随机变量及其概率分布 例3 大量试验条件下的小概率事件问题 解:
某人进行射击,设每次击中的命中率为0.02,独立射击400次,试求至少击中两次的概率 解: 将一次射击看成是一次试验,设射击次数为400,则X~b(400, 0.02) X的分布律为P{X=k}= k -k,k=0,1,2,...,400. 所求的概率为P{X2}=1-P{X=0}-P{X=1} =1- -400(0.02) =0.9972 结果接近于1 一次射击击中目标是个小概率事件 若400次中击中目标次数竟真的达不到两次,而由于这一事件的概率P{X<2}=0.003是小概率事件,由实际推断原理,有理由怀疑命中率达不到0.02,可能更低 大量独立试验条件下,小概率发生几乎是肯定的,如抽奖问题

23 §2.2 离散型随机变量及其概率分布 例4 维修工分配问题(用工优化) 解:按方案(1) 不考虑维修时间长短问题
设有80台同类型设备,各台工作独立,发生故障的概率都是0.01,且一台设备的故障仅能由一人处理,考虑两种配备维修工人的方法 (1)由4人维护,每人20台; (2)由3人共同维护80台; 试比较发生故障时不能及时维修的概率大小? 解:按方案(1) 不考虑维修时间长短问题 记X为 “第一人维护的20台中同一时刻发生故障的台数“, 则X~b(20, 0.01) 用事件Ai表示:“第i人维护的20台中发生故障不能及时维修”这一事件 则80台中发生故障不能及时维修的概率为 P(A1∪A2∪A3∪A4) P(A1)=P(X 2)

24 §2.2 离散型随机变量及其概率分布 按方案(2) 而X~b(20, 0.01),故有
P(X2)= 1-P(X=0)-P(X=1)=1-0.9920-20(0.01)0.9919=0.0169 即有P(A1∪A2∪A3∪A4)0.0169 按方案(2) 记Y为80台中同一时刻发生故障的台数,则Y~b(80, 0.01) 发生故障不能及时维修的概率 P(A)=1-P(Y=0)-P(Y=1)-P(Y=2)-P(Y=3) =1-0.9980- - - =0.0087<<0.0169 方案(2)不能及时维修的概率远远小于方案(1) 因此方案(2)的用工方案更优,而且节省人力

25 §2.2 离散型随机变量及其概率分布 (三)泊松分布
泊松分布是概率论中比较重要的一种分布,描述一系列在给定时间区间内到达某区域的随机质点数的分布规律,在排队论、路由优化等方面有广泛的应用... 如:到达某十字路口的汽车数、电话交换台接到的要求通话的呼唤数、纺织机上出现的断点数、到达某区域的放射性粒子数、人类的生育胎数、到达某铁路售票处要求售票的顾客数、某一秒种内路由器等待转发的数据包的个数(队列长度) 主要描述那些具有无穷可列个取值的离散型随机变量 这类问题的显著特点是可列个取值的总概率为1,服从泊松分布的数学模型在第十章,在学习随机过程时会接触到,这里直接给出泊松分布的定义形式

26 §2.2 离散型随机变量及其概率分布 泊松分布: 泊松分布关于分布律的两个条件 设随机变量X的所有可能取值为0,1,2,...,
而取各值的概率为 ,k=0,1,2,... 其中λ>0为常数(也叫泊松强度,具体含义在第四章介绍),则称X服从参数为λ的泊松分布,记为X~π(λ) 泊松分布关于分布律的两个条件 非负性是显然的 规范性: = = 考虑麦克劳林级数展开 所以

27 §2.2 离散型随机变量及其概率分布 泊松分布的概率最大值问题 与二项分布的求解方法类似,先找极大值点,它应满足如下不等式组
1)P{X=k}= ≥ =P{X=k-1} 2)P{X=k}= ≥ =P{X=k+1} 由1)得k≤λ 由2得k≥λ-1 联立1)和2)有λ-1≤k≤λ 当λ为整数时, k=λ和λ-1时取得最大值 当λ为非整数, k=[λ]时取得最大值 三种分布之间的关系: (1) 0-1分布考察一次试验中两个可能结果的概率 (2) 二项分布是把以上试验独立重复进行n次,考察出现某一个结果的次数的概率,n=1时即是结果0-1分布 (3) 泊松分布考察一段时间内某一事件发生的次数的概率

28 §2.2 离散型随机变量及其概率分布 泊松定理 (针对稀有事件)
(用泊松分布来逼近二项分布的定理) 设λ>0是一个常数,n是任意正整数,设npn=λ,则对于任意固定的非负整数k,有 证 由pn=λ/n,有 对任意固定的k,当n趋近于无穷大时,上式第二项极限为1,第三项是自然对数极限为e--λ,最后一项极限为1,所以定理成立。 npn=λ是常数,当n很大时pn必定很小,所以当n很大,pn很小时,可用泊松分布来近似二项分布。 当n≥10, p≤0.1, np≤5时:二项分布≈泊松分布。 当试验次数n很大时,稀有事件A发生的次数可以近似用泊松分布来描述,而=np为n次中A发生的平均次数

29 §2.2 离散型随机变量及其概率分布 历史上Poisson分布是作为二项分布的一种近似,其前提是二项分布是稀有事件
而二项分布的真正极限分布是正态分布(见中心极限定理) 于1837年由法国数学家S.D.Poisson(1781 ~ 1840年)引入。 近些年来,人们发现该分布在物理学及社会生活中对服务的各种要求等方面有愈来愈多的应用

30 §2.2 离散型随机变量及其概率分布 (四) 超几何分布,抽样检查,无放回抽样
产品抽样检查中,假定在N件产品中有D件不合格品,即不合格率p=D/N。随机抽n件做检查,发现k件不合格品的概率为超几何分布 通常称这个随机变量X服从超几何分布。这种抽样检查方法等于无放回抽样。 数学上不难证明,N趋近无穷时 P(X=k)=CkDCn-kN-D/CnN 近似为b(n,p) (二项分布) 因此,在实际应用时,当N≥10n时,可用二项分布近似描述不合格品个数 ,当实验次数足够多的时候,不放回抽样可近似为放回抽样,而如果放回抽样则刚好满足二项分布,p=废品率D/N P(X=k)=CkDCn-kN-D/CnN,(k=0,1,… min{n, D})

31 §2.2 离散型随机变量及其概率分布 Matlab实验 假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布,求
(1) 每小时恰有4次呼叫的概率 (2) 一小时内呼叫不超过5次的概率 (3) 画出分布律图像 Matlab实验 在Matlab中输入以下命令: (1)p1= poisspdf(4,3) (2)p2= poisscdf(5,3) (3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

32 §2.2 离散型随机变量及其概率分布 Matlab实验

33 §2.2 离散型随机变量及其概率分布 二项分布与泊松分布的关系 例:X~b(200,0.02),Y 服从参数为4的泊松分布,划出分布率图像
y1=binopdf(x,200,0.02); y2=poisspdf(x,4); plot(x,y1,’r.’,x,y2,’b.’) Matlab实验

34

35 §2.2 离散型随机变量及其概率分布 分赌注问题  (problem of rational divilion of stakes)是对创立概率论有重大影响的著名问题。 水平相同的两个赌徒A和B,约定先胜t局的人赢得赌注,在赌博中的某时刻,两赌徒中止赌博,此时A胜r局,B胜s局,应如何合理分配赌注? 这个问题通常称为点数问题,是嗜好赌博的法国学者梅雷(Meray,H. C. R.)于1654年向法国数学家帕斯卡(Pascal ,B.)提出的. 为此帕斯卡和法国数学家费马(Fer-mat,P. de)于1654年7月到10月之间进行了一系列通信讨论.赌注分配问题成为概率论的起源. 当荷兰数学家惠更斯(Huygens,C.)到巴黎时,听说费马和帕斯卡在研究赌注问题,他也进行了研究,并在1657年撰写了《论赌博中的计算》一书,提出数学期望的概念,推动了概率论的发展.1713年,瑞士数学家雅各布·伯努利(Bernoulli , Jakob)的《猜度术》一书的面世,标志着概率论已成为数学的一个重要分支.

36 §2.2 离散型随机变量及其概率分布 如果以r和s之比来分的话不是很合理。
设A每局取胜的概率为p,分赌注为题可描述为在伯努利试验中,求A出现t-s次赌博失败之前,出现t-r次获胜的概率,记为pA。最终赌注按pA:1-pA来分配 解:A若胜则后面至少要进行t-r次试验,最多要进行(t-r)+(t-s)-1次即可分出结果。 A的概率等于 (组合下标减1是因为第i次一定胜利) 帕斯卡分布、负二项分布

37 §2.3 随机变量的分布函数 非离散型随机变量X,由于其可能取值不能一个一个的列举而无法用分布律来描述。而且所遇到的非离散型随机变量通常取任一指定的实数值的概率都等于0 实际问题中有很多此类变量:误差ε,元件寿命T等. 对于此类问题,主要研究随机变量取值落在某一个区间的概率,即: P{x1<X≤x2}= P{ X≤x2}-P{X≤x1} 物理意义 问题变为计算P{ X≤x2}及P{ X≤x1},于是引入分布函数的概念。

38 §2.3 随机变量的分布函数 分布函数定义: 左开右闭区间上的概率表示: 设X是一个随机变量,x是任意实数,函数
F(x)=P{X≤x},-<x< 称为X的分布函数 左开右闭区间上的概率表示: 对于任意实数x1,x2 (x1<x2),有 P{x1<X≤x2}= P{ X≤x2}-P{X≤x1}=F(x2)-F(x1) ∴已知分布函数,就可以计算出x落在任意区间(x1,x2]上的概率 分布函数完整地描述了随机变量的统计规律性。

39 §2.3 随机变量的分布函数 分布函数的物理意义:
将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在(-∞,x]上的概率。

40 §2.3 随机变量的分布函数 分布函数具有以下基本性质 1°F(x)是一个不减函数
对任意实数x1,x2 (x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}0 2°0F(x)1且F(-∞)= =0,F(∞)= =1 仅从物理意义上加以说明:当x趋于-∞时,即区间端点沿x轴无限左移,{X<x}逐渐趋于不可能事件,从而其概率趋于0,即有F(-∞)=0;反之,若点x无限右移,则{X<x}趋于必然事件,从而概率趋于1,即有F(∞)=1 3°F(x+0)=F(x) 即F(x)为右连续的 F(x)在点x处的右极限等于点x处的函数值,即F(x)是右连续的

41 §2.3 随机变量的分布函数 例1:随机变量的分布律用分布函数来表示
设随机变量X的分布律为 X - pk 1/4 1/2 1/4 求X的分布函数,并求P{X≤1/2},P{3/2<X≤5/2},P{2≤X≤3} 解:随机变量落在-1,2,3三个点上的概率为非0,落在其它点上为不可能事件,因此有

42 §2.3 随机变量的分布函数 P{X≤1/2}=F(1/2)=1/4 P{3/2<X≤5/2}= F(5/2)-F(3/2)=3/4-1/4=1/2 P{2≤X≤3}= F(3)-F(2)+ P{X=2}=1-3/4+1/2=3/4 注意区间左端的等号 1 概率函数与普通的代数函数不同之处在于物理意义不同,前者是随机变量X的取值落在(-∞,x]区间上的概率 2 求分布函数,一定要讨论区间(-∞,∞)上的所有情况 3 F(x)的值即为所有x的X取值中落在xk处的概率pk之和 4 F(x)的图形是一条阶梯形曲线, 在x=-1,2,3处有阶跃点 阶跃值分别为1/4,1/2,1/4 曲线的阶跃点处,上为实心点,下为空心点,体现右连续,小于-1时F(x)=0也应画一个粗实线

43 §2.3 随机变量的分布函数 分布律用分布函数表示的一般方法: 一般的,设离散型随机变量X的分布律为 P{X=xk}=pk,k=1,2,…
F(x)= P{ X≤x}= 即F(x)= 这里和式是对所有满足xkx的k求和的,分布函数在点x=xk(k=1,2,…)处有跳跃,其跳跃值为pk=P{X=xk} 分布函数能表达所有随机变量的概率问题

44 §2.3 随机变量的分布函数 已知Y~b(20, 0.3)求Y分布函数的值,画出函数图像 在Matlab中输入以下命令: Matlab实验
binocdf(10,20,0.3) x=0:1:20; y=binocdf(x,20,0.3) ezplot('binocdf(t,20,0.3)',[0,20]) Matlab实验 结果: ans = y =

45 §2.3 随机变量的分布函数 Matlab实验

46 §2.3 随机变量的分布函数 例2 一般随机变量的分布函数的求解方法
一个靶子是半径2米的圆盘,设击中耙上任一同心圆盘上的点的概率与该同心圆盘的面积成正比,并设射击都能中耙,以X表示弹着点与圆心的距离,试求随机变量X的分布函数F(x)=P{Xx}

47 §2.3 随机变量的分布函数 解:分段讨论: 1°当x<0时,{Xx}是不可能事件,F(x)=0
2°在圆盘上,0x2,由题意,P{0Xx}=kπx2 当x=2时由于假定每次射击都能中耙, 有P{0X2}=1 ∴1=kπ22 即kπ=1/4代入得F(x)=P{X<0}+P{0Xx} = 0+(1/4)x2=(1/4)x2 3°当x>2时,由题意{Xx}是必然事件,F(x)=1

48 §2.3 随机变量的分布函数 综上,F(x)是一个分段函数,具体为 它的图形是一条连续曲线 ※注意区间端点的取值
※注意x是值,X是随机变量

49 §2.3 随机变量的分布函数 现在对F(x)求导数 (不可导的点的导数设为0) 有 这样有F(x)=
即F(x)是非负函数f(t)在区间(-∞,x]上的积分,f(t)即为概率密度函数,其中X是连续型。

50 §2.4 连续型随机变量及其概率密度 连续型随机变量及概率密度 定义:
如果对于随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有 F(x)= 则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称概率密度 ※由数学分析的知识,连续型随机 变量的分布函数是连续函数 ※在实际应用中遇到的基本上是 离散和连续型随机变量 几种提法: X的概率分布:是指分布函数 X为连续型时:是指概率密度 X为离散型时:是指分布律

51 §2.4 连续型随机变量及其概率密度 概率密度函数的性质: 1º 非负性:f(x)0. 由定义可知 2º 规范性:
曲线y=f(x)与Ox轴之间的面积等于1 3º 对任意实数x1,x2 (x1x2),有P{x1<X≤x2}=F(x2)-F(x1) 概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下曲边梯形的面积 4º 若f(x)在点x处连续,则有F(x)=f(x) 比右连续强,一般的是右连续)

52 §2.4 连续型随机变量及其概率密度 a) 一维随机变量的概率密度的线密度含义: 由连续性定义,在连续点x处有 f(x)= =
这正好与物理学中的线密度的定义类似:随机点落在单位区间上概率的大小 当∆x充分小时,点x处的曲边梯形可近似为长∆x高f(x)的矩形。 即P{x<X≤x+∆x }≈f(x)∆x,随机变量X落在(x,x+∆x]的概率近似等于f(x)∆x,忽略了高阶无穷小。

53 §2.4 连续型随机变量及其概率密度 b) 对于连续型随机变量,单点概率为0 即若X为连续型随机变量,对任意的实数a,有P{X=a }=0
证:显然有包含关系{X=a}{a-∆x<X≤a } ∴0≤P{X=a }≤P{a-∆x<X≤a }=F(a)-F(a-∆x) 而F(x)是连续的(也满足左连续),因为连续型随机变量的分布函数是连续的 ∴当∆x→0时有0P{X=a}≤ 即P{X=a}=0 要注意几点: 1°只有当X为连续型时,才一定有P{X=a}=0,否则不一定 2°尽管P{X=a}=0,但{X=a }不是不可能事件 3°连续型随机变量中区间的端点不影响概率值,即对以下概率不加区分 P{a<X≤b}=P{a≤X≤b}=P{a≤X<b}=P{a<X<b}

54 §2.4 连续型随机变量及其概率密度 例:由分布函数求概率密度 设 ,求f(x)
解:先判断F(x)在区间端点的连续性(是否有阶跃特性),如果连续则直接对F(x)进行分段求导即可,由于连续型随机变量单点概率为0,不可导的点可直接取右导数即可,也可随意给定

55 §2.4 连续型随机变量及其概率密度 例1:由概率密度求分布函数和概率 设随机变量X具有概率密度
(1)确定常数k;(2)求F(x);(3)求P{1<X≤7/2 } 解: (1) 由规范性得 1= ,解得k=1/6; (2) 由定义 (3) P{1<X≤7/2 }=F(7/2)-F(1)=41/48 或者用性质(3)在区间(1,7/2]上对f(x)积分

56 §2.4 连续型随机变量及其概率密度 三种重要的连续型随机变量 (一)均匀分布 概率密度的两个条件显然成立: 设连续型随机变量X具有概率密度
则称x在区间(a,b)上服从均匀分布.记为X~U(a,b)。 例如:电子和量子在一定能级上的运动轨迹 数值计算中,研究四舍五入引起的误差。 概率密度的两个条件显然成立: 非负性成立f(x)0,且规范性: =1

57 §2.4 连续型随机变量及其概率密度 X的分布函数: F(x)为f(x)的积分图像
均匀分布的含义:代表一种等可能性,即X落在区间(a,b)中任意等长度的子区间内的概率是等可能的,或者说X落在区间(a,b)中的概率只依赖于子区间长度而与子区间位置无关。 证:对任意长度为l的子区间(c,c+l),a≤c<c+l≤b,有 几何概型

58 §2.4 连续型随机变量及其概率密度 例2: 设电阻值R是一个随机变量,均匀分布在900Ω~1100Ω。求R的概率密度及R落在950Ω~1050Ω的概率。X~U(900,1100) 解:首先由题意均匀分布,得到R的概率密度函数为 ∴P{950<R≤1050}= =0.5

59 §2.4 连续型随机变量及其概率密度 Matlab实验 均匀分布再MATLAB中的图像 MATLAB为常见自然概率分布提供了下列5类函数
①概率密度函数(pdf) ②累积分布函数(cdf),即分布函数 ③逆累积分布函数(inv),求随机变量X在概率点处的分布函数反函数值 ④均值与方差计算函数(stat),求给定分布的随机变量X的数学期望E(X)和方差var(X) ⑤随机数生成函数(rnd),模拟生成指定分布的样本数据 (调用格式:x=分布+rnd(分布参数),如x=normrnd(0,1)) Matlab实验

60 §2.4 连续型随机变量及其概率密度 常见分布的类型名称 Matlab实验 分布类型 MATLAB名称 正态分布 norm 二项分布
bino 指数分布 exp Poisson分布 poiss 均匀分布 unif 几何分布 geo β分布 beta 超几何分布 hyge Γ分布 gam 离散均匀分布 unid 对数正态分布 logn 连续均匀分布 rayleigh分布 rayl 负二项分布 nbin weibull 分布 weib 2分布 chi2 F分布 f 学生氏t分布 t

61 §2.4 连续型随机变量及其概率密度 Matlab实验 具体函数的命名规则是:
函数名=分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd) 例如,normpdf、normcdf、norminv、normstat和normrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。 关于这5类函数的语法,请详见有关书籍 快捷的学习可借助MATLAB的系统帮助,通过指令doc获得具体函数的详细信息,语法是 doc <函数名> Matlab实验

62 §2.4 连续型随机变量及其概率密度 Matlab实验
离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N) 随机变量X在1到N上的N各自然数之间等可能取值 在Matlab中输入以下命令: x=1:1:10; y=unidpdf(x,10) 结果:y = x=0:1:10; y=unidcdf(x,10) 结果:y = Matlab实验

63 §2.4 连续型随机变量及其概率密度 连续均匀分布 Matlab实验 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形.
密度函数:f=unifpdf(x,a,b) 分布函数:f=unifcdf(x,a,b) 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. 在Matlab中输入以下命令: x=0:0.01:7; y=unifpdf(x, 2, 5); z=unifcdf(x, 2, 5); plot(x,y,x,z) Matlab实验

64 §2.4 连续型随机变量及其概率密度 Matlab实验

65 §2.4 连续型随机变量及其概率密度 (二)指数分布 概率密度的两个条件显然成立: X的分布函数: 设连续型随机变量X的概率密度为
易知非负性成立f(x)0,且规范性: =1 X的分布函数:

66 §2.4 连续型随机变量及其概率密度 无记忆性: (指数分布又称“永远年青”的分布) 应用:排队论,可靠性理论
服从指数分布的X有如下性质:P{X>s+t|X>s}=P{X>t} 证:P{X>s+t|X>s}=P{X>s+t∩X>s}/P{X>s}=P{X>s+t}/P{X>s} =[1-F(s+t)]/[1-F(s)] =e-(s+t)/θ/e-s/θ= e-t/θ = P{X>t} 含义:如果X是某一元件寿命,那么已知元件使用了s小时,它还能再使用t小时(即s+t小时)的条件概率,等于从开始使用时算起它至少能使用t小时的概率。即元件对它使用s小时没有记忆,符合这样数学模型的随机现象有很多。 应用:排队论,可靠性理论 描述衰老作用不明显的寿命分布; θ为寿命X的平均值 衰老作用明显的时候常采用weibull分布

67 §2.4 连续型随机变量及其概率密度 (2) 指数分布 Matlab实验
密度函数:f=exppdf(x,) 分布函数:F=expcdf(x,) 例: 画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20). 在Matlab中输入以下命令: x=0:0.1:5; y=exppdf(x,2); z=expcdf(x,2); plot(x,y,x,z) result1=expcdf(5,2)-expcdf(0,2) result2=expcdf(20,2)-expcdf(0,2) Matlab实验

68 §2.4 连续型随机变量及其概率密度 结果:result1 = 0.91791500137610

69 §2.4 连续型随机变量及其概率密度 (三)正态分布 在自然界中大量的随机现象服从或近似的服从正态分布
人的身高、体重;农作物的收获量;测量误差; 产品的尺寸、炮弹弾着点、考试成绩 器件中的电子热噪声;信道噪声 若随机变量 X 受到众多相互独立的随机因素的影响,而每一个别因素的影响都是微小的,且这些影响可以叠加, 则 X 服从正态分布(大量微小的独立的随机因素综合作用的结果(第五章进一步学习)) 这些现象的分布常具有两头小、中间大,呈左右对称的特点,钟型曲线

70 §2.4 连续型随机变量及其概率密度 定义:设连续型随机变量X的概率密度为 f(x)= ,-∞<x<∞
其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布或高斯(Gauss)分布,记为X~N(μ, σ2) 注意,第二个参数是平方的形式 μ,σ的含义在第四章介绍,它们分别是均值和方差的概念 此分布的数学表达式最早(1718年)由法国哲学、数学家A.DeMoivre提出,以后由(德)数学家C.F.Gauss(1777~1855年)作了系统研究,故又称de Moivre分布或Gauss分布。

71 §2.4 连续型随机变量及其概率密度 概率密度的两个条件: 易知非负性成立f(x)0,现在证规范性: =1
令t=(x-μ)/σ,有dt=dx/σ,-∞<t<∞,代入得 记 I= 利用极坐标系将它化成累次积分,dtdu =rdrdθ, 0<r=(t2+u2)1/2<∞, 0<θ<2π得 即I=1 于是 =I=1

72 §2.4 连续型随机变量及其概率密度 正态函数的性质:函数曲线的性质 1°对称轴: 意义:X落在关于x=μ对称的两个区间的概率相等
曲线关于x=μ对称,对任意的h>0有 P{μ-h<Xμ}=P{μ<Xμ+h } 函数的对称性即证明,对任意的a有f(μ-a)= f(μ+a) 证明略。 意义:X落在关于x=μ对称的两个区间的概率相等 对称轴平移,曲线形状不变。曲线f(x)的位置完全由μ决定,μ称为位置参数

73 §2.4 连续型随机变量及其概率密度 2°最大值:当x=μ时取到最大值f(μ)= 3°拐点:上凸和下凹的分界点
只需令df(x)/dx=0,可解出x=μ时取得唯一极值 意义:极大值与σ有关,σ越小,最值越大,X落在对称轴附近的概率越大,x离μ越远f(x)的值越小 3°拐点:上凸和下凹的分界点 在x=μ±σ处曲线有拐点。可由df(x)2/dx=0解出。 上凸部分增加得慢,下凹部分增加得快 4°渐近线:y=0(Ox轴)为渐近线,无限接近但不相交 由 可得 由以上性质可见4个特征基本描述了曲线的特征,f(x)的特征均由μ,σ决定

74 §2.4 连续型随机变量及其概率密度 分布函数:不可积 标准正态分布:
当μ=0,σ=1时称X服从标准正态分布,其概率密度和分布函数分别用φ(x),Φ(x),记做X~N(0,12) φ(x)= ,-∞<x<∞,Φ(x)= Φ(x)是超越积分,为此人们编制了一张Φ(x)函数表,以供查用

75 §2.4 连续型随机变量及其概率密度 Φ(x)的性质:Φ(-x)=1-Φ(x) Φ(-x)= , 令t=-u,Φ(-x)= = =

76 §2.4 连续型随机变量及其概率密度 正态分布随机变量的标准化:线性变换 引理:若X~N(μ,σ2),则Z= ~N(0,1)
随机变量Z是随机变量X的函数,更一般情形留到第五节 证:先由分布函数的含义,由X的分布函数求随机变量Z的分布函数 F(z)=P{Zz}= P{ z}=P{Xμ+σz} 由X的分布函数有 = 令 =u,则dt=σdu,积分换限,而由t=μ+σu,及t的范围,得出u的范围 = =Φ(z) 所以Z= ~N(0,1)

77 §2.4 连续型随机变量及其概率密度 对于一般的正态分布随机变量可表示为标准正态分布的形式 于是若X~N(μ,σ2),则其分布函数
F(x)=P{Xx}=P{ }=Φ( ) 而标准正态函数可查表求值 对于任意的区间(x1,x2],有 P{x1<Xx2}= P{ }=Φ( )-Φ( ) 例:设X~N(1,4),求P{0<X1.6} 解:μ=1,σ=2 P{0<X1.6}=Φ((1.6-1)/2)-Φ((0-1)/2)=Φ(0.3)-Φ(-0.5) 查表及由标准正态分布函数的性质 =0.6179-[1-Φ(0.5)] =0.6179-1+0.6915=0.3094

78 §2.4 连续型随机变量及其概率密度 Matlab实验 (3) 正态分布
密度函数:f=normpdf(x,,) 分布函数:F=normcdf(x,,) 例: 画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求P(1<X<6). 在Matlab中输入以下命令: x=-5:0.1:6; y=normpdf(x,1,2); z=normcdf(x,1,2); plot(x,y,x,z) result=normcdf(6,1,2)-normcdf(1,1,2) Matlab实验

79 §2.4 连续型随机变量及其概率密度 Matlab实验 结果:Result =0.4938

80 §2.4 连续型随机变量及其概率密度 Matlab实验 例:在同一坐标下,画下列正态分布的密度函数图像
(1) μ=3, σ=0.5, 0.7, 1, 1.5, 2 (2) σ=0.5, μ=1,2,3,4 (1)命令: x=-6:0.1:6; y1=normpdf(x,3,0.5); y2=normpdf(x,3,0.7); y3=normpdf(x,3,1); y4=normpdf(x,3,1.5); y5=normpdf(x,3,2); plot(x,y1,‘.’,x,y2,‘+’,x,y3,‘*’,x,y4,‘d’,x,y5) Matlab实验

81

82

83 §2.4 连续型随机变量及其概率密度 3σ准则: 尽管正态变量X~N(μ,σ2)的取值范围是(-∞,∞),但X落在(μ-3σ,μ+3σ)内几乎是肯定的 1σ: P{μ-σ<Xμ+σ}=Φ(1)-Φ(-1)=0.6826 2σ:P{μ-2σ<Xμ+2σ}=Φ(2)-Φ(-2)=0.9544 3σ:P{μ-3σ<Xμ+3σ}=Φ(3)-Φ(-3)=0.9974 使得正态分布函数值的表只需要做到0到3.49即可,再大都近似为1 企业管理中,经常应用3--规则进行质量检查

84 §2.4 连续型随机变量及其概率密度 解:>> clear,clf %(标准)正态分布密度曲线下的面积 Matlab实验
例 正态分布参数μ和σ对变量x取值规律的约束——3σ准则 解:>> clear,clf %(标准)正态分布密度曲线下的面积 X=linspace(-5,5,100); Y=normpdf(X,0,1); yy=normpdf([-3,-2,-1,0,1,2,3],0,1); plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.') hold on plot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:') plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:') plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7), yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:') Matlab实验

85 §2.4 连续型随机变量及其概率密度 Matlab实验 hold off
text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') text(-3.2,-0.03,'\fontsize{10}μ-3σ') text(-2.2,-0.03,'\fontsize{10}μ-2σ') text(-1.2,-0.03,'\fontsize{10}μ-σ') text(-0.05,-0.03,'\fontsize{10}μ') text(0.8,-0.03,'\fontsize{10}μ+σ') text(1.8,-0.03,'\fontsize{10}μ+2σ') text(2.8,-0.03,'\fontsize{10}μ+3σ') Matlab实验

86

87 §2.4 连续型随机变量及其概率密度 例3:正态分布随机变量X~N(d,0.52) 解:(1)此时X~N(90,0.52)
若X>80的概率不低于0.99,问d至少为多少? 解:(1)此时X~N(90,0.52) P{X<89}=P{(X-90)/0.5<(89-90)/0.5} =Φ((89-90)/0.5)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228 (2) 0.99P{X80}= P{(X-d)/0.5(80-d)/0.5}=1-Φ((80-d)/0.5) 即Φ((80-d)/0.5)1-0.99=1-Φ(2.327)=Φ(-2.327) 以上用了反查表:由概率值求自变量取值,且变换为大于0.5的概率值才可查 又由分布函数的不减性知 (80-d)/0.5-2.327,故需d>

88 §2.4 连续型随机变量及其概率密度 关于上α分位点: 为了数理统计中的应用而引入
设X~N(0,1),若zα满足条件,P{Xzα}=α,0<α<1,则称点zα为标准正态分布的上α分位点。 性质:z1-α=-zα 注意上α分位点与正态分布函数表的关系

89 例 标准正态分布α分位数的概念图示。 解 >> %α分位数示意图(标准正态分布,α=0.05) clear,clf
例 标准正态分布α分位数的概念图示。 解 >> %α分位数示意图(标准正态分布,α=0.05) clear,clf data=normrnd(0,1,300,1); xalpha1=norminv(0.05,0,1); xalpha2=norminv(0.95,0,1); xalpha3=norminv(0.025,0,1); xalpha4=norminv(0.975,0,1); subplot(3,1,1) capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) subplot(3,1,2) capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) subplot(3,1,3) capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) hold on capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) hold off xalpha1 xalpha2 xalpha3 xalpha4

90 xalpha1 = xalpha2 = xalpha3 = xalpha4 =

91 §2.4 连续型随机变量及其概率密度 对数正态分布
一些正偏态资料的变量值,通过对数转换后,由偏态分布转为正态分布。某些正偏态资料,如血铅含量、某些传染病的潜伏期等,经对数变换后可符合正态分布。在金融、工程、医学、生物学等领域有广泛的应用  如果 X 是服从正态分布的随机变量,则 eX 服从对数正态分布;同样,如果 Y 服从对数正态分布,则 ln(Y) 服从正态分布。 如果一个变量可以看作是许多很小独立因子的乘积(与正态的多个很小独立因子的求和相对应),则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。

92 §2.4 连续型随机变量及其概率密度 函数及其相关的几种重要连续型分布介绍 函数  分布、 分布、Weibull分布
Г函数在概率分布中具有极其重要的地位 Г(s)= ,s>0,这是一个广义积分,不可积 重要的性质Г(s+1)=sГ(s),Г(1/2)= , 余元公式Г(s)Г(1-s)=π/sinsπ 当0<s<1时,Г(s)的值可查表求得,

93 §2.4 连续型随机变量及其概率密度 (1) Г分布 Г分布可记作:X~Г(α, β),等待第α件事发生所需要的等待时间
fX(x)= α>0,β>0 Г分布的可加性:X~Г(α1,β), Y~Г(α2,β),X和Y相互独立 则Z=X+Y~Г(α1+α2,β) 其中α是形状参数,决定曲线形状,β是尺度参数决定曲线的伸缩 Г分布与很多分布都有关系 当α =n/2, β =2时, Г分布即为自由度为n的2分布 当α =1时, Г分布即为参数为β的指数分布 当α =k+1 , β =1时, Г分布的表达式与泊松分布表达式的形式是一致的,但参数(即x)是连续的

94 §2.4 连续型随机变量及其概率密度 (2) β分布 β分布定义在区间(0, 1),可记作:X~Beta(α, β)
α>0,β>0 β分布与贝叶斯理论有联系,常用来描述取值在(0, 1)的概率模式, 比如描述由后验概率来查看抛硬币中使用硬币的不均匀度(正反面 可能不是等概出现) 当α =1, β =1时, β分布就是U(0, 1) 期望等于α /(α+β)

95 §2.4 连续型随机变量及其概率密度 Beta分布的曲线

96 §2.4 连续型随机变量及其概率密度 (3) 韦布尔分布(Weibull分布)
Weib(α, , b)分布:它是可靠性工程中广泛使用的一种连续性分布,常用来描述各种产品、材料疲劳失效的分布规律,如真空管的疲劳失效、机械轴承的疲劳失效等,该分布为三参数分布,其中α为形态参数,β为尺度参数,b为位置参数。当α=1,α>1,α<1时分别对应了某些产品(或材料)的偶发期故障(正常随机故障)、耗损期故障(老化严重故障多发期)和早发故障(新设备投入运行)三种形态的失效分布。考虑损耗衰老作用时比指数分布更准确 该分布由瑞典数学家W.Weibull是在对双参数指数分布 E1(1,b) 和Ray()的研究基础上综合推广而成。该分布同样在无线电信号分析和元器件可靠性分析中有重要应用

97 §2.4 连续型随机变量及其概率密度 概率密度表达式 xb, b0, m为正整数 令=α,带入则可得到概率密度的另一种表达式
当α=1时, Weib(1,,b)即双参数指数分布 E1(,b) 从上面的描述可知,指数分布只适用于浴盆曲线(指产品从投入到报废为止的整个寿命周期内)的底部,但任何产品都有早期故障,也总有耗损失效期。在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况

98 §2.5 随机变量的函数的分布 实际应用中,某些人们关心的随机变量Y往往不能直接测量得到,而它可能是某个能测量的随机变量的函数X 问题:
比如我们有时很关心圆柱轴截面的面积S,但无法直接获得,而我们能够获得圆柱轴截面的直径D,而随机变量S是随机变量D的函数,即S=(1/4)πD2 问题: 怎样由已知的随机变量X的概率分布求它的函数Y=g(X)的概率分布,其中g(•)是连续函数? 一般的步骤是什么?

99 §2.5 随机变量的函数的分布 例1:设随机变量X具有以下的分布律,试求Y=(X-1)2的分布律 解:首先获得Y的所有可能取值:0,1,4
pk 解:首先获得Y的所有可能取值:0,1,4 求解各取值的概率 P{Y=0}=P{(X-1)2=0}= P{X=1}=0.1 P{Y=1}=P{(X-1)2=1}= P{(X=0}+P{X=2}=0.7 P{Y=4}=P{(X-1)2=4}= P{(X=-1}=0.2 即得Y的分布律为 Y pk 对于离散型随机变量 P{Y=yk}等于所有满足yk=g(X)的X的取值的概率之和

100 §2.5 随机变量的函数的分布 例2:设随机变量X具有概率密度
求随机变量Y=2X+8的概率密度 解:分别记X,Y的分布函数为FX(x),FY(y),先求Y的分布函数FY(y) FY(y)=P{Yy} //由分布函数的含义 将Y=2X+8代入 =P{2X+8y} 表示为关于X的概率 =P{X(y-8)/2} 即 =FX((y-8)/2) 将FY(y)关于y求导得 fY(y)=dFY(y)/dy=dFX((y-8)/2)/dy = fX((y-8)/2)d((y-8)/2)/dy = 注意:代入时, fX的自变量及分段函数取值范围用g-1(y)来代

101 §2.5 随机变量的函数的分布 求连续型随机变量X的函数Y=g(X)的概率密度的一般步骤: 已知fX(x),Y=g(X),求fY(y)
1°先写出Y的分布函数定义式:FY(y)=P{Yy} 由Y=g(X)确定Y的值域,当y不在值域范围内时单独讨论 fY(y) 2°将Y=g(X)代入上式 =P{g(X)y} //在y的值域范围内讨论 3°由g(X)y求解X的范围 =P{X|g(X)y} 表示为y的形式 4°由X的分布函数FX(x)表示以上概率,得到关于y的表达式FY(y),其中FX(x)的自变量x用关于y的表达式来代。 5°求导得fY(y)=dFY(y)/dy,将fY(y)的所有可能的情况合并 掌握变上下限积分求导公式

102 §2.5 随机变量的函数的分布 例3:设随机变量X具有概率密度fX(x), -∞<x<∞,求Y=X2的概率密度
解:1°FY(y)=P{Yy}, 由Y=X20,当y0时,FY(y)=0 2°当y>0时,代入Y=X2得 FY(y)=P{Yy}=P{ X2y} 3° =P{ } 4°由FX(x)得 FY(y)= 5°fY(y)=dF(y)/dy=

103 §2.5 随机变量的函数的分布 在Y=g(X),且g(X)为严格单调函数时的一般结果
定理:设随机变量X具有概率密度fX(x),-∞<x<∞,又设函数g(x)处处可导且恒有g(x)>0(或g(x)<0),则Y= g(X)是连续型随机变量,其概率密度为 其中α=min{g(-∞),g(∞)}, β=max{g(-∞),g(∞)}, h(y)是g(x)的反函数

104 §2.5 随机变量的函数的分布 证:g(x)>0的情况 FY(y)=P{Yy}=P{g(X)y}
此时g(x)为单调增函数,所以h(y)也是单调增函数,且有y的取值范围为 α=g(-∞)yg(∞)=β, 因此当yα时,FY(y)=0; 当yβ时,FY(y)=1 当 αyβ时,FY(y)=P{Yy}=P{g(X)y} h(y)是单调增函数 =P{Xh(y)} = FX(h(y)) 求导fY(y)=dFY(y)/dy=dFX(h(y))/dy= g(x)<0的情况,此时h(y)<0 P{g(X)y}=P{Xh(y)}=1-FX(h(y)) fY(y)=dF(y)/dy=d[1-FX(h(y))]/dy= 两种情况合并即可得证

105 §2.5 随机变量的函数的分布 推广 分段单调函数的情况下,上述定理可进一步推广为下面形式
若fX(x)在有限区间[a,b]以外等于0,则只需假设在[a,b]上恒有g(x)>0(或g(x)<0),α=min{g(a),g(b)},β=max{g(a),g(b)},以上结论还成立 分段单调函数的情况下,上述定理可进一步推广为下面形式 假设g(x)在下面两个区间(a1,b1)和(a2,b2)分别是单调的函数,其中在(a1,b1)上的反函数为h1(y),在(a2,b2) 上的反函数为h2(y),且fX(x)在其它有限区间等于0,则有 fY(y)= 其中y的范围由g(x)确定 可参考教材中Y=X2的求解过程

106 §2.5 随机变量的函数的分布 例4:正态分布的随机变量的线性变换问题 证:X的概率密度为 所以有
已知随机变量X~N(μ,σ2),试证明X的线性函数Y=aX+b(a≠0)也服从正态分布。 证:X的概率密度为 f(x)= ,-∞<x<∞ 现在y=g(x)=ax+b,由这一式子解得x=h(y)=(y-b)/a,且有h(y)=1/a 显然g(x)是严格单调的,由定理有 fY(y)= ,-∞<y<∞ = = ,-∞<y<∞ 所以有 Y= aX+b~N(aμ+b,(aσ)2) 特别的当a=1/σ,b=-μ/σ时,Y=(X-μ)/σ=~N(0,1) 即上一节的引理的结果

107 §2.5 随机变量的函数的分布 思考: 设f(x)是连续函数,若X是离散型随机变量,则Y= f(x),也是离散型随机变量吗?若X为连续型又如何? 若X是离散型随机变量,它的取值是有限个或可列无限多个,因此Y的取值也是有限个或可列无限多个,因此Y是离散型随机变量 若X是连续型随机变量,则Y不一定是连续型随机变量,比如:

108 本章小结

109 作业 第一次: 第二次: 第三次: P55:2,4,5,8 P56:10,12,13, 17,21,24,26,29

110 Matlab实验作业 1. 已知二项分布Xb(18,0.2) 求: (1) 分布率和分布函数值,并画出曲线
(2) 求该分布的数学期望和方差 (3) 计算分布函数值为0.1,0.4,0.7时对应的x值 2. 对于正态分布: (1)给出N(2,9)的密度曲线和分布函数曲线 (2)在同一图上划出均值为2,标准差为0.5,0.7,1,2的密度曲线 (3)已知=0.05,求N(0,1)的上分位点,并与查表值比较.


Download ppt "第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全"

Similar presentations


Ads by Google