Download presentation
Presentation is loading. Please wait.
Published by锁计 季 Modified 7年之前
1
本幻灯片可在如下网站下载: www.appmath.cn www.应用数学.cn
概率论与数理统计第16讲 本幻灯片可在如下网站下载:
2
二. 二元和多元正态分布
3
二元随机变量(X,Y)服从二元正态分布或二维正态分布,是指的它的联合概率密度函数f(x,y)是. f(x,y)=k0e-q(x,y). (5
二元随机变量(X,Y)服从二元正态分布或二维正态分布,是指的它的联合概率密度函数f(x,y)是 f(x,y)=k0e-q(x,y) (5.36) 的形式,其中q(x,y)是一个x,y的二次多项式, q(x,y)=ax2+by2+cxy+dx+ey+f 且这个二次多项式中的二次项ax2+by2+cxy对于任何不全为0的x,y值的代入都获得大于0的数值,这样的q(x,y)称之为正定二次型。
4
但是传统上总是将q(x,y)整理成容易看出(X,Y)的数字特征的如下形式:
5
在这种情况下为保证二元概率密度函数f(x,y)在全平面上的积分值为1的性质,则系数k0必须取如下值 在这种情况下将式(5. 37)和式(5
6
其中sX>0, sY>0, |r|<1。 定义 5. 8如果二元随机变量(X,Y)的概率密度函数如式(5
其中sX>0, sY>0, |r|<1。 定义 5.8如果二元随机变量(X,Y)的概率密度函数如式(5.39)所示,则称(X,Y)服从二元正态分布或二维正态分布,记作 。
7
后面我们将证明,二维随机变量的五个参数中,mX和 就是X的数学期望和方差,mY和 就是Y的数学期望和方差,而r则是X,Y的相关系数。 因此为了简化分析,就可以考虑将X和Y做标准化,令
8
定义 5.9如果随机变量(U,V)~N(0,0,1,1,r), 则称(U,V)服从标准二元正态分布,其概率密度函数为 因此标准二元正态分布只有一个参数r。
9
而由第三章的定理3. 5易证只要将服从一般二元正态分布的随机变量(X,Y)做式(5
而由第三章的定理3.5易证只要将服从一般二元正态分布的随机变量(X,Y)做式(5.40)的变换,则得到的(U,V)就服从标准二元正态分布,再由第4章的定理4.6,二元随机变量分别做正线性函数不改变相关系数的值。
10
下面我们只要证明标准二元正态分布的边缘分布是一元的标准正态分布,且相关系数就是参数r,则根据式(5
11
为了下面的证明的方便起见,将式(5. 41)指数上的分子的圆括号内的内容u2-2ruv+v2配平方为
为了下面的证明的方便起见,将式(5.41)指数上的分子的圆括号内的内容u2-2ruv+v2配平方为 u2-2ruv+v2=u2-2ruv+v2+(rv)2-(rv)2 =(u-rv)2+(1-r2)v2 (5.42) 则式(5.41)就写成
12
可以将上式分解成为两个因子相乘的形式为 上式左边的圆括号是自变量为v的标准正态分布概率密度函数的形式,而右边的圆括号如果固定住v视为u的函数,是正态分布N(rv, 1-r2)的概率密度表示式。因此右边的圆括号内对于u在整个实轴上的积分将等于1,如果乘上u再积分就得对应的数学期望rv, 下面的推导将利用这一点。
13
下面先求V的边缘概率密度函数 这就证明了V~N(0,1),
14
由式(5.41)看出U与V的对称性可知也有U~N(0,1)。这就说明了U和V确实是X,Y的标准化随机变量, 下面再证r就是U和V的相关系数,这对于标准化的随机变量只需要证明r=E(UV)即可,
16
上式最后一个等式利用了标准正态分布的方差是1的结果。因此我们就已经证明了参数r确实是(U,V)的进而也就是(X,Y)的相关系数。
17
从二元正态分布的概率密度的表示式(5.37)不难看出,二元正态随机变量(X,Y)相互独立的充分必要条件是它们的相关系数r或者协方差为0。因此对于正态分布的随机变量来说,不相关和独立是等价的。
18
下面讨论多元正态分布的随机变量,简称为多元正态随机变量。 首先确定,n(n2)个相互独立的服从一元正态分布的随机变量X1,X2,⋯,Xn合在一起构成n元正态随机变量。但并不仅仅如此,还有其他类型的正态随机变量。
19
先给出线性组合的概念,假设X1,X2,⋯,Xn是由m个随机变量Y1,Y2,⋯,Ym按下式得到:
先给出线性组合的概念,假设X1,X2,⋯,Xn是由m个随机变量Y1,Y2,⋯,Ym按下式得到: X1=a11Y1+a12Y2+⋯+a1mYm, X2=a21Y1+a22Y2+…+a2mYm …… Xn=an1Y1+an2Y2+…+anmYm 则称(X1,⋯,Xn)是(Y1,…,Ym)的一个线性组合。或者称X1,X2,⋯,Xn可被Y1,Y2,⋯,Ym线性表示。
20
定义 5.10设n个随机变量X1,⋯,Xn可表示为m个相互独立的正态分布的随机变量Y1,Y2,⋯,Ym的线性组合,则称X1,⋯, Xn服从广义正态分布。 广义正态分布并不是正态分布,是因为X1,⋯,Xn中有可能存在着线性函数的关系,比如说,X3=2X1-X2这样的关系,一旦有这种情况出现,则X1,⋯,Xn就不是连续型的随机变量,因为不借助于单位脉冲函数就无法用概率密度函数来描述它们的分布。
21
定义 5.11如果X1,⋯,Xn服从广义正态分布,且它们是连续型的随机变量,则称X1,⋯,Xn服从正态分布。
22
对于服从广义正态分布的随机变量X1,⋯,Xn,如果能够从其中找到r个随机变量 是连续型的随机变量,且有: 或者r=n, 或者再加入这n个随机变量中的任何一个其他的变量后得到的r+1个随机变量都将不是连续型随机变量 则称这r个随机变量为一个最大无关组。
23
服从广义正态分布的随机变量X1,⋯,Xn可以有不同的最大无关组,但是它们的个数一定是一样的,证明这一点需要有线性代数的知识,因此这里不证。因此,这个最大无关组的个数r被称为这n个广义正态分布的随机变量的秩,或者用统计学的术语,也叫自由度。
24
自由度为r的服从广义正态分布的随机变量X1,⋯,Xn一定可以被r个相互独立的服从正态分布的随机变量Y1,⋯,Yr线性表示。证明这一点都需要有线性代数的知识而超出本书的范围。 这里不打算给出n维正态分布的随机变量的概率密度的公式,因为要给出线性代数的记号,这超出了本书的范围。但是应当知道,n维正态分布完全由每个随机变量的均值和方差,及两两之间的协方差或者相关系数所确定。
25
例 5.12已知随机变量X1,Y1相互独立且服从N(0,1),而随机变量X,Y满足X=2X1-Y1, Y=X1+Y1, 试求(X,Y)的概率密度函数f(x,y)。 解 因为X与Y相互独立,所以它们服从二元正态分布。且有 E(X)=E(2X1-Y1)=2E(X1)-E(Y1)=0 E(Y)=E(X1+Y1)=E(X1)+E(Y1)=0 D(X)=D(2X1-Y1)=4D(X1)+D(Y1)=5 D(Y)=D(X1+Y1)=D(X1)+D(Y1)=2
26
因此 cov(X,Y)=E(XY)-E(X)E(Y)=1 X与Y的相关系数r为 将这些参数代入到式(5.39)得
27
用应用数学家园在线计算的绘制二元函数曲面的功能,绘制出此概率密度函数的曲面图形如图 5‑5所示,相应的函数字串为1/(6. p)
用应用数学家园在线计算的绘制二元函数曲面的功能,绘制出此概率密度函数的曲面图形如图 5‑5所示,相应的函数字串为1/(6*p)*e^(-5/9*(x^2/5-1/5*x*y+y^2/2))
28
图5-5
29
在距离xOy平面高度为0. 02处用一平面截断后(相应的函数字串为min(1/(6. p). e^(-5/9. (x^2/5-1/5. x
在距离xOy平面高度为0.02处用一平面截断后(相应的函数字串为min(1/(6*p)*e^(-5/9*(x^2/5-1/5*x*y+y^2/2)),0.02))的图形如图 5‑6所示,注意这样截出来的顶部平面是一个椭圆,当相关系数不为0时,这个椭圆的长短轴是不与x轴和y轴平行的。
30
图5-6
31
5.7 2分布
32
在前面我们已经介绍过了G分布,而如果G分布中的l参数是1/2, r参数是n/2,n为正整数时,被称之为c2分布。而因为c2分布在数理统计中占据着极为重要的角色,所以需要进一步介绍一些它的性质。 将c2分布的概率密度函数再写在下面
33
当随机变量X的概率密度如式(5. 44)所示时,称X服从自由度为n的c2分布,记作X~c2(n)。 式(5
当随机变量X的概率密度如式(5.44)所示时,称X服从自由度为n的c2分布,记作X~c2(n)。 式(5.44)倒不需要去花功夫背诵,最重要的是c2分布与正态分布之间的关系。
34
定理 5. 8 设随机变量X~N(0,1), Y=X2, 则Y~c2 (1), 且有E(Y)=1, D(Y)=2
定理 5.8 设随机变量X~N(0,1), Y=X2, 则Y~c2 (1), 且有E(Y)=1, D(Y)=2. 证 因X~N(0,1), 则X的概率密度函数为 由第2章的式(2.35),并考虑到fX(x)为偶函数, 得Y的概率密度为
35
所以Y~c2(1). 而c2分布其实又是G分布,又有 ,根据式(5.28),有
36
定理 5.9 设随机变量X1,X2,…,Xn相互独立且都服从N(0,1),则 且有E(Y)=n, D(Y)=2n。
37
证 由定理 5. 8,知 , i=1,2,…,n, 且由X1,X2,…,Xn相互独立,则 也相互独立,根据定理 5. 4的推论可得 即式(5
证 由定理 5.8,知 , i=1,2,…,n, 且由X1,X2,…,Xn相互独立,则 也相互独立,根据定理 5.4的推论可得 即式(5.45)成立。而根据数学期望和方差的性质和定理 5.8的推论,可得E(Y)=n, D(Y)=2n。 证毕。
38
因此今后都可以将服从c2(n)分布的随机变量视为由n个相互独立的服从标准正态分布的随机变量的平方和,这也是n被称为自由度的原因。
39
定理 5.10 设随机变量Y1,Y2,…,Ym相互独立,Yi~c2 (ni), i=1,2,…,m, 则 Y1+Y2+…+Ym~c2 (n1+n2+…+nm). 证 根据定理 5.9即得结论。证毕。 由此定理,也可以随时将服从c2分布的随机变量视为由若干个自由度不同的服从c2分布的相互独立的随机变量相加构成。 c2分布的概率密度图形如图 5‑7所示
40
f(x) n=6 n=2 n=4 n=1 n=11 2 4 6 8 10 12 14 0.10 0.20 0.30 0.40 x O 图5-7
41
有关c2分布的计算可以到《应用数学家园》网站的c2分布在线计算功能进行计算,可以计算的有分布函数和反函数的值,更经常的则是上a分位数。
42
例 5. 13 已经X~c2(6), 求P{X<10}, 求数x使P{X>x}=0. 025
例 5.13 已经X~c2(6), 求P{X<10}, 求数x使P{X>x}= 解 进入应用数学家园网站的c2分布计算网页,选择“计算分布函数的值”选项,在下面的自由度n=右边的编辑框输入6, 在x=后面输入10,单击“开始计算”按钮,就可以看到答案P{X<10}= 然后选择“计算上a分位点”选项,在下面输入自由度n的值为6,a的值为0.025, 单击“开始计算”按钮,就可以看到答案x= 。
43
5.8 t分布
44
定义 5.12 如果随机变量X的概率密度函数f(x)为 则称X服从具有n个自由度的t分布,上式中的k是常数,是为的保证 的,可以证明
45
不同自由度的t分布的概率密度函数曲线如图 5‑8所示
图5-8
46
t分布也称为学生分布,从图 5‑8中可以看出t分布的形状很象标准正态分布。根据式(5
t分布也称为学生分布,从图 5‑8中可以看出t分布的形状很象标准正态分布。根据式(5.46)也不难看出当n趋于无穷大时,t分布确实趋向于标准正态分布。 关于t分布,式(5.46)的概率密度函数形式其实不重要,也不必背诵它们,最重要的是t分布满足如下定理。限于篇幅这个定理我们不证。
47
定理 5.11 设两个随机变量X与Y相互独立,并且X~N(0,1), Y~c2(n), 则 推论 设n+1个随机变量X0,X1,X2,…,Xn相互独立且都服从标准正态分布N(0,1),则
48
定理 5.11和它的推论是需要牢记并且能够灵活应用的,可以看成是t分布的构成。 应用数学家园网站的在线计算中提供的“t分布”计算网页可以在线进行t分布的有关计算。
49
例 5. 14 已知随机变量X~t(8), 求P{X<2}, 并求x的值使得P{X>x}=0
例 5.14 已知随机变量X~t(8), 求P{X<2}, 并求x的值使得P{X>x}=0.025。 解 在“t分布”的计算网页上选取“分布函数”选项,然后在下方的编辑框中输入n=8, x=2, 单击“开始计算”按钮,就可以得到P{X<2}= 。再选择“上a分位点”选项,然后在下方的编辑框中输入n=8, a=0.025后单击“开始计算”按钮,就可以求出当x=2.306时,P{X>2.306}=0.025或者说X的上0.025分位点x0.025=2.306。
50
5.9 F分布
51
定义 5.13 设随机变量X的概率密度函数f(x)为 则称X服从第一个自由度为n1, 第二个自由度为n2的F分布,记作X~F(n1,n2)。
52
式中的常数k是为的使 的常数因子,且有
53
定理 5.12 设随机变量X~c2(n1), Y~c2(n2), 则
54
推论 设n1+n2个随机变量 相互独立且都服从标准正态分布N(0,1), 则 F分布的概率密度函数曲线如图 5‑9所示。
55
图5.9
56
应用数学家园网站在线计算中的“F分布”功能提供了常用的有关F分布的计算。
57
例 5. 15 设X~F(10,15), 求概率P{X<1. 5}, 求x使得P{X>x}=0
例 5.15 设X~F(10,15), 求概率P{X<1.5}, 求x使得P{X>x}=0.05。 解 在“F分布”的计算网页上选择计算分布函数的值选项,然后在下面的编辑框中输入两个自由度n1=10, n2=15, 及x的值1.5,然后单击“开始计算”按钮,就可算得P{X<1.5}= ,再选择计算上a分布点功能,输入n1=10, n2=15, 及概率值a=0.05, 单击“开始计算”按钮,就可算出x= , 即有P{X> }=0.05, 或者说X的上0.05分位数为x0.05= 。
58
作业: 第36页开始 第13,14,15,16,17,18题
Similar presentations