本幻灯片可在如下网站下载: www.appmath.cn www.应用数学.cn 概率论与数理统计第16讲 本幻灯片可在如下网站下载: www.appmath.cn www.应用数学.cn.

Slides:



Advertisements
Similar presentations
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
Advertisements

一、会求多元复合函数一阶偏导数 多元复合函数的求导公式 学习要求: 二、了解全微分形式的不变性.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
5.4 微 分 一、微分概念 二、微分的运算法则与公式 三、微分在近似计算上的应用. 引例 一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面 积的改变量为  A  (x 0 
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
1 概率论与数理统计第 9 讲 本幻灯片可在如下网站下载: www. 应用数学.cn.
3.4 空间直线的方程.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第3节 二次型与二次型的化简 一、二次型的定义 二、二次型的化简(矩阵的合同) 下页.
第三章 函数逼近 — 最佳平方逼近.
本幻灯片可在如下网站下载: 概率论与数理统计第15讲 本幻灯片可在如下网站下载:
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
恰当方程(全微分方程) 一、概念 二、全微分方程的解法.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第三节 协方差及相关系数 协方差 相关系数 课堂练习 小结 布置作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第十章 方差分析.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§8.3 不变因子 一、行列式因子 二、不变因子.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
§4.1数学期望.
第三章 线性方程组 §4 n维向量及其线性相关性(续7)
一元一次方程的解法(-).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

本幻灯片可在如下网站下载: www.appmath.cn www.应用数学.cn 概率论与数理统计第16讲 本幻灯片可在如下网站下载: www.appmath.cn www.应用数学.cn

二. 二元和多元正态分布

二元随机变量(X,Y)服从二元正态分布或二维正态分布,是指的它的联合概率密度函数f(x,y)是. f(x,y)=k0e-q(x,y). (5 二元随机变量(X,Y)服从二元正态分布或二维正态分布,是指的它的联合概率密度函数f(x,y)是 f(x,y)=k0e-q(x,y) (5.36) 的形式,其中q(x,y)是一个x,y的二次多项式, q(x,y)=ax2+by2+cxy+dx+ey+f 且这个二次多项式中的二次项ax2+by2+cxy对于任何不全为0的x,y值的代入都获得大于0的数值,这样的q(x,y)称之为正定二次型。

但是传统上总是将q(x,y)整理成容易看出(X,Y)的数字特征的如下形式:

在这种情况下为保证二元概率密度函数f(x,y)在全平面上的积分值为1的性质,则系数k0必须取如下值 在这种情况下将式(5. 37)和式(5

其中sX>0, sY>0, |r|<1。 定义 5. 8如果二元随机变量(X,Y)的概率密度函数如式(5 其中sX>0, sY>0, |r|<1。 定义 5.8如果二元随机变量(X,Y)的概率密度函数如式(5.39)所示,则称(X,Y)服从二元正态分布或二维正态分布,记作 。

后面我们将证明,二维随机变量的五个参数中,mX和 就是X的数学期望和方差,mY和 就是Y的数学期望和方差,而r则是X,Y的相关系数。 因此为了简化分析,就可以考虑将X和Y做标准化,令

定义 5.9如果随机变量(U,V)~N(0,0,1,1,r), 则称(U,V)服从标准二元正态分布,其概率密度函数为 因此标准二元正态分布只有一个参数r。

而由第三章的定理3. 5易证只要将服从一般二元正态分布的随机变量(X,Y)做式(5 而由第三章的定理3.5易证只要将服从一般二元正态分布的随机变量(X,Y)做式(5.40)的变换,则得到的(U,V)就服从标准二元正态分布,再由第4章的定理4.6,二元随机变量分别做正线性函数不改变相关系数的值。

下面我们只要证明标准二元正态分布的边缘分布是一元的标准正态分布,且相关系数就是参数r,则根据式(5

为了下面的证明的方便起见,将式(5. 41)指数上的分子的圆括号内的内容u2-2ruv+v2配平方为 为了下面的证明的方便起见,将式(5.41)指数上的分子的圆括号内的内容u2-2ruv+v2配平方为 u2-2ruv+v2=u2-2ruv+v2+(rv)2-(rv)2 =(u-rv)2+(1-r2)v2 (5.42) 则式(5.41)就写成

可以将上式分解成为两个因子相乘的形式为 上式左边的圆括号是自变量为v的标准正态分布概率密度函数的形式,而右边的圆括号如果固定住v视为u的函数,是正态分布N(rv, 1-r2)的概率密度表示式。因此右边的圆括号内对于u在整个实轴上的积分将等于1,如果乘上u再积分就得对应的数学期望rv, 下面的推导将利用这一点。

下面先求V的边缘概率密度函数 这就证明了V~N(0,1),

由式(5.41)看出U与V的对称性可知也有U~N(0,1)。这就说明了U和V确实是X,Y的标准化随机变量, 下面再证r就是U和V的相关系数,这对于标准化的随机变量只需要证明r=E(UV)即可,

上式最后一个等式利用了标准正态分布的方差是1的结果。因此我们就已经证明了参数r确实是(U,V)的进而也就是(X,Y)的相关系数。

从二元正态分布的概率密度的表示式(5.37)不难看出,二元正态随机变量(X,Y)相互独立的充分必要条件是它们的相关系数r或者协方差为0。因此对于正态分布的随机变量来说,不相关和独立是等价的。

下面讨论多元正态分布的随机变量,简称为多元正态随机变量。 首先确定,n(n2)个相互独立的服从一元正态分布的随机变量X1,X2,⋯,Xn合在一起构成n元正态随机变量。但并不仅仅如此,还有其他类型的正态随机变量。

先给出线性组合的概念,假设X1,X2,⋯,Xn是由m个随机变量Y1,Y2,⋯,Ym按下式得到: 先给出线性组合的概念,假设X1,X2,⋯,Xn是由m个随机变量Y1,Y2,⋯,Ym按下式得到: X1=a11Y1+a12Y2+⋯+a1mYm, X2=a21Y1+a22Y2+…+a2mYm …… Xn=an1Y1+an2Y2+…+anmYm 则称(X1,⋯,Xn)是(Y1,…,Ym)的一个线性组合。或者称X1,X2,⋯,Xn可被Y1,Y2,⋯,Ym线性表示。

定义 5.10设n个随机变量X1,⋯,Xn可表示为m个相互独立的正态分布的随机变量Y1,Y2,⋯,Ym的线性组合,则称X1,⋯, Xn服从广义正态分布。 广义正态分布并不是正态分布,是因为X1,⋯,Xn中有可能存在着线性函数的关系,比如说,X3=2X1-X2这样的关系,一旦有这种情况出现,则X1,⋯,Xn就不是连续型的随机变量,因为不借助于单位脉冲函数就无法用概率密度函数来描述它们的分布。

定义 5.11如果X1,⋯,Xn服从广义正态分布,且它们是连续型的随机变量,则称X1,⋯,Xn服从正态分布。

对于服从广义正态分布的随机变量X1,⋯,Xn,如果能够从其中找到r个随机变量 是连续型的随机变量,且有: 或者r=n, 或者再加入这n个随机变量中的任何一个其他的变量后得到的r+1个随机变量都将不是连续型随机变量 则称这r个随机变量为一个最大无关组。

服从广义正态分布的随机变量X1,⋯,Xn可以有不同的最大无关组,但是它们的个数一定是一样的,证明这一点需要有线性代数的知识,因此这里不证。因此,这个最大无关组的个数r被称为这n个广义正态分布的随机变量的秩,或者用统计学的术语,也叫自由度。

自由度为r的服从广义正态分布的随机变量X1,⋯,Xn一定可以被r个相互独立的服从正态分布的随机变量Y1,⋯,Yr线性表示。证明这一点都需要有线性代数的知识而超出本书的范围。 这里不打算给出n维正态分布的随机变量的概率密度的公式,因为要给出线性代数的记号,这超出了本书的范围。但是应当知道,n维正态分布完全由每个随机变量的均值和方差,及两两之间的协方差或者相关系数所确定。

例 5.12已知随机变量X1,Y1相互独立且服从N(0,1),而随机变量X,Y满足X=2X1-Y1, Y=X1+Y1, 试求(X,Y)的概率密度函数f(x,y)。 解 因为X与Y相互独立,所以它们服从二元正态分布。且有 E(X)=E(2X1-Y1)=2E(X1)-E(Y1)=0 E(Y)=E(X1+Y1)=E(X1)+E(Y1)=0 D(X)=D(2X1-Y1)=4D(X1)+D(Y1)=5 D(Y)=D(X1+Y1)=D(X1)+D(Y1)=2

因此 cov(X,Y)=E(XY)-E(X)E(Y)=1 X与Y的相关系数r为 将这些参数代入到式(5.39)得

用应用数学家园在线计算的绘制二元函数曲面的功能,绘制出此概率密度函数的曲面图形如图 5‑5所示,相应的函数字串为1/(6. p) 用应用数学家园在线计算的绘制二元函数曲面的功能,绘制出此概率密度函数的曲面图形如图 5‑5所示,相应的函数字串为1/(6*p)*e^(-5/9*(x^2/5-1/5*x*y+y^2/2))

图5-5

在距离xOy平面高度为0. 02处用一平面截断后(相应的函数字串为min(1/(6. p). e^(-5/9. (x^2/5-1/5. x 在距离xOy平面高度为0.02处用一平面截断后(相应的函数字串为min(1/(6*p)*e^(-5/9*(x^2/5-1/5*x*y+y^2/2)),0.02))的图形如图 5‑6所示,注意这样截出来的顶部平面是一个椭圆,当相关系数不为0时,这个椭圆的长短轴是不与x轴和y轴平行的。

图5-6

5.7 2分布

在前面我们已经介绍过了G分布,而如果G分布中的l参数是1/2, r参数是n/2,n为正整数时,被称之为c2分布。而因为c2分布在数理统计中占据着极为重要的角色,所以需要进一步介绍一些它的性质。 将c2分布的概率密度函数再写在下面

当随机变量X的概率密度如式(5. 44)所示时,称X服从自由度为n的c2分布,记作X~c2(n)。 式(5 当随机变量X的概率密度如式(5.44)所示时,称X服从自由度为n的c2分布,记作X~c2(n)。 式(5.44)倒不需要去花功夫背诵,最重要的是c2分布与正态分布之间的关系。

定理 5. 8 设随机变量X~N(0,1), Y=X2, 则Y~c2 (1), 且有E(Y)=1, D(Y)=2 定理 5.8 设随机变量X~N(0,1), Y=X2, 则Y~c2 (1), 且有E(Y)=1, D(Y)=2. 证 因X~N(0,1), 则X的概率密度函数为 由第2章的式(2.35),并考虑到fX(x)为偶函数, 得Y的概率密度为

所以Y~c2(1). 而c2分布其实又是G分布,又有 ,根据式(5.28),有

定理 5.9 设随机变量X1,X2,…,Xn相互独立且都服从N(0,1),则 且有E(Y)=n, D(Y)=2n。

证 由定理 5. 8,知 , i=1,2,…,n, 且由X1,X2,…,Xn相互独立,则 也相互独立,根据定理 5. 4的推论可得 即式(5 证 由定理 5.8,知 , i=1,2,…,n, 且由X1,X2,…,Xn相互独立,则 也相互独立,根据定理 5.4的推论可得 即式(5.45)成立。而根据数学期望和方差的性质和定理 5.8的推论,可得E(Y)=n, D(Y)=2n。 证毕。

因此今后都可以将服从c2(n)分布的随机变量视为由n个相互独立的服从标准正态分布的随机变量的平方和,这也是n被称为自由度的原因。

定理 5.10 设随机变量Y1,Y2,…,Ym相互独立,Yi~c2 (ni), i=1,2,…,m, 则 Y1+Y2+…+Ym~c2 (n1+n2+…+nm). 证 根据定理 5.9即得结论。证毕。 由此定理,也可以随时将服从c2分布的随机变量视为由若干个自由度不同的服从c2分布的相互独立的随机变量相加构成。 c2分布的概率密度图形如图 5‑7所示

f(x) n=6 n=2 n=4 n=1 n=11 2 4 6 8 10 12 14 0.10 0.20 0.30 0.40 x O 图5-7

有关c2分布的计算可以到《应用数学家园》网站的c2分布在线计算功能进行计算,可以计算的有分布函数和反函数的值,更经常的则是上a分位数。

例 5. 13 已经X~c2(6), 求P{X<10}, 求数x使P{X>x}=0. 025 例 5.13 已经X~c2(6), 求P{X<10}, 求数x使P{X>x}=0.025. 解 进入应用数学家园网站的c2分布计算网页,选择“计算分布函数的值”选项,在下面的自由度n=右边的编辑框输入6, 在x=后面输入10,单击“开始计算”按钮,就可以看到答案P{X<10}=0.875348. 然后选择“计算上a分位点”选项,在下面输入自由度n的值为6,a的值为0.025, 单击“开始计算”按钮,就可以看到答案x=14.4494。

5.8 t分布

定义 5.12 如果随机变量X的概率密度函数f(x)为 则称X服从具有n个自由度的t分布,上式中的k是常数,是为的保证 的,可以证明

不同自由度的t分布的概率密度函数曲线如图 5‑8所示 图5-8

t分布也称为学生分布,从图 5‑8中可以看出t分布的形状很象标准正态分布。根据式(5 t分布也称为学生分布,从图 5‑8中可以看出t分布的形状很象标准正态分布。根据式(5.46)也不难看出当n趋于无穷大时,t分布确实趋向于标准正态分布。 关于t分布,式(5.46)的概率密度函数形式其实不重要,也不必背诵它们,最重要的是t分布满足如下定理。限于篇幅这个定理我们不证。

定理 5.11 设两个随机变量X与Y相互独立,并且X~N(0,1), Y~c2(n), 则 推论 设n+1个随机变量X0,X1,X2,…,Xn相互独立且都服从标准正态分布N(0,1),则

定理 5.11和它的推论是需要牢记并且能够灵活应用的,可以看成是t分布的构成。 应用数学家园网站的在线计算中提供的“t分布”计算网页可以在线进行t分布的有关计算。

例 5. 14 已知随机变量X~t(8), 求P{X<2}, 并求x的值使得P{X>x}=0 例 5.14 已知随机变量X~t(8), 求P{X<2}, 并求x的值使得P{X>x}=0.025。 解 在“t分布”的计算网页上选取“分布函数”选项,然后在下方的编辑框中输入n=8, x=2, 单击“开始计算”按钮,就可以得到P{X<2}=0.959742。再选择“上a分位点”选项,然后在下方的编辑框中输入n=8, a=0.025后单击“开始计算”按钮,就可以求出当x=2.306时,P{X>2.306}=0.025或者说X的上0.025分位点x0.025=2.306。

5.9 F分布

定义 5.13 设随机变量X的概率密度函数f(x)为 则称X服从第一个自由度为n1, 第二个自由度为n2的F分布,记作X~F(n1,n2)。

式中的常数k是为的使 的常数因子,且有

定理 5.12 设随机变量X~c2(n1), Y~c2(n2), 则

推论 设n1+n2个随机变量 相互独立且都服从标准正态分布N(0,1), 则 F分布的概率密度函数曲线如图 5‑9所示。

图5.9

应用数学家园网站在线计算中的“F分布”功能提供了常用的有关F分布的计算。

例 5. 15 设X~F(10,15), 求概率P{X<1. 5}, 求x使得P{X>x}=0 例 5.15 设X~F(10,15), 求概率P{X<1.5}, 求x使得P{X>x}=0.05。 解 在“F分布”的计算网页上选择计算分布函数的值选项,然后在下面的编辑框中输入两个自由度n1=10, n2=15, 及x的值1.5,然后单击“开始计算”按钮,就可算得P{X<1.5}=0.768555,再选择计算上a分布点功能,输入n1=10, n2=15, 及概率值a=0.05, 单击“开始计算”按钮,就可算出x=2.54372, 即有P{X>2.54372}=0.05, 或者说X的上0.05分位数为x0.05=2.54372。

作业: 第36页开始 第13,14,15,16,17,18题