第四章随机变量的数字特征主讲教师：董庆宽副教授研究方向：密码学与信息安全

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.6 隐函数微分法第二章第二章二、高阶导数一、隐式定义的函数三、可微函数的有理幂. 一、隐函数的导数若由方程可确定 y 是 x 的函数, 由表示的函数, 称为显函数. 例如, 可确定显函数可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此隐函数求导方法.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

第四章随机变量的数字特征随机变量的分布是对随机变量的一种完整的描述，知道随机变量的分布就全都知道随机变量的所有特征。然后随机变量的概率分布往往不容易求得的。随机变量的这些统计特征通常用数字表示的。这些用来描述随机变量统计性的数字称为随机变量的数字特征。其中最重要的是数学期望（均值）和方差二种。

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

一、二阶行列式的引入用消元法解二元线性方程组. 一、二阶行列式的引入用消元法解二元线性方程组.

第三章函数逼近 — 最佳平方逼近.

《高等数学》（理学）常数项级数的概念袁安锋

第四章随机变量的数字特征主讲教师：董庆宽副教授研究方向：密码学与信息安全

例题教学目的: 微积分基本公式教学重点: 牛顿----莱布尼兹公式教学难点: 变上限积分的性质与应用.

一、原函数与不定积分二、不定积分的几何意义三、基本积分公式及积分法则四、牛顿—莱布尼兹公式五、小结

第四章定积分及其应用 4.3 定积分的概念与性质微积分基本公式定积分的换元积分法与分部积分法 4.5 广义积分

第四章　函数的积分学第六节　微积分的基本公式一、变上限定积分二、微积分的基本公式.

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第三节协方差及相关系数协方差相关系数课堂练习小结布置作业.

第四章一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

主要内容 § 3.1 多维随机变量及联合分布联合分布函里数联合分布律联合概率密度 § 3.2 二维随机变量的边缘分布

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第二章　导数与微分第二节　函数的微分法一、导数的四则运算二、复合函数的微分法.

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第四章随机变量的数字特征第一节数学期望第二节方差第三节协方差及相关系数第四节矩、协方差矩阵.

第5章 §5.3 定积分的积分法换元积分法不定积分分部积分法换元积分法定积分分部积分法.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

例1 ：甲击中的环数； X ：乙击中的环数； Y 平较高？试问哪一个人的射击水：的射击水平由下表给出甲、乙两人射击，他们

在前面的课程中，我们讨论了随机变量及其分布，如果知道了随机变量X的概率分布，那么X的全部概率特征也就知道了.

本次课讲授：第二章第十一节，第十二节，第三章第一节，下次课讲第三章第二节，第三节，第四节；下次上课时交作业P29—P30

计算机数学基础主讲老师: 邓辉文.

§2 求导法则 2.1 求导数的四则运算法则下面分三部分加以证明, 并同时给出相应的推论和例题 .

概率统计主讲教师叶宏山东大学数学院.

连续型随机变量及其概率密度一、概率密度的概念与性质二、常见连续型随机变量的分布三、小结.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

实数与向量的积.

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

应用概率统计主讲:刘剑平.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

第四章随机变量的数字特征我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便. 已知一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种的母鸡的年产蛋量,通常只要比较这两个品种的母鸡的年产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高.如果不去比较它们的平均值,而只看它们的分布列,虽然全面,却使人不得要领,既难以掌握,又难以迅速地作出判断.

正切函数的图象和性质周期函数定义：一般地，对于函数 (x),如果存在一个非零常数T，使得当x取定义域内的每一个值时，都有

第16讲相似矩阵与方阵的对角化主要内容： 1.相似矩阵 2. 方阵的对角化.

§8.3 不变因子一、行列式因子二、不变因子.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

概率统计主讲教师叶宏山东大学数学院.

第一节不定积分的概念与性质一、原函数与不定积分的概念二、不定积分的几何意义三、基本积分表四、不定积分的性质五、小结思考题.

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

第4课时绝对值.

学习任务三偏导数结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.

第三章多维随机变量及其分布第一节二维随机变量第二节边缘分布第三节条件分布第四节相互独立的随机变量

第四节随机变量函数的概率分布 X 是分布已知的随机变量，g ( · ) 是一个已知的连续函数，如何求随机变量 Y =g(X ) 的分布？

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

§2 方阵的特征值与特征向量.

难点：连续变量函数分布与二维连续变量分布

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

定义5 把矩阵 A 的行换成同序数的列得到的矩阵,

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

第四章　函数的积分学第七节　定积分的换元积分法　　　与分部积分法一、定积分的换元积分法二、定积分的分部积分法.

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

三角三角三角函数余弦函数的图象和性质.

§4.1数学期望.

Presentation transcript:

第四章随机变量的数字特征主讲教师：董庆宽副教授研究方向：密码学与信息安全电子邮件：qkdong@xidian.edu.cn 本科生必修课：概率论与数理统计第四章随机变量的数字特征主讲教师：董庆宽副教授研究方向：密码学与信息安全电子邮件：qkdong@xidian.edu.cn 个人主页：http://web.xidian.edu.cn/qkdong/

第四章随机变量的数字特征 §4.1 数学期望 §4.2 方差 §4.3 协方差及相关系数 §4.4 矩、协方差矩阵

§4.1 数学期望概率分布虽然能够完整的描述随机变量的统计特征，但有时对于我们关系的问题而言却不直观。如：研究水稻品种时，常关注的是稻穗的平均稻谷粒数，这从稻谷粒数的分布函数是不能直接看出来的，而且在实际生产中可能只关心该平均值，甚至不关心分布函数。一篮球队上场比赛的运动员身高是一随机变量，常关心平均身高研究信道上的随机噪声时，出于热噪声功率对系统可能产生较大影响的考虑，对噪声的均值很关心，而且还关心噪声电压的大小与噪声电压的均值的偏离程度。这两个量在实际系统中往往比知道随机变量的分布更重要本章重点讨论数学期望，方差，相关系数，矩等

§4.1 数学期望实例：一射手进行打靶练习，规定以X记每次射击得分数，则X的分布律如下： X 0 1 2 pk p0 p1 p2 打中区域e0得0分打中区域e1得1分打中区域e2得2分以X记每次射击得分数，则X的分布律如下： X 0 1 2 pk p0 p1 p2

§4.1 数学期望考察每次射击的平均得分数？射击N次，其中得0分有a0次，得1分有a1次，得2分有a2次即N＝a0＋a1＋a2 这是有限次实验的算术平均值，其中是事件P{X=k}的频率。当N→∞时，无限的接近一个稳定的常数pk，即事件P{X=k}发生的概率也就是说，当N→∞时，算术平均值 → 一个稳定的常数值，就把该值称为随机变量X的数学期望或均值Expectation

§4.1 数学期望定义设离散型随机变量X的分布律为 P{X=xk}＝pk，k＝1,2,… 若级数绝对收敛，则称级数的和为随机变量X的数学期望，记为E(X)，即E(X)＝设连续型随机变量X的概率密度为f(x)，若积分绝对收敛，则称积分的值为随机变量X的数学期望，记为E(X)，

§4.1 数学期望数学期望简称期望，又称为均值物理意义质心的概念：可以把物体的质量看作是集中在一点处，如果一条直线的质量线密度为f(x)，x为直线上任一质点的坐标，那么直线的质心的位置xc＝？ xc＝ / 现在如果f(x)是概率密度，则 xc＝ / ＝ /1 即xc＝E(X)，数学期望相当于质心的坐标

§4.1 数学期望 E(X)是实数而非变量，它是一种加权平均，与一般变量的算术平均值不同。大量试验的算术平均值趋近于期望只有级数的和或广义积分的值存在，数学期望才有意义，而有时是不存在的注意绝对收敛与条件收敛的区别，某些交错级数是条件收敛的，其和可能不为一，因此期望不存在。如果一个数项级数{un}的各项取绝对值后满足收敛，则称数项级数{un}绝对收敛，相应的如果绝对值的积分收敛，则绝对收敛数学期望E(X)完全由随机变量X的概率分布所确定若X服从某一分布，也称E(X)为这一分布的数学期望，比如二项分布，均匀分布等的数学期望

§4.1 数学期望例设随机变量 X服从柯西分布,其密度函数为求E(X). 解: 由于积分因此柯西分布的数学期望不存在.

§4.1 数学期望例：甲乙两人打靶，所得分数X和Y分布律为 X 0 1 2 Y 0 1 2 pk 0 0.2 0.8 pk 0.6 0.3 0.1 试评定它们成绩的好坏解主要看多次射击的得分均值，即数学期望，离散型：E(X)＝ E(X)＝0×0＋1×0.2＋2×0.8=1.8分 E(Y)＝0×0.6＋1×0.3＋2×0.1=0.5分所以乙的成绩远不如甲的成绩

§4.1 数学期望例2 有两个相互独立工作的电子装置，寿命X1和X2服从同一指数分布 f(x)＝，θ>0. 若将二者串联成整机，求整机寿命N的数学期望E(N) 解 N=min(X1,X2)，要求期望，先求概率密度，本题要先求N的分布函数 ∴Fmin(x)＝1－[1－F(x)]2 //X1,X2独立同分布又F(x)= ， ∴Fmin(x)＝1－[1－F(x)]2＝ ∴fmin(x)＝，服从参数为θ/2的指数分布 ∴E(N)＝ =θ/2，指数分布的均值即参数θ/2

§4.1 数学期望例3 如何确定投资决策方向? 某人有10万元现金, 想投资于某项目, 欲估成功的机会为 30 例3 如何确定投资决策方向? 某人有10万元现金, 想投资于某项目, 欲估成功的机会为 30 %, 可得利润8万元 , 失败的机会为70%, 将损失 2 万元.若存入银行, 同期间的利率为5% , 问是否作此项投资? 解设 X 为投资利润,则存入银行的利息: 故应选择投资.

§4.1 数学期望例设随机变量X服从求E(X) 解 E(X)=

§4.1 数学期望例到站时刻概率

§4.1 数学期望解

§4.1 数学期望随机变量的函数的数学期望比如：飞机机翼受到的正压力W＝kV2是风速V的函数，如果V的分布已知，如何求得W的数学期望，而无需先求出W的分布先由V的分布求其函数W的分布，再求数学期望是可以的，而还有更简单直接的求解方法

§4.1 数学期望定理这样求E(Y)而不必算出Y的分布设Y是随机变量X的函数：Y=g(X)，其中g是连续函数 (i) X是离散型随机变量，分布律为 P{X=xk}＝pk，k＝1,2,… 若级数绝对收敛，则有 E(Y)＝E(g(X))＝ (ii)X是连续型随机变量，概率密度为f(x)，若积分绝对收敛，则有 E(Y)＝E(g(X))＝这样求E(Y)而不必算出Y的分布

§4.1 数学期望定理的证明(略)，以下对离散型X进行简要说明 E(Y)＝＝＝＝＝实际上是对所有的X的取值的概率的加权求和＝＝＝实际上是对所有的X的取值的概率的加权求和 E(Y) ＝连续型的特例情况下证明，请参看教材

§4.1 数学期望推广：多维随机变量(X1,X2,…,Xn)的函数Y＝g(X1,X2,…,Xn)也满足以上定理。例如：若Z＝g(X,Y)，且g是连续函数，则若(X,Y)是连续型随机变量，概率密度为f(x,y)，那么 E(Z)＝E(g(X,Y))＝只要该积分绝对收敛则存在若(X,Y)是离散型随机变量，分布律P{X=xi,Y=yj}＝pij，i,j=1,2, …那么 E(Z)＝E(g(X,Y))＝，右边级数绝对收敛

§4.1 数学期望例9：设随机变量(X,Y)的概率密度为 f(x,y)＝求数学期望E(Y)，E(1/(XY)) 解此时可以看成是函数z＝g(x,y)=y 这样E(Z)＝E(Y)＝＝＝＝3/4 也可以先求Y的边缘概率密度，再用数学期望定义求解对于第2个问题 E(Z)＝E(1/(XY))＝＝＝3/5

§4.1 数学期望例10 设 (X ,Y) 的分布律为解

§4.1 数学期望由于

§4.1 数学期望

§4.1 数学期望例10：某公司计划开发一种新产品市场，并试图确定该产品的产量，他们估计售一件产品可获利m元，积压一件产品亏损n元现在可预测销售量Y服从参数为θ的指数分布 f(x)＝，θ>0. 问若要获得利润的数学期望最大，应生产多少件产品？解：显然获利多少Q是生产产品数量x(确定量)和销售量Y(随机变量)的函数 Q=Q(x,Y)= ，从随机变量的角度看，Q是一个随机变量，它是Y的函数，而Y的分布已知

§4.1 数学期望固有E(Q)＝＝＝＋＝(m+n)θ－(m+n)θe－x/θ－nx ＝＋＝(m+n)θ－(m+n)θe－x/θ－nx 令dE(Q)/dx=(m+n)θe－x/θ－n =0得到x＝又d2E(Q)/dx2＝，所以x＝时E(Q)取唯一极大值，即最大值

§4.1 数学期望数学期望的性质 1°设C是常数，则有E(C)＝C 2°设X是一个随机变量，C是常数，则有 E(CX)＝CE(X) 相当于X＝C为必然事件，分布律为P{X＝C}=1 所以，E(C)＝C×1＝C 2°设X是一个随机变量，C是常数，则有 E(CX)＝CE(X) 证：令Y=CX，则Y是X的函数，则 E(Y)＝E(CX)＝＝＝CE(X)

§4.1 数学期望 3°设X,Y是两个随机变量，则有 E(X＋Y)＝E(X)+ E(Y) 证：仅就连续型的随机变量加以证明可推广到任意有限个随机变量之和的情况证：仅就连续型的随机变量加以证明设二维随机变量(X,Y)的概率密度f(x,y)，边缘概率密度为fX(x)， fY(y) E(X＋Y)＝＝＋＝＋＝E(X)+ E(Y)

§4.1 数学期望 4°设X,Y是相互独立的随机变量，则有 E(XY)＝E(X)E(Y) 证：仅证连续型 E(XY)＝＝可以推广到任意有限个独立随机变量之积的情况证：仅证连续型 E(XY)＝＝＝[ ][ ]=E(X)E(Y) 有了以上性质后，再求解数学期望的问题时就可利用性质，简化求解复杂度

§4.1 数学期望例12 随机变量分解注意：这里的起点和终点不在这10个车站范围内解

§4.1 数学期望将X分解成数个随机变量之和，然后利用随机变量和的数学期望等于随机变量数学期望之和来求解数学期望典型的例子是二项分布的随机变量可以分解为若干个0－1分布的随机变量只和

§4.1 数学期望例设求: 解

§4.1 数学期望例4 解 I和R相互独立

§4.2 方差方差主要考虑的是随机变量的取值与其均值偏离程度例如：电子器件的热噪声，其产生的噪声电压的均值可能为0，但是噪声电压的大小可能很不一样，从而对信号处理的影响也不一样，噪声的功率也不同，因此我们常常关心噪声电压与均值电压的偏离程度，设噪声电压为X，均值为E(X)，则偏离程度Y很容易用二者之差来描述，即 Y＝|X－E(X)| 而我们通常考察平均偏离程度，即考察 E{|X－E(X)|} 由于该式中含有绝对值，运算不方便，通常用下式来描述X与均值的偏离程度 E{[X－E(X)]2}

§4.2 方差定义设X是一个随机变量，若E{[X－E(X)]2}存在，则称E{[X－E(X)]2}为X的方差，记为D(X)或Var(X)，Variance 即 D(X)＝Var(X)＝E{[X－E(X)]2} 应用上还引入与随机变量X具有相同量纲的量，记为σ(X)，称为标准差或均方差方差的含义：由定义可知，方差表达了随机变量X取值与其数学期望的偏离程度，并表达了以E(X)为X的代表性的好坏如果X取值比较集中，则偏离程度小，D(X)也较小， E(X) 的代表性好如果X取值比较分散，则偏离程度大，D(X)也较大所以说D(X)是描述X分散程度的量

§4.2 方差方差的计算方法：(1)利用定义由定义，方差实际上是X的函数g(X)=[X－E(X)]2的数学期望对于离散型随机变量X： D(X)＝E{g(X)}＝＝，其中，X的分布律为P{X=xk}＝pk，k＝1,2,… 对于连续型随机变量X: D(X)＝E{g(X)}＝＝其中f(x)是X的概率密度

§4.2 方差方差的计算方法：(2)利用方差恒等式 D(X)＝E(X2)－[E(X)]2；更重要的是E(X2)＝D(X)＋[E(X)]2 证：由数学期望的性质 D(X)＝E{[X－E(X)]2}＝E{X2－2XE(X)+[E(X)]2} ＝E{X2}－2E(X)E(X)+[E(X)]2＝E(X2)－[E(X)]2 这样，求解方差时，除定义式外，可直接利用以上公式首先计算E(X)，然后计算E(X2)，最后计算D(X)＝E(X2)－[E(X)]2

§4.2 方差随机变量的标准化：所以X*的数学期望0，方差1，X*称为X的标准化变量设随机变量X具有数学期望E(X)=μ，方差D(X)＝σ2≠0，记X*＝(X－μ)/σ，则E(X*)=E(X－μ)/σ＝(E(X)－μ)/σ＝0 D(X*)＝E(X*2)－[E(X*)]2＝E([(X－μ)/σ]2)－0 ＝(1/σ2)E((X－μ)2) ＝(1/σ2)σ2＝1 所以X*的数学期望0，方差1，X*称为X的标准化变量

§4.2 方差方差的性质 1°设 C 是常数, 则有证明 2°设 X 是一个随机变量, C 是常数, 则有证明

§4.2 方差 3°设X,Y是两个随机变量，则有 D(X＋Y)＝D(X)＋D(Y)＋2E{[X－E(X)][Y－E(Y)]}，这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。证：D(X＋Y)＝E{[(X＋Y)－E(X+Y)]2}= E{[(X－E(X))＋(Y－E(Y))]2} ＝E{[X－E(X)]2}＋E{[Y－E(Y)]2}＋2E{[X－E(X)][Y－E(Y)]} ＝D(X)＋D(Y)＋2E{[X－E(X)][Y－E(Y)]} 又E{[X－E(X)][Y－E(Y)]}＝E{XY－XE(Y)－YE(X)＋E(X)E(Y)} ＝E(XY)－E(X)E(Y)－E(Y)E(X)＋E(X)E(Y) ＝E(XY)－E(X)E(Y) 当X,Y相互独立时，由数学期望的性质有E(XY)＝E(X)E(Y)，从而有 D(X＋Y)＝D(X)＋D(Y)

§4.2 方差推广 “以概率1”的含义：对于连续型随机变量，如果存在一些孤立的点其随机变量的取值不为常数，那么不影响结论，这和独立性中几乎处处成立有点类似所以在这一前提下，X不一定等于C 另外，不难证明有如下不等式成立

§4.2 方差契比雪夫(Chebyshev)不等式定理设随机变量X具有数学期望E(X)=μ，方差D(X)=σ2，则对于任意正数ε，以下不等式成立契比雪夫不等式是一个重要的理论工具，应用极为普遍，很多重要结论都来自于该不等式，对于任意的数学期望和方差都存在的随机变量都成立证：

§4.2 方差契比雪夫不等式的变形该不等式给出了随机变量X分布未知的情况下事件概率的下限的估计，具有普适性。如取ε＝3σ，有，这一结果具有普遍意义的3σ准则，可以与正态分布的3σ准则比较一下，又概率值近1

§4.2 方差几种重要分布的数学期望和方差 (一) (0－1)分布 X 0 1 pk 1－p p E(X)＝0×(1－p)+1×p＝p D(X)＝E(X2)－[E(X)]2=p－p2=p(1－p)

§4.2 方差 (二) 二项分布 X～b(n,p) 分布律为P{X=k}＝ pkqn－k，k＝0，1，…，n，(q＝1－p) (i)直接法：组合拆分 E(X)＝，而＝所以E(X)＝＝＝＝np E(X2)＝，而＝＋＝＋ E(X2)＝＝＝n(n－1)p2+np D(X)＝E(X2)－[E(X)]2＝n(n－1)p2+np－(np)2=np(1－p)

§4.2 方差 (ii)间接法：随机变量分解(变量拆分) 随机变量X表示n重伯努利实验中n次相互独立的重复实验中事件A发生的次数，引入n个随机变量Xi，i＝1， 2，…，其中，Xi＝，于是有X＝X1＋X2＋…＋Xn Xi 0 1 且由题设易知Xi服从同一(0－1)分布 pk 1－p p X可以分解为n个参数为p的(0－1)分布的独立同分布的变量之和由Xi的独立性，及数学期望和方差的性质易得 E(X)＝E(X1＋X2＋…＋Xn)＝E(X1)＋E(X2)＋…＋E(Xn)＝np D(X)＝D(X1＋X2＋…＋Xn)＝D(X1)＋D(X2)＋…＋D(Xn)＝np(1－p)

§4.2 方差 (三) 泊松分布X～π(λ)，（期望等于方差） E(X)＝ = = =λ E(X2)＝＝＋＝＋λ＝λ2＋λ ＝＋λ＝λ2＋λ D(X)＝E(X2)－[E(X)]2＝λ2＋λ－λ2＝λ

§4.2 方差 (四) 均匀分布X～U(a,b) E(X)＝ = = E(X2)＝＝＝ D(X)＝E(X2)－[E(X)]2 ＝－＝

§4.2 方差 (五) 指数分布 f(x)＝，θ>0. E(X)＝＝＝＝θ E(X2)＝＝＝＝2θ 2 ＝＝θ E(X2)＝＝＝＝2θ 2 D(X)＝E(X2)－[E(X)]2＝2θ 2－θ 2＝θ 2

§4.2 方差 (六) 正态分布X～N(μ,σ 2) 正态分布稍复杂，先求标准正态分布 Z＝～N(0,1)， φ(Z)= ，－∞<z<∞ E(Z)＝＝＝＝0 D(Z)＝E(Z2)－[E(Z)]2＝E(Z2)＝＝＋＝1

§4.2 方差这样由于X=σZ＋μ E(X)＝E(σZ＋μ)= E(σZ)＋μ＝σE(Z)＋μ＝μ D(X)＝D(σZ＋μ) ＝ E{[(σZ＋μ)－E(σZ＋μ)]2} ＝ E{(σZ)2} ＝σ2E(Z2) ＝σ2D(Z) ＝σ2 所以在正态分布中，两个参数μ,σ2分别为数学期望和方差有限个相互独立的正态随机变量的任意线性组合仍然服从正态分布因此由数学期望和方差的性质易知， Z=a1X1+ a2X2+,…,+ anXn～N(a1μ1＋a2μ2＋…+anμn，(a1σ1)2＋(a2σ2)2＋…+(anσn)2)

分　　布参数数学期望方差 (0-1)分布二项分布泊松分布几何分布均匀分布指数分布正态分布 分布

§4.2 方差例1 解于是

§4.2 方差例解

§4.2 方差

§4.2 方差因此有

§4.2 方差

§4.2 方差例证明

§4.2 方差

§4.2 方差故得

§4.2 方差例5 解

§4.3 协方差及相关系数对于二维随机变量(X,Y) 若X和Y相互独立，根据独立性的相关定理则显然有X－E(X)和Y－E(Y)也相互独立于是有E{[X－E(X)][Y－E(Y)]}=0 若X和Y不相互独立，则E{[X－E(X)][Y－E(Y)]}不一定等于0 这表明了X和Y之间的相关性，而我们以X－E(X)和Y－E(Y)来讨论相关性，是与方差的概念相适应，我们有如下协方差的定义协方差定义量E{[X－E(X)][Y－E(Y)]}称为随机变量X与Y的协方差，记为Cov(X,Y)，即 Cov(X,Y)＝E{[X－E(X)][Y－E(Y)]}

§4.3 协方差及相关系数方差与协方差之间的关系： 1) Cov(X,X)＝D(X) 2) 对任意的X和Y，下列等式成立 D(X＋Y)＝E{[(X＋Y)－E(X+Y)]2} ＝E{[(X－E(X))＋(Y－E(Y))]2} ＝E{[X－E(X)]2}＋E{[Y－E(Y)]2} ＋2E{[X－E(X)][Y－E(Y)]} ＝D(X)＋D(Y)＋2Cov(X,Y) 当X和Y相互独立时，协方差为0，此时D(X+Y)=D(X)+D(Y)

§4.3 协方差及相关系数协方差的一个计算公式 Cov(X,Y)＝E(XY)－E(Y)E(Y) 协方差的性质： 1°Cov(X,Y)＝Cov(Y,X) 2°Cov(aX,bY)＝abCov(X, Y)，a，b是常数 3°Cov(X1＋X2,Y)＝Cov(X1,Y)＋Cov(X2,Y) 相关系数定义称为随机变量X和Y的相关系数 ρXY是一个无量纲的量

§4.3 协方差及相关系数相关系数的性质先来看一个问题：对于任意的两个随机变量X和Y，以X的线性函数a+bX来近似表示Y，并以Y和a+bX的均方误差e来衡量a+bX近似表达Y的好坏程度。其中均方误差定义为： e＝E{[Y－(a＋bX)]2}＝E(Y2)+b2E(X2)+a2 －2bE(XY)+2abE(X)－2aE(Y) 显然e的值越小近似程度越好这种方法类似于最小二乘法

§4.3 协方差及相关系数现在来确定一下a和b取何值时该均方误差最小 (2)－(1)×E(X)得：2bE(X2)－2E(XY)＋2E(X)E(Y)－ 2b(E(X))2＝0 即bD(X)＝E(XY)－E(X)E(Y)＝Cov(X,Y) ∴b0＝Cov(X,Y)/D(X) a0＝E(Y)－b0E(X)＝E(Y)－E(X)[Cov(X,Y)/D(X)]

§4.3 协方差及相关系数即当a＝a0，b＝b0时均方误差e取最小值＝＝ D(Y)+ ＝ D(Y)(1－ )=(1－ )D(Y) 由上式很容易得到相关系数的两个性质

§4.3 协方差及相关系数相关系数的性质定理：证明又D(Y)和非负，对任意的X,Y都成立

§4.3 协方差及相关系数 2°充分性：若|ρXY|＝1，则＝(1－ )D(Y)＝0 又E(X2)＝D(X)+(E(X))2 所以：E{[Y-(a0+b0X)]2}＝D(Y-(a0+b0X))+[E(Y-(a0+b0X))]2=0 两个非负数和为0，固有D(Y-(a0+b0X))＝0，E(Y-(a0+b0X))=0 由方差性质4°知P{Y－(a0+b0X)=C}＝1，而E{Y－(a0+b0X)}=C=0 所以P{Y－(a0+b0X)=0}＝1

§4.3 协方差及相关系数必要性：若存在常数a*，b*使得P{Y＝(a*+b*X)}＝1，即P{Y－(a*+b*X)=0}＝1 所以[Y－(a*+b*X)]2的期望E{[Y－(a*+b*X)]2}=0 固有0＝E{[Y－(a*+b*X)]2}  ＝(1－ )D(Y) 即(1－ )D(Y)＝0，对任意Y都成立，所以1－＝0 即|ρXY|＝1

§4.3 协方差及相关系数由前述推导表明： 1°单调递减性：给定随机变量Y及a+bX，均方误差e的最小值是|ρXY|的单调减函数 ∴|ρXY|增大，误差越小，Y与a+bX的线性关系就越明显，近似程度就越好 |ρXY|＝1时，P{Y＝a+bX}＝1 2°|ρXY|大小与线性关系 ρXY可以表征X和Y线性关系紧密程度的量 ρXY越大，线性相关程度越好

§4.3 协方差及相关系数 3°不相关与独立性：定义：当ρXY＝0时称X和Y不相关＝如果X和Y相互独立，则有ρXY＝0，于是X和Y不相关反之，如果X和Y不相关，则ρXY＝0，从而有E(XY)－E(X)E(Y)＝0 但仅有这一结果，X和Y不一定独立。 ∴独立性是就一般关系而言，很广泛，而相关性仅指线性关系，独立性中还包括非线性的情况

注意 (1) 不相关与相互独立的关系相互独立不相关 (2) 不相关的充要条件

§4.3 协方差及相关系数不相关但不独立的例子例设(X,Y)的分布律为 Y X -2 -1 1 2 P{Y=j} 1 0 ¼ ¼ 0 ½ 4 ¼ 0 0 ¼ ½ P{X=i} ¼ ¼ ¼ ¼ 1 易知E(X)=0，E(Y)=2.5，E(XY)=0，于是X和Y的相关系数XY=0，X和Y不相关，即X和Y不存在线性关系。但P{X=-2,Y=1} P{X=-2 }P{Y=1}，知X和Y不相互独立.事实上X和Y具有关系Y=X2，是非线性的

§4.3 协方差及相关系数例1 解

§4.3 协方差及相关系数

§4.3 协方差及相关系数

§4.3 协方差及相关系数结论

§4.4 矩、协方差矩阵本节引入随机变量的另外几个数字特征定义：X和Y是随机变量 1°若E(Xk)存在，k＝1,2,…，称它为X的k阶原点矩，简称k阶矩当k＝1时即为数学期望E(X),它是X的一阶原点矩 2°若E{[X－E(X)]k}存在，k＝1,2,…，称它为X的k阶中心矩当k＝2时即为方差D(X),它是X的二阶中心矩 3°若E(XkYl)存在，k,l＝1,2,…，称它为X和Y的k＋l阶混合矩 4°若E{[X－E(X)]k[Y－E(Y)]l}存在，k,l＝1,2,…，称它为X和Y的k＋l阶混合中心矩当k＝l＝1时即为协方差Cov(X,Y),它是X和Y二阶混合中心矩

§4.4 矩、协方差矩阵 n维随机变量的协方差矩阵首先考虑二维随机变量的协方差矩阵二维随机变量(X1,X2)有四个二阶中心矩，设它们都存在，分别记为 c11＝E{[X1－E(X1)]2} D(X1) c12＝E{[X1－E(X1)][X2－E(X2)]} Cov(X1,X2) c21＝E{[X2－E(X2)][X1－E(X1)]} Cov(X2,X1) c22＝E{[X2－E(X2)]2} D(X2) 将它们排成矩阵的形式，这个矩阵称为随机变量(X1,X2)的协方差矩阵

§4.4 矩、协方差矩阵

§4.4 矩、协方差矩阵对于n维随机变量(X1,X2,…,Xn)的协方差矩阵。由于cij＝cji，(i≠j, i，j＝1，2，…,n)因而是一个对称矩阵在实际中，由于n维随机变量的分布是不知道的，或者太复杂，数学上不易处理，因此协方差矩阵尤为重要 n维正态随机变量的概率密度的协方差矩阵表示首先将二维正态随机变量的概率密度改写成另一种形式二维正态随机变量(X1,X2)的概率密度为，－∞<x1<∞,－∞<x2<∞。现在将指数中括号内的部分写成矩阵的行列式形式

§4.4 矩、协方差矩阵令X= ，μ= ，记(X1,X2)的协方差矩阵为 C＝＝，其中12＝＝Cov(X1,X2)＝Cov(X2,X1) C的行列式|C|＝1222(1- 2) ，于是C的逆阵C－1＝＝

§4.4 矩、协方差矩阵做如下计算 (X－μ)C－1(X－μ) ＝ (x1－μ1，x2－μ2) 展开＝展开＝于是(X1,X2)的概率密度可写为 f(x1,x2)＝，－∞<x1<∞,－∞<x2<∞

§4.4 矩、协方差矩阵推广到n维正态随机变量(X1,X2,…,Xn)的情况引入矩阵 X= ，μ= ＝， f(x1,x2,…,xn)= ，－∞<xi<∞，i＝1，2，…，n C是(X1,X2,…,Xn)的协方差矩阵

§4.4 矩、协方差矩阵 n维正态随机变量的四条重要性质： 1°n维正态随机变量(X1,X2,…,Xn)的每一个分量Xi，i＝1,2,…,n，都是正态变量；反之若X1,X2,…,Xn都是正态变量，且相互独立，则(X1,X2,…,Xn)是正态变量证明：对于第一个问题，由归纳法，正态变量的边缘概率密度都是正态变量反之，若相互独立，则协方差为0，协方差矩阵只有主对角线元素不为0且是各正态变量的方差。 2°n维正态随机变量(X1,X2,…,Xn)服从n维正态分布的充要条件是X1,X2,…,Xn的任意线性组合： l1X1+l2X2+…+lnXn 服从一维正态分布(其中l1,l2,…,ln不全为0)

§4.4 矩、协方差矩阵 3°正态变量的线性变换不变性：若(X1,X2,…,Xn)服从n维正态分布，设Y1,Y2,…,Yk是Xj，j＝1,2,…,n的线性函数，则(Y1,Y2,…,Yk)也服从多维正态分布 4°设(X1,X2,…,Xn)服从n维正态分布，则“X1,X2,…,Xn相互独立”与“X1,X2,…,Xn两两不相关”是等价的。这是因为，正态变量的性质由协方差矩阵完全确定，而矩阵中的元素为两两分量的协方差，反映了两两相关性

本章小结

本章小结（2）

本章作业第一次：第二次：第三次： P113：1(3)，2，4，6，7 P115：9(2)，10，14，15，18，22(2)，25

谢谢！