第四章 随机变量的数字特征 我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便. 已知一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种的母鸡的年产蛋量,通常只要比较这两个品种的母鸡的年产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高.如果不去比较它们的平均值,而只看它们的分布列,虽然全面,却使人不得要领,既难以掌握,又难以迅速地作出判断.

Slides:



Advertisements
Similar presentations
1 §2.2 离 散 型 随 机 变 量 §2.1 随 机 变 量 的 概 念 §2.3 超几何分布 · 二项分布 · 泊松分布 1. “0-1” 分布 ( 两点分布 ) 3. 二项分布 4. Poisson 分布 2. 超几何分布 n →∞ , N→∞ , (x = 0, 1, 2, , n) (x.
Advertisements

第一节 不定积分的概念及其 计算法概述 一、原函数与不定积分的概念 二、基本积分表 三、不定积分的性质及简单计算 四、小结.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
8.1 不定积分的概念和基本积分公式  原函数和不定积分  基本积分公式表  不定积分的线性运算法则 第八章 不定积分.
第三章 多维随机变量及其分布 3.1 二维随机变量 3.2 边缘分布 3.3 条件分布 3.4 随机变量的独立性
第四章 随机变量的数字特征 随机变量的分布是对随机变量的一种完整的描述,知道随机变量的分布就全都知道随机变量的所有特征。然后随机变量的概率分布往往不容易求得的。 随机变量的这些统计特征通常用数字表示的。这些用来描述随机变量统计性的数字称为随机变量的数字特征。其中最重要的是数学期望(均值)和方差二种。
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第四章 随机变量的数字特征 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第三节 协方差及相关系数 协方差 相关系数 课堂练习 小结 布置作业.
第四章 一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第四章 随机变量的数字特征 第一节 数学期望 第二节 方差 第三节 协方差及相关系数 第四节 矩、协方差矩阵.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第四章 随机变量的数字特征 §4 协方差及相关系数 协方差的定义 协方差的性质 相关系数的定义 相关系数的性质.
第三章 多维随机变量及其分布 §3.1 多维随机变量及其联合分布 §3.2 边际分布与随机变量的独立性 §3.3 多维随机变量函数的分布
教學演示教材: 〈信賴區間與信心水準的解讀〉
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第四章 随机变量的数字特征 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
概 率 统 计 主讲教师 叶宏 山东大学数学院.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
实数与向量的积.
概 率 论.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第三章 多元随机变量及其分布 关键词:二元随机变量 联合分布 边际分布 条件分布 随机变量的独立性 随机变量函数的分布.
第三章 随机变量的数字特征 (一)基本内容 一、一维随机变量的数学期望 定义1:设X是一离散型随机变量,其分布列为:
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
高中数学必修 平面向量的基本定理.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
7.4 随机变量的数字特征 离散型随机变量的数学期望和方差 连续型随机变量的数学期望和方差
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
§4.1数学期望.
Presentation transcript:

第四章 随机变量的数字特征 我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便. 已知一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种的母鸡的年产蛋量,通常只要比较这两个品种的母鸡的年产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高.如果不去比较它们的平均值,而只看它们的分布列,虽然全面,却使人不得要领,既难以掌握,又难以迅速地作出判断. 2019/4/19

§1 随机变量的数学期望 §1.1 离散型随机变量的数学期望 例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好? 0.3 0.5 0.2 0.6 0.1 概率 10 9 8 击中环数 B A 射手名称 2019/4/19

例:某手表厂在出厂产品中,抽查了N=100只手表的日走时误差,其数据如表: 5 4 16 21 28 17 10 3 只数Nk 2 1 -1 -2 日走时误差xk 则抽查到的100只手表的平均日走时误差为 即 2019/4/19

这样我们就引出了随机变量的数学期望的概念. 如果另外再抽验100只手表,每作一次这样的检验,就得到一组不同的频率,也就有不同的日走时误差的平均值.由关于频率和概率关系的讨论知,理论上应该用概率去代替上述和式的频率,这时得到的平均值才是理论上(也是真正)的平均值。 这样我们就引出了随机变量的数学期望的概念. 2019/4/19

Expectations 定义:设离散型随机变量X的概率分布为 如若 则称 为随机变量X的数学期望,记为E(X). 如果 2019/4/19

所以A的射击技术较B的好. 例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好? 解 A射击平均击中环数为 0.3 0.5 0.2 0.6 0.1 概率 10 9 8 击中环数 B A 射手名称 解 A射击平均击中环数为 B射击平均击中环数为 所以A的射击技术较B的好. 2019/4/19

解 ① 分布律为: X 1 2 3 P 0.3 0.4 0.2 0.1 ② 平均废品数为: 2019/4/19

例:设随机变量X具有如下的分布,求E(X). 解 虽然有 收敛,但 发散,因此E(X)不存在. 2019/4/19

§1.1.1(0-1)分布数学期望 设X的分布列为: X 1 P q p 其中 则 2019/4/19

§1.1.2 二项分布数学期望 定理:设随机变量X服从二项分布,即 则随机变量X的数学期望E(X)=np. 证明 后面补证 §1.1.2 二项分布数学期望 定理:设随机变量X服从二项分布,即 则随机变量X的数学期望E(X)=np. 证明 后面补证 2019/4/19

2019/4/19

§1.1.3 泊松分布数学期望 定理:设随机变量X服从泊松分布,即 则随机变量X的数学期望E(X)=λ . 证明: 后面补证 §1.1.3 泊松分布数学期望 定理:设随机变量X服从泊松分布,即 则随机变量X的数学期望E(X)=λ . 证明: 后面补证 2019/4/19

2019/4/19

§1.2 连续型随机变量的数学期望 我们已知离散型随机变量X的数学期望为 E(X)= 自然要问连续型随机变量的数学期望是什么? §1.2 连续型随机变量的数学期望 我们已知离散型随机变量X的数学期望为 E(X)= 自然要问连续型随机变量的数学期望是什么? 设p(x) 是连续型随机变量X的密度函数,取分点 x0<x1<…<xn+1 则随机变量X落在△xi=(xi, xi+1)中的概率为 与X近似的随机变量Y的数学期望为 由微积分知识自然想到X的数学期望为 2019/4/19

定义:设连续型随机变量X的密度函数为p(x),若 则称 为连续型随机变量X的数学期望,记为E(X). 如果 则称连续型随机变量X的数学期望不存在. 2019/4/19

例:设随机变量X的概率密度函数为 试求X的数学期望 解 2019/4/19

例:若随机变量X的概率密度函数为 问随机变量X的数学期望E(X)是否存在. 解 所以E(X)不存在.但 2019/4/19

§1.2.1 均匀分布的数学期望 定理:设连续型随机变量X的密度函数为 则E(X)=(a+b)/2. 证明: 2019/4/19

§1.2.2 指数分布的数学期望 定理:设连续型随机变量X的密度函数为 则随机变量X的数学期望为E(X)=1/λ. 证明 2019/4/19

§1.2.3 正态分布的数学期望 定理:设连续型随机变量X~N(μ,σ2) ,则 E(X)=μ. 证明 2019/4/19

§2 随机变量函数的数学期望 §2.1 随机变量函数的数学期望 定理:设Y是随机变量X的函数:Y=f(X)(f是连续函数). §2 随机变量函数的数学期望 §2.1 随机变量函数的数学期望 定理:设Y是随机变量X的函数:Y=f(X)(f是连续函数). (1)设离散型随机变量X的概率分布为 P{X=xk}=pk, k=1,2,... 若 则 (2)设连续型随机变量X的密度函数为p(x),若 则有 2019/4/19

定理:设Z是随机变量X,Y的函数Z=f(X,Y) (f是连续函数). 若 则 (2)设二维随机向量(X,Y)的分布密度为p(x,y),若 则 2019/4/19

若y<0,则FY(y)=0;若y>0,则 再求 例:已知随机变量X~N(0,1),求E(X2). 解法1 先求Y= X2 的概率密度函数: 若y<0,则FY(y)=0;若y>0,则 再求 解法2 所以Y= X2 的概率密度函数为 后面补证 2019/4/19

2019/4/19

例: 设(X,Y)的联合分布律如下,Z=XY,求E(Z). 解 2019/4/19

例:设风速V在(0,a)上服从均匀分布,又设飞机机翼受到的正压力W是V的函数:W=kV2(k>0,常数),求W的数学期望. 所以 2019/4/19

例:设二维随机变量(X,Y)的概率密度为 试求XY的数学期望. 解 2019/4/19

解以s(公斤)表示进货数,进货s所得利润记为Ys(X),则 例:按季节出售的某种应时商品,每售出一公斤获利润b元.如到季末尚有剩余商品,则每公斤净亏损a元.设某商品在季节内这种商品的销售量X(以公斤计)是一随机变量,X在区间(s1,s2)上服从均匀分布.为使商店所获得利润的数学期望最大,问商店应进多少货? 解以s(公斤)表示进货数,进货s所得利润记为Ys(X),则 X的概率密度为 2019/4/19

于是 由 得 2019/4/19

§2.2 数学期望的性质 1.若a≤X≤b,则E(X)存在,且有a≤E(X)≤b.特别,若C是常数,则E(C)=C. §2.2 数学期望的性质 1.若a≤X≤b,则E(X)存在,且有a≤E(X)≤b.特别,若C是常数,则E(C)=C. 2.设X,Y是两个随机变量,若E(X),E(Y)存在,则对任意的实数a、b, E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y) 此性质可推广到有限个随机变量的线性组合的情况. 3.设X,Y是互相独立的随机变量,则有 E(XY)=E(X)E(Y) 此性质可推广到有限个互相独立的随机变量之积的情况. 2019/4/19

定理:若a≤X≤b,则E(X)存在,且有a≤E(X)≤b.特别,若C是常数,则E(C)=C. {X=xi}=pi, i=1,2,… 则 (2)设连续型随机变量X的概率密度为p(x),则 (3)因为P{X=C}=1,故E(C)=E(X)=C×1=C 2019/4/19

定理:设X,Y是两个随机变量,若E(X),E(Y)存在,则对任意的实数a、b, E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y) 证明(1)设离散型随机向量(X,Y)的联合分布列和边际分布列分别为 P{X=xi,Y=yj}=pij, i,j=1,2,… P{X=xi}=pi., i=1,2,… P{Y=yj}=p.j, j=1,2,… 则 2019/4/19

(2)设连续型随机向量(X,Y)的联合概率密度和边际概率密度分别为p(x,y)和pX(x), pY(y) 则 2019/4/19

证明 (1)设离散型随机向量(X,Y)的联合分布列和边际分布列分别为 E(XY)=E(X)E(Y) 证明 (1)设离散型随机向量(X,Y)的联合分布列和边际分布列分别为 P{X=xi,Y=yj}=pij, i,j=1,2,… P{X=xi}=pi., i=1,2,… P{Y=yj}=p.j, j=1,2,… 则 2019/4/19

(2)设连续型随机向量(X,Y)的联合概率密度和边际概率密度分别为p(x,y)和pX(x), pY(y) 则 2019/4/19

例:一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车.如到达一个车站没有旅客下车就不停车.以X表示停车的次数,求E(X). 解:引入随机变量 易知X=X1+X2+…+X10 任一旅客在第i站不下车的概率为9/10.因此20位旅客都不在第i站下车的概率为(9/10)20,在第i站有人下车的概率为1- (9/10)20. 即P{Xi=0}= (9/10)20, P{Xi=1}= 1- (9/10)20 2019/4/19

注:本题的特点是将X分解为数个随机变量的和,再求数学期望.此种方法具有普遍意义. 所以 E(Xi)= 1- (9/10)20, i=1,2,…,10 进而 E(X)=E(X1+X2+…+X10) =E(X1)+E(X2)+…+E(X10) =10[1- (9/10)20]=8.784 注:本题的特点是将X分解为数个随机变量的和,再求数学期望.此种方法具有普遍意义. 2019/4/19

例:设一电路中电流I(安)与电阻R(欧)是两个相互独立的随机变量,其概率密度分别为 求电压V=IR的数学期望. 解 2019/4/19

解 因此,有 2019/4/19

又当-1≤x≤1时, 故得 同理可得 由于 所以X与Y不相互独立 2019/4/19

例: 抛掷6颗骰子,X表示出现的点数之和,求E(X). 从而由期望的性质可得 2019/4/19

§3 随机变量的方差 §3.1 方差的概念 例:A,B两种手表的日走时误差分别具有如下的分布律: §3 随机变量的方差 §3.1 方差的概念 例:A,B两种手表的日走时误差分别具有如下的分布律: 易知E(XA)=E(XB)=0.由数学期望无法判别两种手表的优劣.但直觉告诉我们A优于B,怎么样用数学的方法把这种直觉表达出来呢? 2019/4/19

A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小. 分析原因: A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小. 研究随机变量与其均值的偏离程度是有必要的. 怎么样去度量这个偏离程度呢? (1)xk-E(X)表示xk与E(X)之间的偏差; (2)E[X-E(X)]不能反映X与E(X)之间的整体偏差; (3)E{|X-E(X)|}可以度量X与E(X)之间的整体偏差,但运算不方便; (4)E{[X-E(X)]2}可以度量X与E(X)之间的整体偏差,且运算也较方便. 2019/4/19

定义:设X是一个随机变量,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X的方差.记为D(X)或Var(X),即 D(X)= Var(X)= E{[X-E(X)]2} 称为X的标准差或均方差. 定理: 证明 D(X)=E{[X-E(X)]2} =E{X2 -2XE(X)+ [E(X)]2} = E(X2)-2E(X)E(X)+ [E(X)]2 = E(X2)- [E(X)]2 2019/4/19

方差实际上是随机变量X的函数f(X)=[X-E(X)]2的数学期望.于是 P{X=xk}=pk,k=1,2,… 则 (2)对于连续型随机变量X,若其概率密度为p(x),则 2019/4/19

例:A,B两种手表的日走时误差分别具有如下表的分布律.问哪种手表质量好些? 解 易知E(XA)=E(XB)=0.所以 由于D(XA)<D(XB),因此A手表较B手表的质量好. 2019/4/19

例:设随机变量X概率密度为p(x),求D(X). 解 于是,D(X)=E(X2)-[E(X)]2=1/6 2019/4/19

§3.2 常见分布的方差 §3.2.1(0-1)分布的方差 定理:若P{X=0}=q,P{X=1}=p,则D(X)=pq. 证明 §3.2 常见分布的方差 §3.2.1(0-1)分布的方差 定理:若P{X=0}=q,P{X=1}=p,则D(X)=pq. 证明 2019/4/19

§3.2.2 二项分布的方差 定理:若随机变量X服从二项分布X~B(n,p),则 D(X)=npq. 证明 后面补证 2019/4/19

2019/4/19

2019/4/19

预备公式2. 2019/4/19

求证: 证明: 2019/4/19

杨辉三角 中国南宋末年数学家、数学教育家。大约在13世纪 中叶至后半叶活动于苏、杭一带。字谦光,钱塘(今杭州)人。其生卒年及生平无从详考。杨辉的数学著作甚多有《日用算法》 《杨辉算法》等 2019/4/19

 “杨辉三角”出现在杨辉编著的《详解九章算法》一书中,且我国北宋数学家贾宪(约公元11世纪)已经用过它,这表明我国发现这个表不晚于11世纪.在欧洲,这个表被认为是法国数学家物理学家帕斯卡首先发现的,他们把这个表叫做帕斯卡三角.杨辉三角的发现要比欧洲早500年左右. 2019/4/19

杨辉三角基本性质 1.三角形的两条斜边上都是数字1,而其余的数都等于它肩上的两个数字相加 2.杨辉三角具有对称性(对称美),与首末两端“等距离 ”的两个数相等 3.每一行的第二个数就是这行的行数 4.所有行的第二个数构成等差数列 5.第n行包含n+1个数 杨辉三角基本性质 1      1 1     1 2 1     1 3 3 1     1 4 6 4 1 1 5 10 10 5 1   1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 1 8 28 56 70 56 28 8 1 1 9 36 84 126 126 84 36 9 1 ……………………………… 2019/4/19

2019/4/19

2019/4/19

§3.2.3 泊松分布的方差 定理:设随机变量X服从泊松分布X~π(λ),则D(X)=λ. 证明 2019/4/19

§3.2.4 均匀分布的方差 定理:设随机变量X服从均匀分布X~U(a,b),则D(X)=(b-a)2/12. 证明 2019/4/19

§3.2.5 指数分布的方差 定理:设随机变量X服从参数为λ 的指数分布,则 证明 2019/4/19

2019/4/19

§3.2.6 正态分布的方差 定理:设随机变量X服从正态分布X~N(μ,σ2) , 则D(X)=σ2. 证明: 后有补充 2019/4/19

2019/4/19

常见分布的期望和方差表 2019/4/19

解法1 X的边缘密度函数是 故 2019/4/19

解法2 于是 2019/4/19

解 由于 所以 2019/4/19

(4)对于任意常数C≠E(X),有 D(X)<E(X-C)2 §3.3 随机变量方差的性质 (1)设C是常数,则D(C)=0 (2)设C是常数,X是随机变量,则有 D(CX)=C2D(X) (3)设X,Y是两个相互独立的随机变量,则有 D(X+Y)=D(X)+D(Y) (4)对于任意常数C≠E(X),有 D(X)<E(X-C)2 2019/4/19

证明 D(aX+b)=E{[(aX+b)-E(aX+b)]2} = E{[(aX+b)-E(aX)-b]2} 定理:D(aX+b)=a2D(X) 证明 D(aX+b)=E{[(aX+b)-E(aX+b)]2} = E{[(aX+b)-E(aX)-b]2} = E{[aX-E(aX)]2} =E{[a(X-E(X))]2 } =a2E{[X-E(X)]2} =a2D(X) 2019/4/19

定理:设X,Y是两个相互独立的随机变量,则有 D(X+Y)=D(X)+D(Y) 证明 D(X+Y)=E{[(X+Y)-E(X+Y)]2} =E {[(X-E(X))+(Y-E(Y))]2} = E {[X-E(X)]2}+E{[Y-E(Y)]2} +2E{[X-E(X)] [Y-E(Y)]} 由于X,Y相互独立,知X-E(X)与Y-E(Y)也相互独立,从而有2E{[X-E(X)] [Y-E(Y)]}=2E{[X-E(X)]}E{ [Y-E(Y)]}=0. 于是得 D(X+Y)=D(X)+D(Y) 2019/4/19

由于 C≠E(X),所以[E(X)-C]2 > 0 从而有D(X)<E(X-C)2 2019/4/19

解 由期望与方差的性质可得 2019/4/19

解 由题意 于是 2019/4/19

§4 协方差与相关系数 对于二维随机向量(X,Y)来说,数学期望E(X)、E(Y)只反映了X与Y各自的平均值,方差只反映了X与Y各自离开均值的偏离程度,它们对X与Y之间相互关系不提供任何信息. 但二维随机向量(X,Y)的概率密度p(x,y)或分布列pij全面地描述了(X,Y)的统计规律,也包含有X与Y之间关系的信息.我们希望有一个数字特征能够在一定程度上反映这种联系. 2019/4/19

Cov(X,Y)= E(XY)-E(X)E(Y) §4.1 协方差 定义:设二维随机向量(X,Y)的数学期望(E(X),E(Y))存在,若E[(X-E(X))(Y-E(Y))]存在,则称它为随机变量X与Y的协方差,记为Cov(X,Y),即 Cov(X,Y)= E[(X-E(X))(Y-E(Y))] 协方差有计算公式 Cov(X,Y)= E(XY)-E(X)E(Y) 任意两个随机变量X与Y的和的方差为 D(X+Y)=D(X)+D(Y)+2Cov(X,Y) 2019/4/19

协方差的性质 1. 2. a,b是常数 3. 4. 2019/4/19

证明 Cov(X,Y)= E[(X-E(X))(Y-E(Y))] = E[(Y-E(Y))(X-E(X))] = Cov(Y,X) 定理:Cov(X,Y)=Cov(Y,X) 证明 Cov(X,Y)= E[(X-E(X))(Y-E(Y))] = E[(Y-E(Y))(X-E(X))] = Cov(Y,X) 定理: Cov(aX,bY)=abCov(X,Y),a,b是常数 证明 Cov(aX,bY)=E[(aX-E(aX))(bY-E(bY))] =E{[a(X-E(X))][b(Y-E(Y))]} =abE{[X-E(X)][Y-E(Y)]} =abCov(X,Y) 2019/4/19

定理:Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) =E{[(X+Y)-E(X+Y)][Z-E(Z)]} = E{[(X-E(X))+(Y-E(Y))][Z-E(Z)]} = E{[X-E(X)][Z-E(Z)] +[Y-E(Y)][Z-E(Z)]} =E{[X-E(X)][Z-E(Z)]} +E{[Y-E(Y)][Z-E(Z)]} =Cov(X,Z)+Cov(Y,Z) 2019/4/19

为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化: 协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX,Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是 Cov(X*,Y*)=k2Cov(X,Y) 为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化: 再来计算X*和Y*的协方差,这样就引进了相关系数的概念. 2019/4/19

§4.2 相关系数 定义:设二维随机变量(X,Y)的方差D(X)>0,D(Y)>0,协方差Cov(X,Y)均存在,则称 §4.2 相关系数 定义:设二维随机变量(X,Y)的方差D(X)>0,D(Y)>0,协方差Cov(X,Y)均存在,则称 为随机变量X与Y的相关系数或标准协方差. 2019/4/19

§4.2.1 相关系数的性质 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. §4.2.1 相关系数的性质 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. 性质2: |ρXY|=1 的充要条件是,存在常数a,b使得P{Y=a+bX}=1, 即X,Y具有线性关系的概率为1. 性质3:若X与Y相互独立,则ρXY=0. 2019/4/19

性质1:随机变量X和Y的相关系数满足|ρXY|≤1. 证明 令 则 从而|ρXY|≤1. 后面补证: 2019/4/19

2019/4/19

性质2: |ρXY|=1 的充要条件是,存在常数a,b使得 P{Y=aX+b}=1 证明 令 由ρXY2=[E(X*Y*)]2≤E(X*)E(Y*)=1 知|ρXY|=1等价于[E(X*Y*)]2-E(X*)E(Y*)=0 它又等价于h(t)=E[(tX*-Y*)2]=0有重根t0. 又因为E(t0X*-Y*)=t0E(X*)-E(Y*)=0 所以D(t0X*-Y*)=0,由方差的性质知它等价于 P{t0X*-Y* =0}=1,即P{Y=aX+b}=1 其中a=t0σ(Y)/σ(X),b=E(Y)- t0 E(X) σ(Y)/σ(X). 后有补证: 2019/4/19

2019/4/19

2019/4/19

2019/4/19

证明 若X与Y相互独立,则E(XY)=E(X)E(Y), 又 Cov(X,Y)= E(XY)-E(X)E(Y),所以 性质3:若X与Y相互独立,则ρXY=0. 证明 若X与Y相互独立,则E(XY)=E(X)E(Y), 又 Cov(X,Y)= E(XY)-E(X)E(Y),所以 2019/4/19

§4.2.2 相关系数的含义 考虑以X的线性函数a+bX来近似表示Y.以均方误差 e=E{[Y-(a+bX)]2} §4.2.2 相关系数的含义 考虑以X的线性函数a+bX来近似表示Y.以均方误差 e=E{[Y-(a+bX)]2} =E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y) 来衡量以a+bX近似表达Y的好坏程度.e的值越小表示a+bX与Y的近似程度越好.为此令 解得 从而得 2019/4/19

定义:(1) 当ρXY=1 时,称X与Y正线性相关; (2)当ρXY=-1 时,称X与Y负线性相关; (3)当ρXY=0时,称X与Y不相关. 2019/4/19

相关情况示意图 Y Y ρ =-1 ρ =1 X X o o Y Y -1<ρ<0 0<ρ<1 X X o o 2019/4/19

§4.3 协方差的关系式 定理: 证 由协方差的定义及数学期望的性质,得 2019/4/19

定理: 证 由方差公式及协方差的定义,得 后有补证: 2019/4/19

2019/4/19

Y X -1 1 0.07 0.18 0.15 0.08 0.32 0.20 解 X与Y的分布律分别为 X -1 1 P 0.15 0.5 0.35 Y 1 P 0.4 0.6 2019/4/19

于是 2019/4/19

解 2019/4/19

则 于是 2019/4/19

解 2019/4/19

所以 因此 2019/4/19

§5 独立性与不相关性、矩 §5.1 独立性与不相关性 定理: 随机变量X与Y不相关与下列结论之一等价. 1. 2. 3. §5 独立性与不相关性、矩 §5.1 独立性与不相关性 定理: 随机变量X与Y不相关与下列结论之一等价. 1. 2. 3. 2019/4/19

解 2019/4/19

同理可得 E(Y)=0 于是 即X与Y相关,从而X与Y不独立. 2019/4/19

Y X -1 1 1/6 1/3 解 X与Y的分布律分别为 X -1 1 P 1/3 Y -1 1 P 2/3 1/3 2019/4/19

则有 于是 即 亦即X与Y相关. 而 故X与Y不相互独立. 2019/4/19

§5.2 随机变量的矩 定义:设X和Y是随机变量, (1)若E(Xk)(k=1,2,…)存在,则称它为X的k阶原点矩,简称k阶矩. E(X-0)k (2)若E{[X-E(X)] k} (k=1,2,…)存在,则称它为X的k阶中心矩. 更一般地,若a是一常数,p是一正数,如果E[(X-a)p]存在,则称它是关于a点的p阶矩. (3)若E(XkYl) (k,l=1,2,…)存在,则称它为X和Y的k+l阶混合矩. (4)若E{[X-E(X)] k[Y-E(Y)] l} (k,l=1,2,…)存在,则称它为X和Y的k+l阶混合中心矩. 2019/4/19

随机变量X与Y的二阶中心矩共有四个,分别记为: 2019/4/19

例:设X,Y的联合分布列如表所示试求X和Y的协方差矩阵. 解 因为E(X)=0×(1-p)+0×0+1×0+1×p=p, 同样E(Y)=p. 所以,c11=D(X)=(0-p)2(1-p)+(1-p)2p=p(1-p),同样c22=p(1-p) c12= c21= E{[X-E(X)][Y-E(Y)]} =(0-p)(0-p)(1-p)+(0-p)(1-p)0+(1-p)(0-p)0+(1-p)(1-p)p =p(1-p) 故协方差矩阵为 2019/4/19

例:设(X,Y)在矩形区域G={(x,y)|a≤x≤b,c≤y≤d}上服从均匀分布,试求X和Y的协方差矩阵. 解 同样得 所以X和Y的协方差矩阵为 2019/4/19

本章完! 2019/4/19