在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了. P(x) o f (x) x o
然而,在实际问题中,概率分布一般是较难确定的. 而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了. 某型号电视机的平均寿命 18000小时±200小时
因此,在对随机变量的研究中,确定某些数字特征是重要的 . 在这些数字特征中,最常用的是 期望和方差 我们先介绍随机变量的数学期望.
随机变量的数学期望是概率论中最重要的概念之一. 它的定义来自习惯上的平均概念. 我们从离散型随机变量的数学期望开始.
一、离散型随机变量的数学期望 1、概念的引入: 某车间对工人的生产情况进行考察. 车工小张每天生产的废品数X是一个随机变量. 如何定义X的平均值呢? 某电话交换台每天8:00-9:00收到的呼叫数X是一个随机变量. 如何定义X的平均值即该交换台每天8:00-9:00收到的平均呼叫数呢? 我们来看第一个问题.
例1 某车间对工人的生产情况进行考察. 车工小张每天生产的废品数X是一个随机变量. 如何定义X的平均值呢? 32天没有出废品; 30天每天出一件废品; 17天每天出两件废品; 21天每天出三件废品; 若统计100天, 可以得到这100天中 每天的平均废品数为 这个数能否作为 X的平均值呢?
一般来说,若统计n天, 可以得到n天中每天的平均废品数为 可以想象,若另外统计100天,车工小张不出废品,出一件、二件、三件废品的天数与前面的100天一般不会完全相同,这另外100天每天的平均废品数也不一定是1.27. n0天没有出废品; n1天每天出一件废品; n2天每天出两件废品; n3天每天出三件废品. 一般来说,若统计n天, (假定小张每天至多出三件废品) 可以得到n天中每天的平均废品数为
这样得到一个确定的数. 我们就用这个数作为随机变量X的平均值 . 这是 以频率为权的加权平均 由频率和概率的关系 不难想到,在求废品数X 的平均值时,用概率代替 频率,得平均值为 这是 以概率为权的加权平均 这样得到一个确定的数. 我们就用这个数作为随机变量X的平均值 . 这样做是否合理呢?
不妨把小张生产中出废品的情形用一个球箱模型来描述: 2 3 1 有一个箱子,里面装有10个大小,形状完全相同的球,号码如图. 规定从箱中任意取出一个球,记下球上的号码,然后把球放回箱中为一次试验. 2 3 1
记X为所取出的球的号码(对应废品数) . X为随机变量,X的概率函数为 2 3 1
对试验次数(即天数)n,及小张的生产情况进行统计,统计他不出废品,出一件、二件、三件废品的天数n0,n1,n2,n3 , 并计算 1 与 进行比较.
对于一个随机变量,若它可能取的值是X1, X2, …, 相应的概率为 p1, p2, …, 但是,如果试验次数很大,出现Xk的频率会接近于pk,于是可期望试验值的平均值接近 由此引入离散型r.vX的数学期望的定义如下:
定义1 设X是离散型随机变量,它的概率函数是: P(X=Xk)=pk , k=1,2,… 如果 有限,定义X的数学期望 也就是说,离散型随机变量的数学期望是一个绝对收敛的级数的和.
例1 某人的一串钥匙上有n把钥匙,其中只有一把能打开自己的家门,他随意地试用这串钥匙中的某一把去开门 解: 设试开次数为X, P(X=k)= 1/n , k=1,2,…,n E(X) 于是
二、连续型随机变量的数学期望 设X是连续型随机变量,其密度函数为f (x),在数轴上取很密的分点x0 <x1<x2< …,则X落在小区间[xi, xi+1)的概率是 阴影面积 近似为 小区间[xi, xi+1)
由于xi与xi+1很接近, 所以区间[xi, xi+1)中的值可以用xi来近似代替. 近似, 因此X与以概率 取值xi的离散型r.v 该离散型r.v 的数学期望是 阴影面积 近似为 这正是 小区间[Xi, Xi+1) 的渐近和式.
由此启发我们引进如下定义. 定义2 设X是连续型随机变量,其密度函数 为 f (x),如果 有限,定义X的数学期望为 也就是说,连续型随机变量的数学期望是一个绝对收敛的积分.
若X~U(a,b),即X服从( a,b)上的均匀分布,则 由随机变量数学期望的定义,不难计算得: 若X~U(a,b),即X服从( a,b)上的均匀分布,则 若X服从参数为 若X服从
已知某地区成年男子身高X~ 这意味着,若从该地区抽查很多个成年男子,分别测量他们的身高,那么,这些身高的平均值近似是1.68.
三、随机变量函数的数学期望 1. 问题的提出: 设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望. 那么应该如何计算呢?
如何计算随机变量函数的数学期望? 一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来. 一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来. 使用这种方法必须先求出随机变量函数g(X)的分布,一般是比较复杂的 .
那么是否可以不先求g(X)的分布而只根据X的分布求得E[g(X)]呢? 下面的基本公式指出,答案是肯定的.
类似引入上述E(X)的推理,可得如下的基本公式: 设X是一个随机变量,Y=g(X),则 当X为离散型时,P(X= xk)=pk ; 当X为连续型时,X的密度函数为f(x).
该公式的重要性在于: 当我们求E[g(X)]时, 不必知道g(X)的分布,而只需知道X的分布就可以了. 这给求随机变量函数的期望带来很大方便.
将g(X)特殊化,可得到各种数字特征: 其中 k 是正整数.
4. 设X、Y独立,则 E(XY)=E(X)E(Y); 四、数学期望的性质 1. 设C是常数,则E(C)=C; 2. 若k是常数,则E(kX)=kE(X); 注意:由E(XY)=E(X)E(Y) 不一定能推出X,Y独立 3. E(X1+X2) = E(X1)+E(X2); 4. 设X、Y独立,则 E(XY)=E(X)E(Y); (诸Xi独立时)
五、数学期望性质的应用 例1 求二项分布的数学期望 若 X~B(n,p), 则X表示n重贝努里试验中的“成功” 次数. 现在我们来求X的数学期望 .
可见,服从参数为n和p的二项分布的随机变量X的数学期望是np. X~B(n,p), 则X表示n重贝努里试验中的“成功” 次数. i=1,2,…,n 若设 则 X= X1+X2+…+Xn 因为 P(Xi =1)= p, P(Xi =0)= 1-p E(Xi)= = p 所以 E(X)= = np 可见,服从参数为n和p的二项分布的随机变量X的数学期望是np.
解: 设巧合个数为X, 引入 则 由于 E(Xk)=P(Xk =1) 故 例2 把数字1,2,…,n任意地排成一列,如果数字k恰好出现在第k个位置上,则称为一个巧合,求巧合个数的数学期望. 解: 设巧合个数为X, 引入 k=1,2, …,n 则 由于 E(Xk)=P(Xk =1) 故
例3 设甲、乙两人玩必分胜负的赌博游戏,假定游戏的规则不公正,以致两人获胜的概率不等,甲为p,乙为q,p>q,p+q=1 例3 设甲、乙两人玩必分胜负的赌博游戏,假定游戏的规则不公正,以致两人获胜的概率不等,甲为p,乙为q,p>q,p+q=1.为了补偿乙的不利地位,另行规定两人下的赌注不相等,甲为 a, 乙为b, a>b. 现在的问题是:a究竟应比b大多少,才能做到公正? 解:设甲赢的钱数为X,乙赢的钱数为Y, 依题意
E(X)=bp+(-a)q, E(Y)=aq+(-b)p 解:设甲赢的钱数为X,乙赢的钱数为Y, 依题意 E(X)=bp+(-a)q, E(Y)=aq+(-b)p 为对双方公正,应有 故 bp-aq=aq-bp=0,
期望与风险并存.数学家从期望值来观察风险,分析风险,以便作出正确的决策. 例如,有一家个体户,有资金一笔,如经营西瓜,风险大但利润高(成功的概率为0.7,获利2000元); 如经营工艺品,风险小但获利少(95%会赚,但利润为1000元).究竟该如何决策?
于是计算期望值: 若经营西瓜,期望值E1=0.7×2000=1400元. 而经营工艺品期望值E2=0.95×1000=950元. 所以权衡下来,情愿“搏一记”,去经营西瓜,因它的期望值高.
我们介绍了随机变量的数学期望,它反映了随机变量取值的平均水平,是随机变量的一个重要的数字特征. 接下来我们将向大家介绍随机变量另一个重要的数字特征: 方差