第5章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理
概率论与数理统计是研究随机现象统计规律性的学科. 随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来 概率论与数理统计是研究随机现象统计规律性的学科. 随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来. 也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.
研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究. 极限定理的内容很广泛,其中最重要的有两种: 与 大数定律 中心极限定理
大数定律:对于随机变量序列 在什么条件下以什么形 描述其平均值 式呈现出稳定性。 中心极限定理:对于随机变量序列 其部分和 在什么条件下以正态分布为极限 分布。
5.1 大数定律 一、切比雪夫不等式 二、依概率收敛的概念 三、几个常见的大数定律
一、切比雪夫不等式 设随机变量 的期望值 方差 则对于任意给定的正数 有 注: (1)切比雪夫不等式也可以写成
(2)切比雪夫不等式表明: 随机变量 的方差越小, 则事件 发生的概率越大, 即, 随机变量 集中在期望附近 的可能性越大. 不等式体现了方差 D(X) 的概率意义——它是描述随机变量 X 的取值与其数学期望值 E(X) 的离散程度的量。
(3)在方差已知的情况下, 切比雪夫不等式给出了 与 它的期望的偏差不小于 的概率的估计式. 如 取 则有 故对任给的分布, 只要期望和方差存在, 则随机变 量 取值偏离 超过3倍标准差的概率小于
我们知道,当X=c时有D(X)=0,现在考虑其逆命题是否成立?我们有结论:
由切比雪夫不等式可以得到若干关于矩的不等式。例如
例1 已知正常男性成人血液中, 每一毫升白细胞 数平均是 7300, 标准差是 700. 利用切比雪夫不 等式估计每毫升白细胞数在 5200 ~ 9400 之间的 概率. 解 设每毫升白细胞数为 依题意, 所求概率为
由切比雪夫不等式 即每毫升白细胞数在 5200 ~ 9400 之间的概率不 小于 8/9.
二、依概率收敛的概念 定义 注意 :
意思是:当 时, Xn落在 内的概率越来越大.即 a 极有可能 而 意思是: , 当 必定 依概率收敛不是通常微积分中的收敛
三 几个常见的大数定律
大数定律的客观背景 生产过程中的 废品率 字母使用频率 大量抛掷硬币 正面出现频率 大量的随机现象中平均结果的稳定性
1. 伯努利大数定律 切比雪夫大数定律的另一个推论通常称为伯努利大数定律 n重伯努利试验中事件A发生n次, 每次试验A 发生的概率为 p,则对任意>0, 有 伯努利大数定律表明事件发生的频率依概率收敛于事件的概率。由实际推断原理,在实际应用中, 当试验次数很大时,可以用事件发生的频率来代替事件的概率。
2 切比雪夫大数定律 切比雪夫
切比雪夫大数定律说明:在定理的条件下,当n充分大时,n个独立随机变量的算术平均数这个随机变量的离散程度是很小的 切比雪夫大数定律说明:在定理的条件下,当n充分大时,n个独立随机变量的算术平均数这个随机变量的离散程度是很小的.这意味着只要n充分大,尽管n个随机变量可以各有其分布,但其算术平均以后得到的随机变量 将比较密地聚集在它的数学期望 的附近,不再为个别随机变量所左右.作为切比雪夫大数定律的特例,我们有下面的推论.
推论 这一推论使算术平均值的法则有了理论根据
进一步研究表明,切比雪夫大数定律推论中的方差存在这个条件并不是必要的,下面给出一个独立同分布场合下的辛钦大数定律。
作业 P123 练习5.1 2. 4. 5.
5.2 中心极限定理 一、莱维中心极限定理 二、棣莫佛-拉普拉斯中心极限定理
在实际问题中,常常需要考虑许多随机因素所产生总影响. 例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响. 如瞄准时的误差,空气阻力所产生的误差,炮弹或炮身结构所引起的误差等等. 重要的是这些随机因素的总影响.
本节内容 研究独立随机变量之和所特有的规律性问题 当n无限增大时,这个和的分布是什么?
例1 一枚均匀的骰子连掷 n 次,点数之和为 = 第k 次出现的点数, k =1,2,…,n 分布函数 分布律
2 3 4 5 6 7 8 9 10 11 12 P 分布律 分布函数
分布函数 分布律
分布函数 分布律
自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见. 观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大. 则这种量一般都服从或近似服从正态分布.
? 实际背景 在现实中为什么很多数量指标都服从或近似服从正态分布 研究发现这些指标通常是由大量相互独立的随机因素综合影响而成,即 中心极限定理研究: 当 时,在什么情况下 的极限分布是正态分布? 标准化 的极限分布是 ?
概率论中,把在一定条件下大量独立随机变量和的分布以正态分布为极限的这一类定理,称为中心极限定理。
设 是独立随机变量序列,期望和方差都存在 部分和标准化 一般地,答案是否定的,例如: 除非 服从正态分布,否则结论就不真.
则 服从中心极限定理。即标准化 一 列维-林德伯格中心极限定理 设随机变量序列X1, X2,…, Xn, … 独立同分布,且 一 列维-林德伯格中心极限定理 设随机变量序列X1, X2,…, Xn, … 独立同分布,且 则 服从中心极限定理。即标准化 即“若随机变量序列满足①独立同分布,且②期望与方差存在,则服从中心极限定理”。
例1 设有30个电子元件,它们的寿命均服从参数为0.1的指数分布(单位:小时),每个元件工作相互独立,求他们的寿命之和超过350小时的概率. 解 由莱维中心极限定理
标准正态分布表 他们的寿命之和超过350小时 即他们的寿命之和超过350小时的概率为0.1814
例3 对敌人的防御地段进行100次炮击, 在每次 炮击中, 炮弹命中颗数的数学期望为2, 均方差为1.5, 求在100次炮击中,有180颗到220颗炮弹命中目标的 概率. 解 设Xk为第k次炮击炮弹命中的颗数(k=1,2,…,100), 在100次炮击中炮弹命中的总颗数 Xk相互独立,且E(Xk)=2, D(Xk)=1.52 (k=1,2,…,100) 由莱维中心极限定理
有180颗到220颗炮弹命中目标的概率
二、棣莫佛-拉普拉斯中心极限定理 证明 由于
根据莱维中心极限定理得
棣莫佛-拉普拉斯中心极限定理表明: 当n充分大时,
大时, 可以利用下面公式计算二项分布的概率. 正态分布是二项分布的极限分布,当n充分 大时, 可以利用下面公式计算二项分布的概率.
例5 对于一个学生而言,来参加家长会的家长人 例5 对于一个学生而言,来参加家长会的家长人 数是一个随机变量,设一个学生无家长、1名家长、 2名家长来参加会议的概率分别为0.05、0.8、0.15.若 学校共有400名学生,设各学生参加会议的家长数相互 独立,且服从同一分布. 求参加会议的家长数X超过450的概率. (2) 求有1名家长来参加会议的学生数不多于340的概率.
解 (1) 以Xk ( k=1,2,…,400 )记第k个学生来参加会议 的家长数,其分布律为 1 Xk 2 pk 0.05 0.8 0.15 Xk 相互独立地服从同一分布 近似服从标准正态分布 则随机变量
(2) 以Y表示有一名家长来参加会议的学生数, 则 Y~B(400, 0.8) 由棣莫佛-拉普拉斯中心极限定理, 有
作业 P126 练习5.2 5. 6. 11.