概率论与数理统计 课件制作:应用数学系 概率统计课程组
大数 定律 中心极 限定理 第五章 大数定律与中心极限定理 本章要解决的问题 ANSWER 为何能以某事件发生的频率 第五章 大数定律与中心极限定理 本章要解决的问题 ANSWER 为何能以某事件发生的频率 作为该事件的 概率的估计? 大数 定律 为何能以样本均值作为总体 期望的估计? 为何正态分布在概率论中占 有极其重要的地位? 中心极 限定理 大样本统计推断的理论基础 是什么?
5.1 大数定律 重要不等式 设非负随机变量 X 的期望 E( X )存在, 则对于任意实数 > 0, 5.1 大数定律 重要不等式 马尔可夫(Markov) 不等式 设非负随机变量 X 的期望 E( X )存在, 则对于任意实数 > 0, 证 仅证连续型随机变量的情形
设随机变量 X 的k阶绝对原点矩 E( |X |k)存在, 则对于任意实数 > 0, 推论 1 设随机变量 X 的k阶绝对原点矩 E( |X |k)存在, 则对于任意实数 > 0, 推论 2 ——切贝雪夫( chebyshev )不等式 设随机变量 X 的方差 D ( X )存在, 则对于任意实数 > 0, 或
示意图 j(x) Dx/e2 x Ex-e Ex Ex+e
例1 设x是掷一颗骰子所出现的点数, 若给定e=1,2, 实际计算P(|x-Ex|e), 并验证切贝谢 夫不等式成立 例1 设x是掷一颗骰子所出现的点数, 若给定e=1,2, 实际计算P(|x-Ex|e), 并验证切贝谢 夫不等式成立. 解 因P(x=k)=1/6, (k=1,2,3,4,5,6)
例2 设有一大批种子,其中良种占1/6. 试估计 在任选的 6000 粒种子中, 良种所占比例与 1/6 比较上下小于1%的概率. 解 设 X 表示 6000 粒种子中的良种数 , X ~ B (6000,1/6 )
实际精确计算: 用Poisson 分布近似计算: 取 = 1000
例3 设每次试验中,事件 A 发生的概率为 0.75, 试用 Chebyshev 不等式估计, n 多大时, 才 能在 n 次独立重复试验中, 事件 A 出现的 频率在0.74 ~ 0.76 之间的概率大于 0.90? 解 设 X 表示 n 次独立重复试验中事件 A 发生 的次数 , 则 X ~ B(n,0.75) 要使 ,求 n
即 即 由 Chebyshev 不等式, = 0.01n ,故 令 解得
若 E(X ) = , D(X ) = 2, 类似于正态分布的3 原理,由 Chebyshev 不等式可估计 由 Chebyshev 不等式,可看出 D (X) 反映了 X 偏离 E(X ) 的程度. 固定 , 较小者, 较小. Chebyshev 不等式对于 2 2 无实际意义
大数定律 贝努里(Bernoulli) 大数定律 有 或 设 nA 是 n 次独立重复试验中事件 A 发生的 次数, p 是每次试验中 A 发生的概率,则 有 或
证 引入随机变量序列{Xk} 设 则 相互独立, 记 由Chebyshev 不等式
故
贝努里(Bernoulli) 大数定律的意义: 在概率的统计定义中,事件 A 发生的频率 “ 稳定于”事件 A 在一次试验中发生的概率是 指: 频率 与 p 有较大偏差 是 小概率事件, 因而在 n 足够大时, 可以用频率 近似代替 p . 这种稳定称为依概率稳定.
定义 是一系列随机变量, 设 a 是一常数, 有 若 (或 则称随机变量序列 依概率收敛 于常数 a , 记作 故
结果同样适用于服从其它分布的独立随 在 Bernoulli 定理的证明过程中, Y n 是相互 独立的服从 0-1分布的随机变量序列 {Xk} 的 算术平均值, Y n 依概率收敛于其数学期望 p . 结果同样适用于服从其它分布的独立随 机变量序列
Chebyshev 大数定律 相互独立, 设随机变量序列 (指任意给定 n > 1, 相互独立),且 具有相同的数学期望和方差 则 有 或
定理的意义: 具有相同数学期望和方差的独立随机变量序列的 算术平均值依概率收敛于数学期望. 当 n 足够大时,算术平均值几乎就是一个常数, 可以用算术平均值近似地代替数学期望.
不一定有相同的数学 期望与方差,可设 注1: 有 相互独立的条件可以 去掉,代之以 注2:
辛钦大数定律 设 相互独立,服从同一 分布,且具有数学期望 E(X k) = , k= 1,2,…, 则对任意正数 > 0
相互独立, 注3: 设随机变量序列 具有相同的分布,且 则 有 记
则 连续, 若 则
§5.2 中心极限定理 定理1 独立同分布的中心极限定理 设随机变量序列 相互 独立,服从同一分布,且有期望和方差: 则对于任意实数 x ,
注: 记 则 Y n 为 的标准化随机变量. 即 n 足够大时,Y n 的分布函数近似于标准正态 随机变量的分布函数 近似 近似服从
定理2 李雅普诺夫(Liapunov)定理 设随机变量序列 相互 独立,且有有限的期望和方差: 记 若
则对于任意实数 x ,
定理3 德莫佛 — 拉普拉斯中心极限定理 (DeMoivre-Laplace ) 设 Y n ~ B( n , p) , 0 < p < 1, n = 1,2,… 则对任一实数 x,有 即对任意的 a < b, Y n ~ N (np , np(1-p)) (近似)
正态分布的概率密度的图形 x m m+s m-s
二项分布的随机变量可看作许多相互独立的0-1分布的随机变量之和, 下面是当x-B(20,0.5)时, x的概率分布图
普阿松分布相当于二项分布中p很小n很大的分布, 因此, 参数l=np当很大时也相当于n特别大, 这个时候普阿松分布也近似服从正态分布, 下面是l=30时的普阿松概率分布图.
中心极限定理的应用 X ~ B(6000,1/6) 例1 设有一大批种子,其中良种占1/6. 试估计 例1 设有一大批种子,其中良种占1/6. 试估计 在任选的6000粒种子中,良种所占比例与 1/6比较上下不超过1%的概率. 解 设 X 表示6000粒种子中的良种数 , 则 X ~ B(6000,1/6)
近似
比较几个近似计算的结果 用二项分布(精确结果) 用Poisson 分布 用Chebyshev 不等式 用中心极限定理
X ~ B(200,0.6) , X ~ N (120, 48) (近似) 例2 某车间有200台车床,每台独立工作,开工 例2 某车间有200台车床,每台独立工作,开工 率为0.6. 开工时每台耗电量为 r 千瓦. 问供 电所至少要供给这个车间多少电力, 才能以 99.9% 的概率保证这个车间不会因供电不足 而影响生产? 解 设至少要供给这个车间 a 千瓦的电力 设 X 为200 台车床的开工数. X ~ B(200,0.6) , X ~ N (120, 48) (近似) 问题转化为求 a , 使
由于将 X 近似地看成正态分布,故
反查标准正态函数分布表,得 令 解得 (千瓦)
例3 检查员逐个地检查某种产品, 每检查一只 产品需要用10秒钟 . 但有的产品需重复检 查一次,再用去10秒钟. 假设产品需要重 复检查的概率为 0.5, 求检验员在 8 小时内 检查的产品多于1900个的概率. 解 检验员在 8 小时内检查的产品多于1900个 即检查1900个产品所用的时间小于 8 小时. 设 X 为检查1900 个产品所用的时间(单位: 秒) 设 Xk 为检查第 k 个产品所用的时间(单位:秒), k = 1,2,…,1900
Xk P 10 20 0.5 0.5 相互独立,且同分布,
解法二 — 1900个产品中需重复检查的个数
例4 对敌人的防御工事用炮火进行 100 次轰击, 设每次轰击命中的炮弹数服从同一分布, 其 数学期望为 2, 均方差为 1.5 . 如果各次轰击 命中的炮弹数是相互独立的, 求100 次轰击 (1) 至少命中180发炮弹的概率; (2) 命中的炮弹数不到200发的概率. 解 设 X k 表示第 k 次轰击命中的炮弹数 相互独立,
设 X 表示100次轰击命中的炮弹数, 则 (1) (2)
例5 售报员在报摊上卖报, 已知每个过路人在 报摊上买报的概率为1/3. 令X 是出售了100份 报时过路人的数目,求 P (280 X 320). 解 令Xi 为售出了第 i – 1 份报纸后到售出第i 份报纸时的过路人数, i = 1,2,…,100 (几何分布)
相互独立,
中心极限定理的意义 在实际问题中,若某随机变量可以看 作是有相互独立的大量随机变量综合作用 的结果,每一个因素在总的影响中的作用 都很微小,则综合作用的结果服从正态分 布.
练习1 (2002年数学四考研试题) 设随机变量 相互独立, 则根据列维-林德贝格中心极限定理,当n充分大时, 近似 服从正态分布,只要 ( ). 有相同的数学期望 (B) 有相同的方差 (C ) 服从同一指数分布 (D) 服从同一离散型分布 练习2(2001年数学四考研试题十一题) 一生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱平均重50千克,标准差为5千克。若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可装多少箱,才能保障不超载的概率大于0.977. ( (2)=0.977,其中(x)是标准正态分布的分布函数)
作业 *补充:设某农贸市场某种商品每日的价格的变化是均值为0,方差为 2 = 2的随机变量,即 其中Yn是第n天该商品的价格。如果今天的价格为100,求18天后该商品的价格在96与104之间的概率。