概率论 ( Probability) 2016年 2019年4月13日星期六
第五章 大数定律和中心极限定理 大数定律:对于随机变量序列 在什么条件下以什么形 描述其平均值 式呈现出稳定性。 第五章 大数定律和中心极限定理 本章是关于随机变量序列的极限理论。 大数定律:对于随机变量序列 在什么条件下以什么形 描述其平均值 式呈现出稳定性。 中心极限定理:对于随机变量序列 其部分和 在什么条件下以正态分布为极限 分布。
§5.1 大数定律 一、切比雪夫不等式 二、依概率收敛的概念 三、几个常见的大数定律
一 切比雪夫不等式 一阶原点矩 二阶中心矩
注:①由切比雪夫不等式可得 可见D(X) 越小,事件 的概率越接近1。 X 的值密集在其数学期望附近的概率越大。 不等式体现了方差 D(X) 的概率意义——它是描述随机变量 X 的取值与其数学期望值 E(X) 的离散程度的量。 ② 当 随机变量 X 的数学期望 E(X) 和方差 D(X) 已知,而其分布未知的情况下,利用切比雪夫不等式,可以对事件 { |XE(X |)< } (其中 是任意的小正数)发生的概率给出一个初步的估计。
例如,取 ,则有 即无论 随机变量 X 服从什么样的分布,其取值落入以其数学期望 EX 为中心,以其 3 倍的标准差 为半径的邻域 ( EX ,EX+ )内的概率都不小于 89% 。
已知正常男性成人血液中,每一毫升白细胞数 例1 平均是7300,均方差是700,利用切比雪夫不等式 估计每毫升白细胞数在 5200~9400 之间的概率 . 解 设每毫升白细胞数为X 依题意,EX =7300,DX =7002 所求为 由切比雪夫不等式 即每毫升白细胞数在5200-9400之间的概率不小于8/9。
二、依概率收敛 依概率收敛于a ,记为 设随机变量序列 有: 则称 ,如果存 在常数 a ,使得对于任意 定义 注意 :
意思是:当 时, Xn落在 内的概率越来越大.即 a 极有可能 而 意思是: , 当 必定
三 几个常见的大数定律
1 伯努里大数定律 设 nA 是 n 重伯努利试验中事件A 发生的次数, p 是每次试验中 A 发生的概率, 则 有 根据切比雪夫不等式,
2 切比雪夫大数定律 切比雪夫
切比雪夫大数定律说明:在定理的条件下,当n充分大时,n个独立随机变量的算术平均数这个随机变量的离散程度是很小的 切比雪夫大数定律说明:在定理的条件下,当n充分大时,n个独立随机变量的算术平均数这个随机变量的离散程度是很小的.这意味着只要n充分大,尽管n个随机变量可以各有其分布,但其算术平均以后得到的随机变量 将比较密地聚集在它的数学期望 的附近,不再为个别随机变量所左右.作为切比雪夫大数定律的特例,我们有下面的推论.
推论.
5.2 中心极限定理 一、列维-林德伯格中心极限定理 二、棣莫佛-拉普拉斯中心极限定理
§5.2中心极限定理 在第二章,我们学了两个随机变量分布的极限分布的例子: , 则对固定的 k,有 (2)Possion定理: 本节中我们要继续学习极限分布问题。
例2 一枚均匀的骰子连掷 n 次,点数之和为 = 第k 次出现的点数, k =1,2,…,n 分布函数 分布律
2 3 4 5 6 7 8 9 10 11 12 P 分布律 分布函数
分布函数 分布律
分布函数 分布律
? 实际背景 在现实中为什么很多数量指标都服从或近似服从正态分布 研究发现这些指标通常是由大量相互独立的随机因素综合影响而成,即 中心极限定理研究: 当 时,在什么情况下 的极限分布是正态分布? 标准化 的极限分布是 ?
概率论中,把在一定条件下大量独立随机变量和的分布以正态分布为极限的这一类定理,称为中心极限定理。
则 服从中心极限定理。即标准化 一 列维-林德伯格中心极限定理 设随机变量序列X1, X2,…, Xn, … 独立同分布,且 一 列维-林德伯格中心极限定理 设随机变量序列X1, X2,…, Xn, … 独立同分布,且 则 服从中心极限定理。即标准化 即“若随机变量序列满足①独立同分布,且②期望与方差存在,则服从中心极限定理”。
例3 设有30个电子元件,它们的寿命均服从参数为0.1的指数分布(单位:小时),每个元件工作相互独立,求他们的寿命之和超过350小时的概率. 解 由列维-林德伯格中心极限定理
标准正态分布表 他们的寿命之和超过350小时 即他们的寿命之和超过350小时的概率为0.1814
例4 售报员在报摊上卖报, 已知每个过路人在报摊上买报的概率为1/3 例4 售报员在报摊上卖报, 已知每个过路人在报摊上买报的概率为1/3. 令X 是出售了100份报时过路人的数目,求 P (280 X 320). 解 令Xi 为售出了第 i – 1 份报纸后到售出第i 份报纸时的过路人数, i = 1,2,…,100 相互独立, 由列维中心极限定理, 有
由于 二、棣莫佛-拉普拉斯中心极限定理 证明 棣莫弗-拉普拉斯中心极限定理是棣莫弗于1730年给出的概率论历史上第一个中心极限定理.在此后的大约200年中,有关对独立随机变量和的极限分布的讨论一直是概率论研究的中心,故称为“中心极限定理”.
例5 某工厂有200台同类型的机器,每台机器工作时需 要的电功率为1千瓦,由于工艺等原因,每台机器的实 际工作时间只占全部工作的75%,各台机器工作是相互 独立的,求: (1)任一时刻有144至160台机器正在工作的概率. (2)至少需要供应多少电功率可以保证该厂不会因为供电不足而影响生产的概率不少于0.99. n =200,p =0.75,q =0.25,np =150,npq =37.5 解 (1)设随机变量X表示200台任一时刻正在工作的机器的台数, 则 X ~ B(200,0.75) . 由棣莫佛-拉普拉斯中心极限定理, 有
(1)任一时刻有144至160台机器正在工作的概率.
(2)设任一时刻正在工作的机器的台数不超过m,则 查标准正态函数分布表,得 由3 原则知,
例6 对于一个学生而言,来参加家长会的家长人 例6 对于一个学生而言,来参加家长会的家长人 数是一个随机变量,设一个学生无家长、1名家长、 2名家长来参加会议的概率分别为0.05、0.8、0.15.若 学校共有400名学生,设各学生参加会议的家长数相互 独立,且服从同一分布. 求参加会议的家长数X超过450的概率. (2) 求有1名家长来参加会议的学生数不多于340的概率.
解 (1) 以Xk ( k=1,2,…,400 )记第k个学生来参加会议 的家长数,其分布律为 1 Xk 2 pk 0.05 0.8 0.15 Xk 相互独立地服从同一分布 近似服从标准正态分布 则随机变量
(2) 以Y表示有一名家长来参加会议的学生数, 则 Y~B(400, 0.8) 由棣莫佛-拉普拉斯中心极限定理, 有