第四章几种重要的分布 4.1 二项分布 4.2 超几何分布 4.3 普哇松分布 4.4 指数分布 4.5 Γ-分布 4.6 正态分布
贝努里(Bernoulli)概型与二项分布 4.1二项分布 (一)随机变量ξ的分布律 贝努里(Bernoulli)概型与二项分布 1. (0-1)分布 若以X表示进行一次试验事件A发生的次数,则称X服从(0-1)分布(两点分布) X~P{X=k}=pk(1-p)1-k, (0<p<1) k=0,1 或
2.定义 设将试验独立重复进行n次,每次试验中,事件A发生的概率均为p,则称这n次试验为n重贝努里试验.事件A恰好发生k次的概率为 其中0<P<1,q=1-p, 则称ξ服从参数为n,p的二项分布。记作ξ~B(n,p)
P{ξ=k}的值恰好是二项式(q+px)n展开式中第k+1项xk的系数。 ξ的分布函数为: 事件A至多出现m次的概率是 事件A出现次数不小于不大于 的概率是
例.从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3. (1)设ξ为汽车行驶途中遇到的红灯数,求ξ的分布律. (2)求汽车行驶途中至少遇到5次红灯的概率. 解:(1)由题意,ξ~B(6,1/3),于是,ξ的分布律为:
例1 某工厂每天用水量保持正常的概率为3/4,求最近6天内用水量正常的天数的分布。 例1 某工厂每天用水量保持正常的概率为3/4,求最近6天内用水量正常的天数的分布。 解 设最近六天内用水量保持正常的天数为ξ。它服从二项分布,ξ~B(6 0.75) 用公式(4.1)计算其概率值,得到: 1 2 3 4 5 6 P 0.0002 0.0044 0.0330 0.1318 0.2966 0.3560 0.1780
例2 10部机器各自独立工作,因修理调整等原因, 每部机器停车的概率为0.2,求同时停车数目ξ的分布 例2 10部机器各自独立工作,因修理调整等原因, 每部机器停车的概率为0.2,求同时停车数目ξ的分布 解:ξ服从二项分布,ξ~B(10 0.2) 可用贝努里公式计算pk。 现将计算结果列成分布表如下: 1 2 3 4 5 6 7 8 9 10 p 0.11 0.27 0.30 0.20 0.09 0.03 0.01 0.00
例3 一批产品的废品率p=0.03,进行20次重复抽样 (有放回抽取),求出现废品的频率为0.1的概率。 解 令ξ表示20次重复抽取中废品出现的次数, 它服从二项分布。ξ~B(20 0.03)
(二)二项分布的期望和方差 二项分布B(n, p)
二项分布B(n, p):
例3 若ξ~B(n,p),求E(ξ) 解:设 第i次试验事件A发生 第i次试验事件A不发生 则
求Dξ 第i次试验事件A发生 设 第i次试验事件A不发生 则
(三)二项分布的最可能值 二项分布中ξ可以取值0,1,…, n。使概率P{ξ=k}取 最大值的k,记作k0,称k0为二项分布的最可能值。
由(2)得
(4.3)
例4 某批产品中有80%的一等品,对它们进行重复抽样检验,共取出4个样品,求其中一等品数ξ的最可能值,并用贝努里公式验证。 解 ξ服从二项分布,ξ~B(4 0.8) np+p=3.2+0.8=4是整数,所以k0=4 和 k0=3时 P{ξ=k0}为最大。即取出4个样品时, 一等品个数最可能是3或4。 用贝努公式计算ξ的分布律下 ξ 1 2 3 4 p 0.0016 0.0256 0.1536 0.4096
4.2超几何分布 例1 某班有学生20名,其中有5名女同学,今从班上任选4名学生去参观展览,被选到的女同学数ξ是一个随机变量,求ξ的分布。 例1 某班有学生20名,其中有5名女同学,今从班上任选4名学生去参观展览,被选到的女同学数ξ是一个随机变量,求ξ的分布。 解 ξ可以取0,1,2,3,4这5个值, 计算结果列成概率分布表如下: ξ 1 2 3 4 p 0.2817 0.4696 0.2167 0.0310 0.0010
例2 若一班有学生20名,其中3名女同学,从班上任选4名去参观,求被选到的女同学人数ξ这一随机变量的分布律。 解 可以取0,1,2,3这4个值。 列成概率分布如下 ξ 1 2 3 p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类,N2个属于第二类(N1+N2=N)。从中按不重复抽样取n个,令ξ表示这n个中第一(或二)类元素的个数,则ξ的分布称为超几何分布。其概率函数是 p 1 q p 当N→∞时, 超几何分布以二项分布为极限
例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后,(1)恰有8粒发芽的概率; (2)不少于8粒发芽的概率。 例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后,(1)恰有8粒发芽的概率; (2)不少于8粒发芽的概率。 解 设10粒种子中发芽的种子数目为ξ。因10粒种子是由一大批种子中抽取的,这是一个N很大,n相对于N很小的情况下的超几何分布问题,可用二项分布公式近似计算。ξ~B(10 0.9)
4.3普哇松分布 定义4.3 如果随机变量ξ的概率函数是 其中 λ>0 ,则称ξ 服从普哇松(Poisson) 分布。 利用级数 易知
由于 或 两边对求导得 或
普哇松分布常见于所谓稠密性的问题中。 如一段时间内,电话用户对电话台的呼唤次数, 候车的旅客数,原子放射粒子数, 织机上断头的次数, 以及零件铸造表面上一定大小的面积内砂眼的个数等等。 在二项分布中,ξ~B(n,p)当n比较大,p很小时, 用普哇松分布近似代替二项分布的公式,其中 λ=np 普哇松分布的方便之处在于有现成的分布表 (见附表一)可查,免于复杂的计算。
普哇松定理表明,普哇松分布是二项分布的极限分布, 当n很大,p很小时,二项分布就可近似地 看成是参数=np的普哇松分布 ξ~B(n,p)与ξ~Pλ(ξ=k)的比较
例1 ξ服从普哇松分布,Eξ=5,查表求 P(ξ=2)= P(ξ=5)= P(ξ=20)= 解 因普哇松分布的参数λ就是它的期望值Eξ, 故 λ=5查书后附表一, 有p5(2)=0.084224 p5(5)=0.175467 P5(20)=0
例2 一大批产品的废品率为 p=0.015 求任取一箱 (有100个产品),箱中恰有一个废品的概率。 解 所取一箱中的废品个数 服从超几何分布, 由于产品数量N很大,可按二项分布公式算, 其中n=100, p=0.015 但由于n较大而p很小, 可用普哇松分布公式近似代替二项分布公式计算。 其中λ =np=1.5,查表得: 误差不超过0.01
试用普哇松分布公式计算疵点数的分布,并与实际 检查结果比较。 例3 检查了100个零件上的疵点数,结果如表4-6: 疵点数 1 2 3 4 5 6 频数 14 27 26 20 7 频率 0.14 0.27 0.26 0.20 0.07 0.03 概率 0.1353 0.2707 0.1804 0.0902 0.0361 0.0120 试用普哇松分布公式计算疵点数的分布,并与实际 检查结果比较。 解: 要用普哇松(Poisson) 分布公式计算,首先要求出λ
y y θ θ x
4. 4 指数分布 定义4.4 如果随机变量ξ的概率密度为 x 其中λ>0,则称ξ服从参数为λ的指数分布。 易知 它的分布函数
对任何实数a,b (0≤a<b),有 在习题三第12题中已经算出它的期望和方差:
指数分布常用来作为各种“寿命”分布的近似。如 随机服务系统中的服务时间,某些消耗性产品(电子 元件等)的寿命等等,都常被假定服从指数分布。 假若产品的失效率为λ,则产品在t( t>0) 时间 失效的分布函数 而产品的可靠度为:
例1 某元件寿命ξ服从参数为λ(λ-1 =1000)的指数分布。3个这样的元件使用1000小时后,都没有损坏的概率是多少? 例1 某元件寿命ξ服从参数为λ(λ-1 =1000)的指数分布。3个这样的元件使用1000小时后,都没有损坏的概率是多少? 解 参数为λ的指数分布的分布函数为 各元件寿命相互独立,因此3个这样的元件使用1000小时都未损坏的概率为
例 .电子元件的寿命ξ(年)服从参数为3的指数分布 (1)求该电子元件寿命超过2年的概率。 (2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少? 解
参数为t的普哇松分布,求T的概率密度。 设[0,t]时段内过桥的汽车数Xt服从 参数为t的普哇松分布,求T的概率密度。 解 当t ≤0时, 当t >0时, =1- {在t时刻之前无汽车过桥} 于是
4.5 Γ-分布 定义4.5 如果连续性随即变量ξ具有概率密度 其中λ>0,r>0,则称ξ服从Γ-分布,记作ξ~Γ(λ,r) 4.5 Γ-分布 定义4.5 如果连续性随即变量ξ具有概率密度 其中λ>0,r>0,则称ξ服从Γ-分布,记作ξ~Γ(λ,r) 这里的Γ(r)就是微积分里定义的 Γ-函数,即
当r>0时这个积分式收敛的,利用Γ-函数的定义可以证明 还可以计算出 Γ-分布在概率论,数理统计和随机过程中都有不少应用。 当r=1时,为指数分布
当r为正整数时, 它是排队论中常用到的r阶爱而朗分布;
当r =n/2(n是正整数),λ=1/2时 就是具有n个自由度的χ2分布 简记作χ2 (n) 它是数理统计中最重要的几个常用统计量的分布之一。 自由度: 表示进入到所要考虑的统计问题中自由变量的个数 多一个约束条件,就少一个自由变量.
定理4.1 如果ξ1,ξ2,…,ξn相互独立,且ξi服从参数为λ,ri的Γ-分布,则它们的和 ξ1+ξ2+…+ξn服从参数为 r1+r2+…+rn的Γ-分布 Γ-分布具有可加性 证明:略
4.6 正态分布 正态分布是实践中应用最为广泛,在理论上 研究最多的分布之一,故它在概率统计中占有特 别重要的地位。 B A 4.6 正态分布 正态分布是实践中应用最为广泛,在理论上 研究最多的分布之一,故它在概率统计中占有特 别重要的地位。 B A A,B间真实距离为,测量值为ξ。ξ的概率密度应该是什么形态?
(一) 正态分布的概率密度 定义4.6 如果连续型随机变量ξ的概率密度为 其中σ,μ为常数,并且σ>0,则称ξ服从参数为μ,σ正态分布, 简记作N(, 2) 利用普哇松积分 可以验证
=0
特别地,当参数μ=0,σ =1时,φ(x) 可以写成 称它为标准正态分布的概率密度,简记作N(0,1)
其中 为实数, >0 ,则称ξ服从参数为 ,2的正态分布,记为N(, 2),可表为ξ~N(, 2). 若随机变量 其中 为实数, >0 ,则称ξ服从参数为 ,2的正态分布,记为N(, 2),可表为ξ~N(, 2).
正态分布有两个特性: (1) 单峰对称 密度曲线关于直线x=对称;(p93) φ()=maxφ(x)= .
(2) 的大小直接影响概率的分布 越大,曲线越平坦, 越小,曲线越陡峻,。 正态分布也称为高斯(Gauss)分布
(二) 标准正态分布概率密度φ0(x)的性质及 概率密度函数表 标准正态分布ξ~N(0,1)密度函数表示为 分布函数表示为
φ0(x)除具有一般概率密度的性质外,还有下列性质: (2) φ0(-x) = φ0(x) ,即 φ0(x) 的图形关于y轴对称; (3) φ0(x)在( -∞,0)内严格上升,在 ( 0,+∞) 内严格下降,在x=0处达到最大值: (4) φ0(x) 在x= ±1处有两个拐点; (5) 即x轴是曲线 φ0(x) 的水平渐近线。 例1 介绍查概率密度函数表
例1 ξ~N(0,1) 求 0.07754 0.3391 0.3989 0.002096
(三)一般正态分布与标准正态分布的关系 定理4.2 如果 其概率密度分别记为 分布函数分别记为 证:
定理4.3 如果 称随机变量函数 为标准化变换。 证:
(四) 标准正态分布函数表 如果ξ~N(0,1),则对大于零的实数x, 的值可以由附表三直接查到。
例2 = 0.975 =P(ξ≥1.96)=1- P(ξ≤1.96)=0.025 =P(-1.96≤ξ≤1.96)= =0.95 =0.97725+0.8413-1 =0.81855 =1
∴如果ξ~N(0,1),则
例3 解:
例4 解: 查表得:
P{1.32<ξ<2.43}=(2.43)-(1.32) =0.9925-0.9066 若 ξ~N(0,1),(0.5)=0.6915, P{1.32<ξ<2.43}=(2.43)-(1.32) =0.9925-0.9066 正态分布表 注:(1) (x)=1- (-x); (2) 若X~N(, 2),则
(五)正态分布与Γ-分布的关系 定理 4.4 如果 ξ服从N(0, 1),则ξ2服从 λ=0.5,r=0.5的Γ-分布,即 证: 当x≤0时, 当x>0时
当x>0时
(六) 二元正态分布 定义4.7 若二元连续型随机变量(ξ,η)的联合概率密度为 (4.16) 其中 均为常数 。 定义4.7 若二元连续型随机变量(ξ,η)的联合概率密度为 (4.16) 其中 均为常数 。 时,称(ξ,η)服从二元正态分布
定理 4.5 二元正态分布的边缘概率密度是一元正态分布。 定理 4.5 二元正态分布的边缘概率密度是一元正态分布。 证:设(ξ,η)的联合概率密度由(4.16)式给出, ξ的边缘概率密度记为 =1
由第三章的知识我们知道: 相互独立的两个随机变量一定不相关ρ=0 但是不相关的随机变量不一定独立 然而对于二元正态分布来说,有定理4.6成立 定理4.6 服从二元正态分布的随机变量(ξ,η ) 它们独立的充分必要条件是ξ与η的相关系数ρ=0
证:必要性 充分性
定义4.8 若连续型随机变量ξ的概率密度为 称ξ服从具有n个自由度的t分布,简记为t(n)。
定义4.9 若连续型随机变量 ξ的概率密度为 称 ξ 服从具有第一个自由度为 n1 , 第二个自由度为n2 的F分布,简记为