第2章 随机变量及其分布 2.1 随机变量及其分布函数 2.2 离散型随机变量及其分布律 2.3 几种常见的离散型分布 第2章 随机变量及其分布 2.1 随机变量及其分布函数 2.2 离散型随机变量及其分布律 2.3 几种常见的离散型分布 2.4 连续型随机变量及其密度函数 2.5 正态分布 2.6 随机变量函数及其分布
2.1 随机变量及其分布函数 一、随机变量 二、随机变量的分布函数
一、随机变量 例 袋中有3只黑球,2只白球,从中任意取出3只球,观察 取出的3只球中的黑球的个数.我们将3只黑球分别记 作1,2,3号,2只白球分别记作4,5号,则该试验的 样本空间为
我们记取出的黑球数为 X,则X 的可能取值为1,2,3.
由上表可以看出,该随机试验的每一个结果都对应 着变量 X 的一个确定的取值,因此变量 X 是样本空 间Ω上的函数: 我们定义了随机变量后,就可以用随机变量的取值 情况来刻划随机事件.例如 表示取出2个黑球这一事件; 表示至少取出2个黑球这一事件,等等.
一大批产品中次品率为p,从中任取n件,求其中最多有k件次品的概率。 例 求P(B)
Bernoulli试验中,A表示成功,可设
随机变量的定义 定义:设随机试验E的样本空间是Ω={w},如果对于每一个w∈Ω,有一个实数X(w)与之对应,这样就得到一个定义在Ω上的单值实值函数X=X(w),且对任何一个实数 是随机事件,称为随机变量, 简记为X。 此处用{w}表示样本空间,并非样本空间中只有一个元素w,而是用w表示所有的元素。
说 明
例1 盒中有5个乒乓球,其中2个白球,3个黄 球,从中任取3个,记X=“取到白球的个数”,则 有 例1 盒中有5个乒乓球,其中2个白球,3个黄 球,从中任取3个,记X=“取到白球的个数”,则 X是一个随机变量,且X的可能取值是0,1,2,且 有
例2 上午 8:00~9:00 在某路口观察,令 个随机变量.它的取值为 0,1,…. 表示通过的汽车数大于 50 辆但不超过 100 例2 上午 8:00~9:00 在某路口观察,令 Y:该时间间隔内通过的汽车数.则Y 就是一 个随机变量.它的取值为 0,1,…. 表示通过的汽车数小于100辆这一随机事件; 表示通过的汽车数大于 50 辆但不超过 100 辆这一随机事件.
随机变量概念的产生是概率论发展史上的重大事件 随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,使人们可利用数学分析的方法对随机试验结果进行广泛而深入的研究. 随机变量因其取值方式的不同, 通常分为两类: 随机变量 离散型 非离散型 连续型 其它
二、随机变量的分布函数 设X是一个随机变量, 是任意实数, 函数 称为X的分布函数. 几何定义: X x x
用分布函数F(x)表示的事件概率计算公式
例3 掷一枚骰子,设X表示出现的点数,其可能取值为 1,2,3,4,5,6 X的分布函数为 出现的点数小于x的概率 没有可能的点数 包含出现1点 包含出现1,2点 包含出现1,2,3点 包含出现1,2,3,4点 分布函数是累计概率 包含出现1,2,3,4,5点 包含出现1,2,3,4,5,6点
分布函数的性质 (1) (2) (3) F(x) 右连续,即
如果一个函数具有上述性质,则一定是某个r. v X 的分布函数. 也就是说,性质(1)--(3)是鉴别一个函数是否是某 r 如果一个函数具有上述性质,则一定是某个r.v X 的分布函数. 也就是说,性质(1)--(3)是鉴别一个函数是否是某 r.v 的分布函数的充分必要条件.
例4 判别下列函数是否为某随机变量的分布函数? (1) 解 (1) 由题设, 在 上单调不减, 右连续, 并有 所以 是某一随机变量 的分布函数.
例4 判别下列函数是否为某随机变量的分布函数? (2) (2) 因 在 上单调下降, 解 所以 不可能是分布函数.
例5 解 (1)因为分布函数右连续,且
2.2 离散型随机变量及其分布律 一、离散型随机变量的分布律 二、离散型随机变量的分布函数
一、离散型随机变量的分布律 定义 如果一个随机变量仅可能取得有限个或可数无穷多个数值,并且所有的数可按一定的顺序排列,则称该随机变量为离散型随机变量. 设离散型随机变量X其可能的取值为 称 为离散型随机变量X的概率分布或概率函数,也称为分布列或分布律
表格形式 分布列的性质:
例1 有人对随机变量X的分布列表述如下: -1 0 1 2 3 求 . 解 根据概率分布的性质 所以 解得 (舍去)
另外还可用图形来表示分布律:线条图、概率直方图. 0.075 0.325 0.6 0 1 2 X 线条图 0.2 0.4 0.6 1 2 P X P 0.2 0.4 0.6 1 2 0.075 0.325 X 概率直方图
1, 2, 3, 4, 5 例2 袋中有1个白球和4个黑球,每次不放回地从中任取一个球,直至取得白球为止,求取球次数的概率分布. 解 设X为取到白球时的取球次数 X的可能取值为 1, 2, 3, 4, 5 不难求得 1 2 3 4 5 0.2 0.2 0.2 0.2 0.2 因此,所求的概率分布为
二、离散型随机变量的分布函数 则 的分布函数为 即, 时, 当 当 时, 当 时, 当 时,
当 时, 如图, 是一个阶 梯函数, 它在 有跳跃, 跳跃度恰为随机变量 点处的概率 在 反之, 若一个随机变量 的分布函 数, 数为阶梯函 则 一定是一个离散型随机变量, 其概率分布亦由 分布亦由 唯一确定.
例3 设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以 1/2 的概率允许或禁止汽车通过 例3 设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以 1/2 的概率允许或禁止汽车通过. 以X表示汽车首次停下时,它已通过的信号灯的盏数,求X的分布律. (信号灯的工作是相互独立的). 可爱的家园 P{X=3}=(1-p)3p
解 以p表示每盏信号灯禁止汽车通过的概率,则X的分布律为: 1 2 3 4 pk p (1-p) p (1-p)2p (1-p)3p (1-p)4 或写成 P{X= k} = (1- p)kp,k = 0,1,2,3 P{X= 4} = (1-p)4
以p = 1/2代入得X的分布律: X 0 1 2 3 4 pk 0.5 0.25 0.125 0.0625 0.0625 X的分布函数为 0 1 2 3 4 0.5 0.25 0.125 0.0625 0.0625 X的分布函数为 分布函数是累计概率
作业 P47练习2.1 2 P51练习2.2 1 2
课前回顾 随机变量 分布函数 X x x 分布函数的性质: 单调不减函数;
离散型随机变量 离散型随机变量的分布列 分布列的性质: 离散型随机变量的分布函数
2.3 几种常见的离散型分布 一、两点分布 二、二项分布 三、泊松(Poisson)分布 四、超几何分布 *
一、两点分布 定义 若一个随机变量 只有两个可能的取值, 且 其分布为 则称 服从 处 的两点分布. 参数为 特别地, 若 服从 处 参数为 点分布, 即 则称 服从参数为 的 分布.
说明 两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象, 比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等, 都属于两点分布.
例1 抛掷一枚质地均匀的硬币,有两种可能的结果:H表示正面朝上,T表示背面朝上,引入变量X,令 pi=P{ X=i }=0.5 ( i = 0, 1 ) 概率分布为 X的概率分布表: X 0 1 p 0.5 0.5
例2 200 件产品中, 有 196 件是正品, 4 件是次品, 今从中随机地抽取一件, 若规定 则 于是, 服从参数为 0.98 的0-1分布.
二、二项分布 … 定义 若随机变量X的所有可能取值为0,1,2, ,n,其概率分布为 很显然, n重伯努利试验中成功的次数服从二项分布
P{X=k}=pk(1-p)1-k , (k=0,1), (1) 性质 (2) n=1时, P{X=k}=pk(1-p)1-k , (k=0,1), 即 P{X=0}=1-p, P{X=1}= p (0-1)分布
二项分布的图形特点: 对于固定 及 当 增 加时, 概率 先 是随之增加直至达到最 大值, 随后单调减少.
在图1和图2中, 分别给出了当 和 时二项分布的图形. 从图易 看出: 对于固定 及 当 增加时, 概率 先是随之增加直至达到最大值, 随后 p k n O = 10 , 0.7 图 1 在图1和图2中, 分别给出了当 和 时二项分布的图形. 从图易 看出: 对于固定 及 当 增加时, 概率 先是随之增加直至达到最大值, 随后 单调减少.
当 为整数时, 二项概率 在 和 处达到最 大值. 可以证明, 一般的二项分布的图形也具有这一 性质, 达到最大值; 不为整数时, 且当 p k n O = 10 , 0.7 图 1 注: 为不超过 的最大整数.
例3 一张考卷上有5道选择题,每道题列出4个 可能答案,其中只有一个答案是正确的.某学 生靠猜测至少能答对4道题的概率是多少? 解 每答一道题相当于做一次伯努利试验, 则
例4 按规定,某种型号电子元件的使用寿命超过1500小时的为一级品. 已知某批产品的一级品率为0 例4 按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知某批产品的一级品率为0.2,现在从中随机地抽取20只,问20只元件中恰有k(k=0,1,2,…,20)只为一级品的概率为多少? 解 记X为20只元件中一级品的只数,
某人进行射击,设每次射击的命中率为0.02,独立射击400次,求至少击中两次的概率。 解:将每次射击看成一次试验,设击中的次数为X,则X~B(400,0.02), 所求概率为
三、泊松(Poisson)分布 性质 随机变量X所有可能取值为0,1,2,…,取各个值的概率 称X服从参数为的泊松分布,记为X~P(). (1) P{ X=k}0. 性质
泊松分布的背景及应用 二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的 粒子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内, 其放射的粒子数X服从泊松分布.
例如地震、火山爆发、特大洪水、交换台的电 话呼唤次数等, 都服从泊松分布. 在生物学、医学、工业统计、保险科学及 公用事业的排队等问题中 , 泊松分布是常见的. 例如地震、火山爆发、特大洪水、交换台的电 话呼唤次数等, 都服从泊松分布. 地震 火山爆发 特大洪水 电话呼唤次数 商场接待的顾客数 交通事故次数
例5 一输电网一年中意外输电中断的次数服从参数为6的Poisson分布,问一年中不多于两次意外断电的概率. 解 设一年中的意外断电次数为X 所以,一年中不多于两次断电的概率为 =0.06197 查表(累积概率)
例6 一家商店采用科学管理,由该商店过去的销售记 录知道,某种商品每月的销售数可以用参数 的 泊松分布来描述,为了以 95%以上的把握保证不脱 销,问商店在月底至少应进该种商品多少件? 解 设该商品每月的销售数为 已知 服从参数 的泊松分布. 设商店在月底应进该种商品 件, 求满足 的最小的 即 查泊松分布表, 得 于是得 件.
二项分布的泊松逼近 对二项分布 当试验次数 很大时, 计 算其概率很麻烦. 例如, 要计算n=5000 故须寻求近似计算方法. 这里先介绍二项分布的 泊松逼近, 在第五章中还将介绍二项分布的正态 逼近.
泊松定理 在 重伯努利实验中, 事件 在 每次试验中发生的概率为 若当 时, 为常数), 则有 该定理于1837年由法国数学家泊松引入!
可见,当n充分大,p又很小时,可用泊松分布来近似二项分布! 二项分布 泊松分布 可见,当n充分大,p又很小时,可用泊松分布来近似二项分布! 实际计算中, 时近似效果便很好.
我们把在每次试验中出现概率很小的事件称作稀有事件. 如地震、火山爆发、特大洪水、意外事故等等 由泊松定理,n重伯努利试验中稀有事件出现的次数近似地服从泊松分布.
对每个人而言,在未来一年是否死亡相当于做一次伯努利试验,1000人就是做1000重伯努利试验,因此 X~B(1000,0.005) , 解 保险公司为了估计企业的利润,需要计算投保人在一年内死亡若干人的概率。设某保险公司的某人寿保险险种有1000人投保,每个人一年内死亡的概率为0.005,试求在未来一年中在这些投保人中死亡人数不超过10人的概率. 对每个人而言,在未来一年是否死亡相当于做一次伯努利试验,1000人就是做1000重伯努利试验,因此 X~B(1000,0.005) , 解 由泊松定理
作业 P58练习2.3 1 2
2.4 连续型随机变量及其密度函数 一、密度函数 二、有关事件的概率 三、几种常见的连续型分布
一、密度函数 定义 f( ) 为X的概率密度函数, x (或分布密度函数), 简称密度函数或分布密度.
分布函数与密度函数几何意义 x f ( x) F ( x ) x
根据定义,可以得到密度函数的如下性质 常利用这两个性质检验一个函数能否作为连续型随机变量的密度函数.
二、有关事件的概率 事实上 =0
积分中值定理
例1 设随机变量X的密度函数为 求常数A及X的分布函数和 解 所以
三、几种常见的连续型分布 1.如果随机变量X的密度函数为 从密度函数的几何意义可知 67
均匀分布的分布函数为 68
均匀分布的意义
例2 某公共汽车站从上午7时起, 每15分钟来一 班车, 即7:00, 7:15, 7:30, 7:45 等时刻有汽车到达 此站, 如果乘客到达此站时间 是7:00到7:30之 间的均匀随机变量, 试求他候车时间少于5分钟的 概率. 解 以7:00为起点 0, 以分为单位, 依题意
解 以 7:00 为起点 0, 以分为单位, 依题意 为使候车时间少于 5 分钟, 乘客必须在 7:10 到 7:15 之间, 或在 7:25 到 7:30 之间到达车站, 故所 求概率为 即乘客候车时间少于5分钟的概率是 1/3.
对 X 进行三次独立观测 ,试求至少有两次观测值 大于3 的概率. 解 { X >3 } 表示“对 X 的观测值大于 3 的概率”, 设Y 表示3次独立观测中观测值大于3的次数, 则 因而有
乘客在公交车站等车的时间,电子元件的寿命等, 因而它在可靠性理论和排队论中有广泛的应用. 2.如果随机变量 X的密度函数为 则称X服从参数为 的指数分布 的几何图形如图. 注: 指数分布常用来描述对某 一事件发生的等待时间.例如, 乘客在公交车站等车的时间,电子元件的寿命等, 因而它在可靠性理论和排队论中有广泛的应用.
易求得 的分布函数 指数分布的重要作用,是常用它来作为各种“寿命”的近似,如通讯、保险、随机服务系统等方面 3. 分布(略)
例4 某保险公司想开展一种新的寿险业务,被保险人需一次性缴纳保费1000元,若被保险人在10年内死亡,保险公司将赔负5000元,假设人的寿命服从参数为1/65的指数分布.试帮保险公司做出决策. 解 假设某人的寿命为X 假设某人投保时年龄为S岁 则此人再活10年以上的概率为 75
在已活s年的基础上,再活t年的概率等于寿命大于t年的概率. 指数分布永远年轻 因此,被保险人在10年内死亡的概率为 所以保险公司对该被保险人的预期收益为 1000-0.1426*5000=287(元) 结论:保险公司可以开展这种保险业务. 一般化 在已活s年的基础上,再活t年的概率等于寿命大于t年的概率. 指数分布永远年轻 76
作业 P63 练习2.4 1 2 4
2.5 正态分布 一、正态分布的密度函数及其特点 二、标准正态分布 三、一般正态分布与标准正态分布的关系
一、正态分布的密度函数及其特点
正态概率密度函数的几何特征
拐点如何定义? 二阶导数等于零
正态分布的分布函数
正态分布的应用与背景 正态分布是最常见最重要的一种分布,例如 测量误差, 人的生理特征尺寸如身高、体重等 ; 正常情况下生产的产品尺寸:直径、长度、重量 高度等都近似服从正态分布.
正态分布下的概率计算 原函数不是 初等函数 方法一:利用统计软件计算 方法二:转化为标准正态分布查表计算
二、标准正态分布 标准正态分布的概率密度表示为 标准正态分布的分布函数表示为
标准正态分布的图形
标准正态分布具有如下特点
标准正态分布具有如下特点
例1 = 0.7517 = 1-0.9591= 0.0409 = 0.8925 = 2*0.975-1= 0.95 = 0.9591-1+0.7517= 0.7108 = 2*(1-0.9671)= 0.0658
例1 = 0.7517 = 1-0.9591= 0.0409 = 0.8925 = 2*0.975-1= 0.95 = 0.9591-1+0.7517= 0.7108 = 2*(1-0.9671)= 0.0658
例2
例2
三、一般正态分布与标准正态分布的关系 对一般的正态分布 :X ~ N ( , 2) 其分布函数 作变量代换
三、一般正态分布与标准正态分布的关系 对一般的正态分布 :X ~ N ( , 2) 其分布函数 作变量代换
例3 = 2*0.8413-1= 0.6826 = 2*0.97725-1= 0.9545 事件的发生几乎是必然的 = 2*0.99865-1= 0.9973
服从正态分布 的随机变量X 落在区间 内的概率为0.9973,落在该区间外的概率只有0.0027.也就是说,X几乎不可能在区间 之外取值。 由3 原则知,
服从正态分布 的随机变量X 落在区间 内的概率为0.9973,落在该区间外的概率只有0.0027.也就是说,X几乎不可能在区间 之外取值。 由3 原则知,
例4 从某地去火车站有两条路线,第一条路线经过市区,路程较短,但交通拥挤,所需时间(分钟)服从正态分布N(50,100),第二条路线经环城路,路程较长,所需时间服从正态分布N(60,16),若只有70分钟可用,应走哪一条路线?若只有65分钟呢? 解 设所需时间分别为T和X,显然应走在允许的时间内有较大概率及时赶到火车站的路线. (1) 在70分钟内,两条路线能及时赶到的概率分别为 因此在这种情况下,应走第二条路线.
(2) 在65分钟内,两条路线能及时赶到的概率分别为 因此在这种情况下,应走第一条路线.
作业 P68 练习2.5 2 3 4
2.6 随机变量函数及其分布 一、随机变量函数的定义 二、离散型随机变量函数的分布 三、连续型随机变量函数的分布
两个赌徒用一枚骰子进行赌博,甲若掷出x点,则可得(或付)10x-35元,分析甲在一次掷骰子中的输赢. 实例 显然
一 、随机变量函数的定义 定义 问题 分别就离散型随机变量和连续型随机变量进行讨论
二、离散型随机变量函数的分布 例1 Y 的可能值为 解 即 0, 1, 4.
故 Y 的分布律为 由此归纳出离散型随机变量函数的分布的求法.
离散型随机变量的函数的分布
例2 设 解 Y 的分布律为
三、连续型随机变量函数的分布 例3 例3 解 解 第一步 先求Y=2X+8 的分布函数
第二步 由分布函数求概率密度.
例4 解 再由分布函数求概率密度.
当 Y=2X+3 时,有
例5 证明 X 的概率密度为
作业 P71练习2.6 1 2 P72习题二