概率论与数理统计 课件制作:应用数学系 概率统计课程组
第二章 一维随机变量及其分布 一、随机变量及其分布 二、离散型随机变量的分布函数 三、离散型随机变量的概率函数 第二章 一维随机变量及其分布 一、随机变量及其分布 二、离散型随机变量的分布函数 三、离散型随机变量的概率函数 四、连续型随机变量及其概率密度 五、随机变量的函数的分布
2.1 随机变量及其分布 2.1.1 随机变量的概念 2.1.2 随机变量的分布函数
为了更好的揭示随机现象的规律性并利用数学工具描述其规律,引入随机变量来描述随机试验的不同结果. 例:电话总机某段时间内接到的电话次数,可用一个变量 X 来描述. 例: 抛掷一枚硬币可能出现的两个结果,也可以用一个变量来描述.
2.1 随机变量及其分布 2.1.1 随机变量的概念 例: (1)随机地掷一颗骰子,ω表示所有的样本点, 2.1 随机变量及其分布 2.1.1 随机变量的概念 例: (1)随机地掷一颗骰子,ω表示所有的样本点, ω: 出现1点 出现2点 出现3点 出现4点 出现5点 出现6点 X(ω): 1 2 3 4 5 6 (2)某人接连不断地对同一目标进行射击,直至射中为 止,ω表示射击次数,则 Ω:射击1次 射击2次 ...... 射击n次 ...... X(ω): 1 2 ...... n ...... (3) 某车站每隔10分钟开出一辆公共汽车,旅客在任意时间到达车站,ω表示该旅客的候车时间, Ω: 候车时间 X(ω): [0, 10]
定义: 设E是一随机试验, 是它的样本空间,若 则称 上的单值实值函数 X ( )为随机变量. 随机变量一般用 X, Y , Z ,或小写希腊字母, , 表示. 特别 离散型 连续型 取值为有限个和至多可列个的随机变量. 可以取区间内一切值的随机变量. 随机变量
随机变量是 上的映射,这个映射具有 如下的特点: 定义域 : 随机性 : 随机变量X 的可能取值不止一个, 试验前只能预知它的可能的取值但不能预知 取哪个值. 概率特性 : X 以一定的概率取某个值或某些 值. 引入随机变量后,用随机变量的等式或不 等式表达随机事件.
或 如,若用X 表示电话总机在9:00_10:00接到的 电话次数, 则 —— 表示“某天9:00 _ 10:00 接到的电话次数超过100次”这一事件.
再如,用随机变量 描述抛掷一枚硬币可能出现的结果, 则 — 表示正面向上. 也可以用 描述这个随机试验的结果.
例如,要研究某地区儿童的发育情况,往往需要多个指标,例如,身高、体重、头围等. = {儿童的发育情况 } X ( ) — 身高 Y ( ) — 体重 Z ( ) — 头围 各随机变量之间可能有一定的关系,也可能没有 关系—— 即相互独立.
随机变量通常用大写字母 X,Y,Z或希腊字母ζ,η等表示 而表示随机变量所取的值 时,一般采用小写字母x,y,z等.
例如,从某一学校随机选一学生,测量他的身高. 我们可以把可能的身高看作随机变量X, 然后我们可以提出关于X 的各种问题. 如 P(X>1.7)=? P(X≤1.5)=? P(1.5<X<1.7)=?
2.1.2 随机变量的分布函数 定义:设 X 为随机变量,对每个实数 x ,随机事件 的概率 2.1.2 随机变量的分布函数 定义:设 X 为随机变量,对每个实数 x ,随机事件 的概率 定义了一个 x 的实值函数,称为随机变量X 的分布函数,记为F ( x ) ,即 注: 分布函数完整地描述了随机变量的统计规律性, 或者说,分布函数完整地表示了随机变量的概率分 布情况 .
分布函数的性质: F ( x ) 单调不减,即 且 F ( x ) 右连续,即
利用分布函数可以计算 ] ] ( ] ( ] a b 请 填 空
例2.1.1 设随机变量的 分布律为 : -1 2 3 求 的分布函数,并求: 即
课堂练习 设随机变量X的分布函数为: 求:
2.2-2.3 随机变量的分布函数 一、离散型随机变量的概念 二、离散型随机变量的分布函数 三、常见的离散型随机变量的概率分布
随机变量的分类 通常分为两类: 离散型随机变量 随机变量 连续型随机变量 所有取值可以逐个 一一列举 全部可能取值不仅 无穷多,而且还不 能一一列举,而是 充满一个区间. 连续型随机变量
一、离散型随机变量的概念 非负性 规范性 定义: 若随机变量 X 的可能取值是有限多个或无穷 可列多个,则称 X 为离散型随机变量. 描述离散型随机变量的概率特性常用它的概率分布 或分布律,即 概率分布的性质 非负性 规范性
二、离散型随机变量的分布函数 F( x) 是分段阶梯函数,在 X 的可能取值 xk 处发生间断,间断点为第一类跳跃间断点.
分布函数图 概率函数图 注意右连续
注意: 离散型随机变量的概率分布分以下几步来求: (1)确定随机变量的所有可能取值; (2)设法(如利用古典概率)计算取每个值的概率. (3)列出随机变量的概率分布表(或写出概率函数).
例2.2.1 从1~10这10个数字中随机取出5个数字,令 X:取出的5个数字中的最大值.试求X的分布律. 求分布率一定要说明 k 的取值范围! 解:X 的可能取值为 5,6,7,8,9,10. 并且 =—— 具体写出,即可得 X 的分布律:
例2.2.2 袋内有5个黑球3个白球,每次抽取一个不放回,直到取得黑球为止。记X为取到白球的数目,Y为抽取次数,求X、Y的概率分布及至少抽取3次的概率。 P(X=0)=5/8, P(X=1)=(3×5)/(8×7)=15/56,类似有 P(X=2)=(3×2×5)/(8 ×7 ×6)=5/56, P(X=3)=1/56, 所以,X的概率分布为 (2) Y的可能取值为1,2,3,4, P(Y=1)=5/8, P(Y=2)=P(X=1)=15/56, 类似有: P(Y=3)=P(X=2)=5/56, P(Y=4)=P(X=3)=1/56, 所以Y的概率分布为: X 0 1 2 3 P 5/8 15/56 5/56 1/56 (3) P(Y≥3)=P(Y=3)+P(Y=4)=6/56
三、常见的离散型随机变量的概率分布 (1) 0 – 1 分布 X = xk 1 0 0 < p < 1 Pk p 1-p (1) 0 – 1 分布 X = xk 1 0 Pk p 1-p 0 < p < 1 凡是随机试验只有两个可能的结果, 应用场合 常用0 – 1分布描述,如产品是否格、人口性别统 计、系统是否正常、电力消耗是否超负荷等等. 注:其分布律可写成
(2) 离散型均匀分布 如在“掷骰子”的试验中,用 表示事件{出现 点}, 则随机变量 是均匀分布.
(3) 二项分布 背景:n 重Bernoulli 试验中,每次试验感兴 趣的事件A 在 n 次试验中发生的次数 —— X是一离散型随机变量 若P ( A ) = p , 则 称 X 服从参数为n, p 的二项分布(也叫Bernolli 分布).记作 0 – 1 分布是 n = 1 的二项分布.
二项分布的图形
例3.1.1 一大批产品的次品率为0.1,现从中取 出15件.试求下列事件的概率: B ={ 取出的15件产品中恰有2件次品 } C ={ 取出的15件产品中至少有2件次品 } 解: 由于从一大批产品中取15件产品,故可近似 看作是一15重Bernoulli试验. 所以,
例3.1.2 一个完全不懂英语的人去参加英语考试. 假设此考试有5个选择题,每题有n重选择,其中只 有一个答案正确.试求:他居然能答对3题以上而及 格的概率. 解:由于此人完全是瞎懵,所以每一题,每一个答案 对于他来说都是一样的,而且他是否正确回答各题 也是相互独立的.这样,他答题的过程就是一个 Bernoulli试验 .
(4) Poisson 分布 或 若 其中 是常数,则称 X 服从参数为 或 的Poisson 分布,记作 在一定时间间隔内: 应用场合: 在一定时间间隔内: 电话总机接到的电话次数; 一匹布上的疵点个数; 大卖场的顾客数;
市级医院急诊病人数; 一个容器中的细菌数; 某一地区发生的交通事故的次数; 放射性物质发出的粒子数; 一本书中每页印刷错误的个数; 等等.
例3.1.3 设随机变量X 服从参数为λ的Poisson分布, 且已知 解:随机变量 X 的分布律为 由已知
例3.1.4 如果随机变量X 的分布律为 试确定未知常数c . 解: 由分布率的性质有
(5) 几何分布 设用机枪射击一次击落飞机的概率为 ,无限次地射击,则首次击落飞机时所需射击的次数 服从参数为 的几 何分布,记 .即 设用机枪射击一次击落飞机的概率为 ,无限次地射击,则首次击落飞机时所需射击的次数 服从参数为 的几 何分布,记 .即 容易验证,若在前 m 次射击中未击落飞机,那么,在 此条件下,为了等到击落时刻所需要等待时间也服 从同一几何分布,该分布与 m 无关,这就是所谓的 无记忆性.
(6) 超几何分布 设有产品 件,其中正品 件,次品 件( ) ,从中随机地不放回抽取 件, ,记X为抽到的 的正品件数,求X 的分布律. 设有产品 件,其中正品 件,次品 件( ) ,从中随机地不放回抽取 件, ,记X为抽到的 的正品件数,求X 的分布律. 此时抽到 件正品的概率为 k=0,1,… , 称X 服从超几何分布.记 可以证明超几何分布的极限分布就是二项分布,因此在实际应用中,当 都很大时,超几何分布可用下面式子近似
(7) 负二项分布(Pascal分布) (自学) (8) 截塔(Zipf)分布 (自学)
课堂练习 1. 将一枚均匀骰子抛掷3次,令X 表示3次中 出现“4”点的次数 求X的概率函数 提示:
2. 设生男孩的概率为p,生女孩的概率为 q=1-p,令X表示随机抽查出生的4个婴儿中“男孩”的个数. 求X的概率分布.
解:X 表示随机抽查的4个婴儿中男孩的个数, 生男孩的概率为p. 男 女 X=0 X =1 X =2 X =3 X =4 X可取值0,1,2,3,4. X的概率函数是:
求 。 例3设 由于 是分段表 达的,求 时 注意分段求. 解 由定义
即
2.4 连续型随机变量及其概率密度 2.4.1 连续型随机变量及其概率密度函数 2.4.2 常见的连续型随机变量
2.4.1 连续型随机变量及其概率密度函数 定义:设 X 是一随机变量,若存在一个非负 可积函数 f(x) 使得 密度函数( p.d.f. ),简称为密度函数或概率密 度.
分布函数 F(x)与密度函数 f(x)的几何意义
概率密度函数( p.d.f.) f(x)的性质 1、 2、 常利用这两个性质检验一个函数能否作为连续性随机变量的密度函数,或求其中的未知参数. 3、 在 f(x) 的连续点处, f(x) 描述了X 在 x 附近单位长度的区间内取值的概率.
注意: 对于连续型随机变量X , P ( X = a) = 0 这里 a 可以是随机变量 X 的一个可能的 取值. 事实上 命题: 连续型随机变量取任一常数的概率为零.
对于连续型随机变量X b x f (x) a
x f ( x) a
例2.4.1 设随机变量 具有概率密度函数 试确定常数A, 以及 的分布函数. 解:由 知A=3,即 而 的分布函数为
例2.4.2 一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数. 解:
综上所述,随机变量X的分布函数为
2.4.2 常见的连续型随机变量 2.4.2.1 均匀分布 若 X 的密度函数为 ,则称 X 服从区间 记作 (a ,b)上的均匀分布 其中
即 X 的取值在(a,b)内任何长为 d – c 的小区间 的概率与小区间的位置无关, 只与其长度成正比.这正是几何概型的情形. 应用场合: 在进行大量数值计算时,如果在小数点后第k位进行四舍五入,则产生的误差可以看作 服从
例2.4.3 设随机变量X服从(1,6)上的均匀分布, 求一元两次方程t2+Xt+1=0有实根的概率. 解: 故所求概率为: 而X的密度函数为 : 因此所求概率:
为常数, 2.4.2.2 正态分布 若X 的密度函数为 则称 X 服从参数为 , 2 的正态分布 2.4.2.2 正态分布 若X 的密度函数为 为常数, 则称 X 服从参数为 , 2 的正态分布 记作 X ~N ( , 2 )
f (x) 的性质: (1) 图形关于直线 x = 对称: f ( + x) = f ( - x) (2) 在 x = 时, f (x) 取得最大值: (3) 在 x = ± 时, 曲线 y = f (x) 在对应的点处有 拐点 (4) 曲线 y = f (x) 以x轴为渐近线 (5) 曲线 y = f (x) 的图形呈单峰状.
f(x)的两个参数: — 位置参数 即固定, 对于不同的 , 对应的 f(x)的形状不变化,只是位置不同. — 形状参数 固定 ,对于不同的 ,f( x)的形状不同. 若 1< 2 则 前者取 附近值的概率更大. x = 1 所对应的拐点比 x= 2 所对应的拐点更靠近直线x = .
正态分布的密度曲线是一条关于 对称的钟形曲线。特点是“两头小,中间大,左右对称”。 决定了图形的中心位置, 决定了图形中峰的陡峭程度。
若随机变量 X 受到众多相互独立的随机因素的 应用场合: 若随机变量 X 受到众多相互独立的随机因素的 影响,而每一个别因素的影响都是微小的,且这些影响可以叠加, 则 X 服从正态分布. 可用正态变量描述的实例非常之多: 各种测量的误差; 人的生理特征; 工厂产品的尺寸; 农作物的收获量; 海洋波浪的高度; 金属线的抗拉强度; 热噪声电流强度; 学生们的考试成绩;
正态分布的重要性: 正态分布是概率论中最重要的分布,这可以由以下情形加以说明: ⑴ 正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的.可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布. ⑵ 正态分布有许多良好的性质,这些性质是其它许 多分布所不具备的. ⑶ 正态分布可以作为许多分布的近似分布.
一种重要的正态分布:N(0,1) — 标准正态分布 标准正态分布的计算:
-x x
对一般的正态分布 :X ~N ( , 2) 其分布函数 作变量代换
例2.4.4 设 X ~ N(1,4) , 求 P (0 X 1.6) 解: P352 表2
例2.4.5已知 且 P( 2 < X < 4 ) = 0.3, 求 P ( X < 0 ). 解1:
解二 图解法 0.3 0.2 由图
标准正态分布的上 分位数z =1.645 =2.575 = -1.645 = -2.575
2.4.2.3 指数分布 若X 的密度函数为 > 0 为常数 则称X 服从参数为的指数分布 记作 X 的分布函数为
对于任意的 0 < a < b, 应用场合: 用指数分布描述的实例有: 随机服务系统中的服务时间 电话问题中的通话时间 无线电元件的寿命 指数分布常作为各种 “寿命”分布的近似 动物的寿命
例2.4.6 令:B={ 等待时间为10-20分钟 }
2.4.2.4 伽玛分布 设随机变量X,若X的密度函数为 则称X服从参数为 的伽玛(Gamma)分布,简称 为 分布, 注:伽玛函数具有性质:
2.4.2.5 威布尔分布 (自学) 2.4.2.6 截尾分布(自学)
n > 3 设测量的误差 X~N(7.5,100)(单 位:米),问要进行多少次独立测 量,才能使至少有一次误差的绝对 课堂练习 值不超过10米的概率大于0.9 ? 课堂练习 解: 设A表示进行 n 次独立测量至少有一次误差的绝 对值不超过10米 n > 3 所以至少要进行 4 次独立测量才能满足要求.
2.5 随机变量函数的分布 2.5.1 离散型随机变量函数的分布 2.5.2 连续性随机变量函数的分布
问题:已知随机变量 X 的概率特性 ——分布 函数 或密度函数(分布律) Y = g ( X ) 求随机因变量Y 的概率特性 方法:将与Y 有关的事件转化成X 的事件
2.5.1 离散型随机变量函数的分布 设随机变量 X 的分布律为 由已知函数 g ( x) 可求出随机变量 Y 的所有
第 一 种 情 形:
第 二 种 情 形:
例2.5.1 已知 X 的概率分布为 X pk -1 0 1 2 求 Y 1= 2X – 1 与 Y 2= X 2 的分布律 Y 1 pi -3 -1 1 3 解:
Y 2 pi 1 0 1 4 Y 2 pi 0 1 4
2.5.2 连续性随机变量函数的分布 已知随机变量 X 的密度函数 f(x) (或分布函数) 求 Y= g( X )的密度函数或分布函数. (1) 从分布函数出发 (2) 从密度函数出发 方法:
例2.5.2 设随机变量 X 具有概率密度: 试求Y=X-4 的概率密度. 解:(1) 先求 Y =X-4 的分布函数 FY(y):
整理得 Y=X-4 的概率密度为: 本例用到变限的定积分的求导公式
例2.5.2 已知X 密度函数为 为常数,且 a 0, 求fY( y ) 解: 当a > 0 时,
当a < 0 时, 故
例如,设 X ~ N ( ,2) , Y = a X +b, 则 Y ~ N ( a +b, a22 ) 特别地 ,若 X ~ N ( , 2) , 则
设 X ~ 求 Y=2X+8 的概率密度. 解:设Y的分布函数为 FY(y), FY(y)=P{ Y y } = P (2X+8 y ) 课堂练习 设 X ~ 求 Y=2X+8 的概率密度. 解:设Y的分布函数为 FY(y), FY(y)=P{ Y y } = P (2X+8 y ) =P{ X } = FX( ) 于是Y 的密度函数
Y=2X+8 注意到 0 < x < 4 时, 即 8 < y < 16 时, 此时 故