Download presentation
Presentation is loading. Please wait.
1
概率论与数理统计 2.3 连续型随机变量及其分布
3
§2.3 连续型随机变量及其分布 连续型随机变量X所有可能取值充满一个区间, 对这种类型的随机变量, 不能象离散型随机变量那样, 以指定它取每个值概率的方式, 去给出其概率分布, 而是通过给出所谓“概率密度函数”的方式. 下面我们就来介绍对连续型随机变量的描述方法.
4
测量新生儿的体重,单位为“斤”,绘制的频率直方图。
长方形的底边长为1,高度为该长方形包含样本数与总样本数之比。因此所有长方形的面积之和为1。 测量新生儿的体重,单位为“斤”,绘制的频率直方图。
5
测量新生儿的体重,单位为“两”,绘制的频率直方图。
另一种理解是,步长单位缩短了,变为0.1。但将长方形的高度放大1/0.1=10倍,因此小长方形的面积不变,所有小长方形的面积之和为1。由于每个小长方形所代表的频数比值变小后又放大了同样的倍数,整个曲线高度不变。 现在步长单位缩短了。一种理解是,仍将缩短后的单位作为1,因此长方形的底边长为1,高度为频数比值,所有长方形的面积之和为1。此时由于每个小长方形所代表的频数比值变小了,整个曲线“降低”了。 测量新生儿的体重,单位为“两”,绘制的频率直方图。
6
新生儿体重频率直方图,单位趋于0,变为光滑曲线。
7
一. 连续型随机变量 定义 设 X 是随机变量,若存在一个非负可积函数 f (x),使得 其中F (x)是它的分布函数,
则称 X 是 连续型 r.v.,f (x)是它的概率密度函数( p.d.f. )。
8
分布函数与密度函数 几何意义
9
p.d.f. f(x)的性质 o 在f(x)的连续点处,f(x) = F’(x)。 判定函数 f (x)是否 为r.v. X的概率密度
函数的充要条件. f (x) x o 面积为1 在f(x)的连续点处,f(x) = F’(x)。
10
b x f ( x) a
11
需要指出的是: 连续型r.v.取任一指定值的概率为0 即: a为任一指定值 这是因为 注意:概率为0 (1) 的事件未必不发生(发生) 由P(A) = 0, 不能推出 A = 由P(B) = 1, 不能推出 B =
12
对于连续型 r.v. X,P(X a) = P(X < a)
P(a < X < b) = P(a < X b) = P(a X < b) = P(a X b) b x f(x) a
13
由上述性质可知,对于连续型随机变量,关心它在某一点取值的问题没有太大的意义;我们所关心的是它在某一区间上取值的问题。
18
二. 常见连续型随机变量的分布 (1) 均匀分布 若 X 的 p.d.f. 为 则称 X 服从区间( a , b)上的均匀分布 记作
19
X 的分布函数为 即 X 落在(a, b)内任何长为 d – c 的小区间的 概率与小区间的位置无关,只与其长度成正 比。这正是几何概型的情形。
20
x f(x) a b x F(x) b a
21
例 解:
22
(2) 指数分布 若 X 的p.d.f.为 > 0 为常数 则称 X 服从参数为 的指数分布, 记作X ~ E()。
23
x f (x) x F(x) 1
24
应用场合 用指数分布描述的实例有: 随机服务系统中的服务时间 电话问题中的通话时间 无线电元件的寿命 指数分布常作为各种“寿命”分布的近似 动物的寿命 1/解释为“平均寿命”
25
例 解
26
使用分布函数来解 = (1 – e–0.120) – (1 – e–0.110) = e–1 – e–2 =
27
指数分布的“无记忆性” 命题 若 X ~E(),则 证明 故又把指数分布称为“永远年轻”的分布
28
(3) 正态分布 若X 的 p.d.f. 为 其中、为常数, > 0, 则称 X 服从参数为 , 2 的正态分布(也称为高斯分布),记作 X ~ N(, 2)。
29
棣莫弗最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.
正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.
30
正态分布 的图形特点 正态分布的密度曲线是一条关于对称的钟形曲线。特点是“两头小,中间大,左右对称”。
31
正态分布 的图形特点 决定了图形的中心位置,决定了图形中峰的陡峭程度. — 位置参数 — 形状参数
32
f(x) 的性质: 图形关于直线 x = 对称,即 f(x+) = f(x+) 曲线 y = f (x) 的图形呈单峰状
= 1时, 1/(2)1/2 = 曲线 y = f (x) 的图形呈单峰状 在 x = 时,f(x) 取得最大值 在 x = ± 时,曲线 y = f(x) 在对应的 点处有拐点 曲线 y = f (x) 以 x 轴为渐近线
34
各种测量的误差; 人体的生理特征; 工厂产品的尺寸; 农作物的收获量; 海洋波浪的高度; 金属线抗拉强度;
正态分布是应用最广泛的一种连续型分布 各种测量的误差; 人体的生理特征; 工厂产品的尺寸; 农作物的收获量; 海洋波浪的高度; 金属线抗拉强度; 热噪声电流强度; 学生的考试成绩;
35
正态分布的重要性 正态分布是概率论中最重要的分布,这可以由以下情形加以说明:
⑴正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的.可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布. ⑵正态分布有许多良好的性质,这些性质是其它许多分布所不具备的. ⑶正态分布可以作为许多分布的近似分布.
36
正态分布由它的两个参数μ和σ唯一确定, 当μ和σ不同时,就得到不同的正态分布。
下面我们介绍一种最重要的正态分布 标准正态分布
37
一种重要的正态分布 —— 标准正态分布N(0,1) 密度函数 是偶函数。 分布函数为 其值有专门的表可查。
38
标准正态分布N(0,1)的概率密度函数
39
标准正态分布N(0,1)的分布函数
40
x x 3 2 1 1 2 3 0.1 0.2 0.3 0.4 P(X x) = P(X x)
41
例 解 附表4
42
因此,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。
标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布。 对一般的正态分布:X ~ N(, 2) 则: (证明见 下一节) 因此,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。
43
应用这个结论,可知 (上述推导中用到 > 0这一事实) 因此
44
例 设 X ~ N(1,4) , 求 P (0 X 1.6) 解 附表4
45
例 解
46
例 3 原理 设 X ~ N(, 2),求P(|x – | < 3)。 解 一次试验中,X 落入区间( 3, + 3)的概率为0.9974,而超出此区间可能性很小。 由3 原理知, 当
47
标准正态分布的上 分位数 u 设 X ~ N (0,1) , 0 < < 1, 称满足 的点 u 为X 的上 分位数(分位点) z 常用数据
48
例 设测量的误差 X ~ N(7.5, 100)(单位:米) 问要进行多少次独立测量,才能使至少 有一次误差的绝对值不超过10米的概率 大于0.9 ? 解 一次测量误差的绝对值不超过10米的概率为
49
要使 n 次独立测量至少有一次误差的绝对值不超过10米,即
故至少要进行 4 次独立测量才能满足要求。
Similar presentations