Download presentation
Presentation is loading. Please wait.
Published by奏 吕 Modified 7年之前
1
第二章 随机变量及其分布 在第一章里,我们研究了随机事件及其概率.而对于一个随机试验,我们除了对某些特定的事件发生的概率感兴趣外,往往还会关心某个与试验结果相联系的变量.由于这一变量依赖于试验结果,因而这一变量的取值具有随机性,这种变量被称为随机变量.本章将着重介绍两类随机变量——离散型随机变量和连续型随机变量及其分布.
2
§2、1 随机变量 2、1、1 随机变量的定义 在上一章中,我们研究了随机事件与概率的一些基本概念和理论。为了更深入地研究随机试验的结果,揭示其相应的随机现象的统计规律性,从本章起,我们将引进随机变量的概念。其基本想法是把随机试验的结果数量化,即用一个变量X 来描述试验的结果。先看下面的例子。
3
例1 投掷一枚硬币,观察出现正反面的情形。试验有两个可能结果:
— 出现正面 — 出现反面 我们引入一个变量如下: 这个变量可以看作是定义在样本空间
4
上的函数,称其为随机变量。实际上此变量是依试验结果的不同而随机地取值1或0。
例2 掷一枚骰子面上出现的点数。 这个试验结果本身就是一个数.(与数值有关) 我们引入一个变量 当 时, ,这里 是随机变量,
5
它是依试验结果的不同而随机地取值1,2,3,4,5,6。
类似的例子: 七月份武汉的最高温度; 每天从汉口火车站下火车的人数; 昆虫的产卵数;
6
正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.
在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化. 正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.
7
定义 设随机试验为 ,其样本空间为 如果对于每个 ,都有一个实数 和它对应,于是就得到一个定义在 上的实值单值函数 ,称 为随机变量。
8
随机变量通常用大写字母 X,Y,Z或希腊字母ζ,η等表示 而表示随机变量所取的值 时,一般采用小写字母x,y,z等.
9
例如,从某一学校随机选一学生,测量他的身高.
我们可以把可能的身高看作随机变量X, 然后我们可以提出关于X 的各种问题. 如 P(X>1.7)=? P(X≤1.5)=? P(1.5<X<1.7)=?
10
随机变量与随机事件的关系 对所考察的随机现象,当引入随机变量以后,随机事件即可用随机变量满足某关系式来描述,反之,给出随机变量X满足某关系式,它将表达随机现象中的某个事件。 比如:例1中, 表示该试验中“正面朝上”事件。 表示该试验中“反面朝上”事件。 例2中,事件{点数不少于3次}可表示为
11
2、1、2 随机变量的分类 通常分为两类: 离散型随机变量 随机变量 连续型随机变量 所有取值可以逐个 一一列举 全部可能取值不仅
无穷多,而且还不 能一一列举,而是 充满一个区间. 连续型随机变量
12
随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究。
这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处,但因其取值方式不同,又有其各自的特点。 学习时请注意它们各自的特点和描述方法。
13
§2、2 离散型随机变量 2、2、1 离散型随机变量 如果随机变量的取值是有限个或可数个(即能与自然数的集合一一对应),则称该变量为离散型随机变量。 为了描述随机变量 X ,我们不仅需要知道随机变量X的所有可能取值,而且还应知道X 取每个值的概率.为此我们有以下定义:
14
定义2、2、1 设X是一个离散型随机变量,它可能取值为 并且取各个值的对应概率为 即 则称上式为离散型随机变量X的概率分布,又称分布密度或分布列。 其中 且 反过来,假如有一列数 满足
15
且 则该数列可以定义为某离散型随机变量的分布列。 分布列也可以通过列表表示: 其中第一行表示随机变量所有可能的取值,第二行表示这些取值所对应的概率。
16
2、2、2 退化分布 在所有的分布中,最简单的分布是退化分布 定义2、2、2 如果一个随机变量X以概率1取某 一常数,即
2、2、2 退化分布 在所有的分布中,最简单的分布是退化分布 定义2、2、2 如果一个随机变量X以概率1取某 一常数,即 (其中a R) 则称X服从a处的退化分布(或单点分布).
17
2、2、3 两点分布 定义2、2、3 随机变量X只取两个值 和 ,并且已知 称这种只取两个值的分布为两点分布。 特别:若
2、2、3 两点分布 随机变量X只取两个值 和 ,并且已知 定义2、2、3 称这种只取两个值的分布为两点分布。 特别:若 则称这种分布为(0-1)分布。其分布列为:
18
2、2、4 二项分布 定义2、2、4 在独立试验概型中,重复进行n次试验时A发生k次的概率已知为: 如果用随机变量 表示 发生的次数,则 的
2、2、4 二项分布 定义2、2、4 在独立试验概型中,重复进行n次试验时A发生k次的概率已知为: 如果用随机变量 表示 发生的次数,则 的 可能取值为: 相应的分布列为: 容易验证:
19
这种分布称为二项分布,又称Y服从参数为 和 的二项分布,记为:
例1 在事件A 发生概率为 的贝努利试验中,如果用 表示事件A 首次发生时的试验次数,则 为一随机变量,可能的取值为: 如果A在第 次发生,则前 次 都是 发生,从而 的概率为: 称 服从参数为 的几何分布。
20
2、2、5 泊松分布 定义2、2、5 设随机变量X的分布列为: 试确定常数a . 解: 依据分布列的性质: 且 从而 解得
2、2、5 泊松分布 定义2、2、5 设随机变量X的分布列为: 试确定常数a . 解: 依据分布列的性质: 且 从而 解得 这个分布称为泊松(Poisson)分布.
21
泊松分布的应用是相当广泛的,比如电信传呼台每天接受到的传呼次数,某繁华交叉街口每小时经过的车辆数等都服从泊松分布 ,而且由下面定理可以看到二项分布与泊松分布有着密切的联系。
泊松定理 在二项分布 中,如果 是常数),则成立
22
例2 某种药品的过敏反应率为 ,今有20000人使用此药品,求20000人中发生过敏反应的人数不超过3的概率。
解 以 表示20000人中发生过敏反应的人数,则 服从二项分布 ,所求的概率为:
23
如果利用近似公式 计算,可以得到: ,且 比较两个结果可以看到,近似程度是很高的。
24
例3 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布.
P(X =0)=(0.1)(0.1)=0.01 P(X =1)= 2(0.9)(0.1) =0.18 P(X =2)=(0.9)(0.9)=0.81 且 P(X =0)+ P(X =1)+ P(X =2)=1
25
例4 某射手连续向一目标射击,直到命中为止,已知他每发命中的概率是p,求所需射击发数X的概率函数分布列.
设 = {第 发命中}, , 于是
26
类似地,有 这就是求所需射击发数X的分布列. 这一节,我们介绍了离散型随机变量及其概率分布. 对于离散型随机变量,如果知道了它的概率函数,也就知道了该随机变量取值的概率规律.下一节,我们将介绍连续型随机变量。
27
§2、3 随机变量的分布函数 2、3、1 分布函数的定义
§2、3 随机变量的分布函数 2、3、1 分布函数的定义 为了对离散型的和连续型的随机变量以及更广泛类型的随机变量给出一种统一的描述方法,我们引进了分布函数的概念. 定义:设 是一个随机变量,对任意的实数 ,随机变量 取值落入区间 内的概率为
28
称 为随机变量 的分布函数. 显然,对任意 从而,只要知道了随机变量X的分布函数,它的统计特性就可以得到全面的描述.
29
分布函数的性质: 即 是右连续的。
30
如果一个函数具有上述性质,则一定是某个随机变量X的分布函数。也就是说,前面三个性质是鉴别一个函数是否是某随机变量的分布函数的充分必要条件。
31
2、3、2 离散型随机变量的分布函数 设离散型随机变量X 的分布律是 则 。 由于 是X 取 的诸值 的概率之和,故又称 为累积概率函数.
则 。 由于 是X 取 的诸值 的概率之和,故又称 为累积概率函数. 离散型随机变量分布函数的计算举例:
32
例 求 。 解 由定义 当 时, 故 当 时, 当 时, 当 时,
33
故 注意右连续 下面我们从图形上来看一看。 不难看出, 的图形是阶梯状的图形, 在 处有跳跃,其跃度分别等于
34
分布函数图 概率函数图
35
§2、4 连续性随机变量 2、4、1 连续型随机变量的概率分布
§2、4 连续性随机变量 2、4、1 连续型随机变量的概率分布 定义2、4、1 设 是随机变量 的分布函数如果存在一非负函数 ,使对任意实数 有 则称 为连续型随机变量, 为 的概率密度函数,简称概率密度。 由定义可知,连续型随机变量的分布函数是连续函数,是密度函数的可变上限的定积分.
36
由上式可得,在 的连续点, 概率密度函数的性质: 这两条性质是判定一个函数 是否为某连续型随机变量的概率密度函数的充要条件。 利用以上关系可以推得,随机变量 落入某有限区间 内的概率为
37
它是以 为底,以曲线 为顶的曲边梯形的面积。
类似可得 取值落入 内的概率为: 需要指出的是: 连续型随机变量取任一指定值的概率为0,即:
38
为任一指定值这是因为: 从而知, (1) 对连续型随机变量X ,有 (2) 由 可推知
39
而 并非不可能事件, 并非必然事件。可见, 由 不能推出 由 不能推出 o 面积为1
40
2、4、2 均匀分布 由于连续型随机变量唯一被它的密度函数所确定。所以,若已知密度函数,该连续型随机变量的规律就得到了全面描述.
下面给出几个连续型随机变量的常用分布 2、4、2 均匀分布 定义2、4、2 若随机变量X取值在区间 上,并且取每一点的可能性是相同的,则称X服从区间 上的均匀分布,记作: 写出它的分布函数及概率密度函数。
41
由几何概率的定义容易得到 的分布函数为 从而概率密度为:
42
2、4、3 指数分布 则称X 服从参数为 的指数分布。 常简记为: 容易看出: 且 所以 确是一概率密度。
所以 确是一概率密度。 指数分布常用于可靠性统计研究中,如元件的寿命.
43
例1 对服从参数为0.015的指数分布的变量X,试计算:
(2)若要求P(X >x) <0.1,问x应在什么范围内? 解 (1)由指数分布的定义可得
44
(2) 若要求 即 指数分布经常被用来近似描述各种“寿命”分布,如无线电元件的寿命,动物的寿命,电话问题中的通话时间,传呼台首次传呼来到的时刻,随机服务系统中的服务时间等都假定是服从指数分布的。
45
例2设 求 。 由于 是分段表 达的,求 时 注意分段求. 解 由定义
46
即 例3 设随机变量X 的分布函数为 求X取值在区间(0.3,0.7)的概率及概率密度。
47
解: 要注意的是,密度函数 在某点 处的高度,并不反映X取值的概率。 但是这个高度越大,则X取 附近的值的概率就越大。 也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度。
48
2、4、4 正态分布 正态分布是应用最广泛的一种连续型分布。德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面。正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布。 在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成
49
男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布。
(1)正态分布的定义及图形特点 定义2、4、4 若随机变量X的概率密度为 其中 和 都是常数, 任意, ,则称
50
X服从参数为 和 的正态分布。 记作: 可以证 证明: 作变量代换 左边
51
化为极坐标 其中 正态分布 的图形:
52
正态分布的密度曲线是一条关于 对称的钟形曲线。特点是“两头小,中间大,左右对称”。
决定了图形的中心位置, 决定了图形中峰的陡峭程度。
53
其分布函数是: (2)标准正态分布 的正态分布称为标准正态分布. 其密度函数和分布函数常用 和 表示:
54
标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
,则 设 定理2、4、1 根据定理,只要将标准正态分布的分布函数
55
制成表,就可以解决一般正态分布的概率问题。
书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表。 若 若
56
(3) 3 准则 由标准正态分布的查表计算可以求得, 当 时, 这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.
57
将上述结论推广到一般的正态分布, 当 时, 可以认为,Y 的取值几乎全部集中在 区间内。 这在统计学上称作“3 准则”(三倍标准差原则)。
58
例1 设 ,计算: 解
59
例2 设 ,计算: 解
60
例3 假设某种电池寿命(单位:小时)为一随机变量,它服从参数为300和352的正态分布,计算:
这种电池寿命在250小时以上的概率; 确定数字 ,使电池寿命落在区间 内的概率不低于 。 解 设电池的寿命为 ,则
61
由 可得 利用分布函数的单调不减性,查表可得: 电池寿命落在区间[242.5,357.5]内的概率不低于 。
62
(4)以下介绍关于概率分布的分位数的概念 设随机变量X的分布函数为F ( x ),对于给定的正数 p(0< p <1)若数xp满足 则称数xp为此概率分布的 p 分位数。
63
标准正态分布 的p分位数 是指满足 即 的数 ,其值可由正态分布表查得,如图5—6 所示。 图5—6
64
§2、5 随机变量函数的分布 2、5、1 离散型随机变量函数的分布
§2、5 随机变量函数的分布 一般来讲,若 是一随机变量, 是 的某函数 ,由于 的取值会随 的变化而变化,从而 也是一个随机变量,也需要研究它的分布情况,下面我们分几种情况进行讨论。 2、5、1 离散型随机变量函数的分布
65
假设 是一维离散型随机变量, ,则 也是一离散型随机变量。如果已知 的分布列为:
则 的分布列容易得到:
66
应当注意的是有些 可能会相等,要在分布列中将其对应的概率相加合并成一项。
例1 设 的分布列为: 求下列各函数的分布列:
67
解 将 的分布列中两行对调可以算的下表: 的分布列:
68
的分布列: 的分布列:
69
(注:使反函数无意义的 ,定义概率密度为0)
2、5、2 连续型随机变量函数的分布 对于连续型随机变量的函数,有下列定理: ,且 是严格单调函数,其反函数 有连续的导数。则 也是连续型随机变量,且 的概率密度为 定理 设连续型随机变量 的概率密度为 (注:使反函数无意义的 ,定义概率密度为0)
70
例2 设连续型随机变量 的概率密度为 ,求 的概率密度。 为单调函数,反函数为 解 且 ,由定理可得 的 密度函数为 。 即若 将此结论用于正态分布的情形, ,则 的概率密度为
71
即 服从正态分布 ,所以正 态随机变量的线性函数仍是正态的。
特别地,若令 ,则 服从标准 正态分布 。 对一般的连续型随机变量函数,不一定
72
满足单调性的条件,上述定理不能直接引用。
例3 设随机变量 ,试求下列函数的概率密度。 是单调增加的函数,且 反函数为 解 从而 当 时, 无意义,概率密度 ; 当 时,由定理可得概率密度为
73
从而 的概率密度为 不是单调函数,按分布函数的定义 当 时, 的分布函数 ; 当 时,
74
由此可得 的概率密度为
Similar presentations