概率论 ( Probability) 2016年 2019年4月15日5时31分
第二章 随机变量及其分布 §2.1 随机变量 §2.2 离散型随机变量及其分布律 §2.3 随机变量的分布函数 第二章 随机变量及其分布 §2.1 随机变量 §2.2 离散型随机变量及其分布律 §2.3 随机变量的分布函数 §2.4 连续型随机变量及其分布 §2.5 随机变量函数的分布 2019年4月15日5时31分
在第一章中, 我们用样本空间的子集, 即样本点的集合来表示随机试验的各种结果, 这种表示方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限性。 在本章中, 我们将用实数来表示随机试验的各种结果, 即引入随机变量的概念。 这样, 不仅可以更全面揭示随机试验的客观存在的统计规律性, 而且可使我们用微积分的方法来讨论随机试验。 2019年4月15日5时31分
2.1.1 随机变量概念的产生 在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念。 2019年4月15日5时31分
1、有些试验结果本身与数值有关(本身就是一个数)。 例如,掷一颗骰子面上出现的点数; 每天从南昌站下火车的人数; 昆虫的产卵数。 离散的 七月份南昌的最高温度; 连续的 2019年4月15日5时31分
2、在有些试验中, 试验结果看来与数值无关, 但我们可以引进一个变量来表示它的各种结果。也就是说, 把试验结果数值化。 正如裁判员在运动场上不叫运动员的名字而叫号码一样, 两者建立了一种对应关系。 2019年4月15日5时31分
在随机试验中, 如果把试验中观察的结果(样本点)与实数对应起来, 即建立对应关系X, 使其对试验的每个结果ω, 都有一个实数X(ω)与之对应, ω. X(ω) R 则X的取值随着试验的重复而不同, X是一个变量, 且在每次试验中, 究竟取什么值事先无法预知, 也就是说X是一个随机取值的变量,由此, 我们很自然地称X为随机变量。 2019年4月15日5时31分
这种对应关系在数学上理解为定义了一种实值函数。 ω. X(ω) R 这种实值函数与在微积分中大家接触到的函数一样吗? 答:不一样,因为: 2019年4月15日5时31分
(1) 它随试验结果的不同而取不同的值, 因而在试验之前只知道它可能取值的范围, 而不能预先肯定它将取哪个值。 (2) 由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。 称这种定义在样本空间上的实值函数为 随 机 变 量 2019年4月15日5时31分
(1) 随机变量X不是实数的函数而是样本点ω的函数; (2) 对任意实数区间(a, b), “a<X<b”的概率是确定的。 有关随机变量定义的几点说明: (1) 随机变量X不是实数的函数而是样本点ω的函数; (2) 对任意实数区间(a, b), “a<X<b”的概率是确定的。 注意: (a, b), 与“a<X<b”不同。 (3) 引入随机变量后, 就可以用随机变量描述随机事件。 2019年4月15日5时31分
随机变量通常用大写字母 X, Y, Z或希腊字母, , 等表示 2019年4月15日5时31分
例如, 从某一学校随机选一学生, 测量他的身高。 我们可以把可能的身高看作随机变量X。 (例如X(张三)=1.75米,而“X =1.75”表示该校所有身高为1.75米的学生) 然后我们可以提出关于X的各种问题: 如 2019年4月15日5时31分
一旦我们实际选定了一个学生并量了他的身高之后, 我们就得到X的一个具体的值, 记作x。 2019年4月15日5时31分
有了随机变量, 随机试验中的各种随机事件,就可以通过随机变量的关系式(等式或不等式)表达出来。 引入随机变量的意义 有了随机变量, 随机试验中的各种随机事件,就可以通过随机变量的关系式(等式或不等式)表达出来。 例如: 单位时间内某电话交换台收到的呼叫次数用X表示, 它是一个随机变量: 事件{收到不少于1次呼叫} {没有收到呼叫} 2019年4月15日5时31分
可见, 随机事件这个概念实际上是包容在随机变量这个更广的概念内。也可以说, 随机事件是从静态的观点来研究随机现象, 而随机变量则是一种动态的观点, 就象微积分中常量与变量的区别那样。 2019年4月15日5时31分
随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后, 对随机现象统计规律的研究, 就由对随机事件及其概率的研究扩大为对随机变量及其取值规律的研究。 事件概率 2019年4月15日5时31分
如“取到次品的个数”, “收到的呼叫数”等; 随机变量 随机变量的分类 通常分为两类: 所有取值可以 逐个一一列举 离散型随机变量 如“取到次品的个数”, “收到的呼叫数”等; 随机变量 全部可能取值不仅 无穷多, 而且还不能 一一列举, 而是充满 一个区间 连续型随机变量 例如, “电视机的寿命”, 实际中常遇到的“测量误差”等。 2019年4月15日5时31分
这两种类型的随机变量因为都是随机变量, 自然有很多相同或相似之处; 但因其取值方式不同, 又有其各自的特点。 连续型随机变量 离散型随机变量 这两种类型的随机变量因为都是随机变量, 自然有很多相同或相似之处; 但因其取值方式不同, 又有其各自的特点。 学习时请注意它们各自的特点和描述方法。 2019年4月15日5时31分
定义2.1.1: 设(Ω,F, P)是概率空间,X(ω)是定义在Ω上的单值实函数,若对于任意实数x∈R, 有 2.1.2 随机变量的严格定义 定义2.1.1: 设(Ω,F, P)是概率空间,X(ω)是定义在Ω上的单值实函数,若对于任意实数x∈R, 有 可测空间(Ω,F)上的可测函数 称X(ω)是随机变量。 2019年4月15日5时31分
古典概率 例1 投掷两枚硬币试验,={{反反},{反正},{正反},{正正}} 令F={Φ; 例1 投掷两枚硬币试验,={{反反},{反正},{正反},{正正}} 令F={Φ; {反反},{正正};{反反,正正},{正反,反正}; {反反,反正,正反},{反正,正反,正正} ; } 为事件域 为可测空间。再令: 则( , F ) P{反反}=P{反正}= P{正反}=P{正正}= 1/4 古典概率 则(, F,P)为概率空间。 则X是随机变量。因为: 2019年4月15日5时31分
映射X: R X(反反)=0, X(正反)= X(反正)= 1,X(正正)=2 {反反} {反反,正反,反正} {反反,正反,反正,正正}= Ω {反反},{正正};{反反,正正},{正反,反正}; 令F={Φ; {反反,反正,正反},{反正,正反,正正} ; } 2019年4月15日5时31分
非古典概型 例2 掷两枚均匀的骰子,观察出现的点数,则该试验的 样本空间为: 记F=Ω的全体子集生成的集合族,同理可证:X是一个随机变量。 我们记掷出的点数之和为 X,则X 的可能取值为2,3,4,5,6,7,8,9,10,11,12 X 2 3 4 5 6 7 8 9 10 11 12 P 2019年4月15日5时31分
注1 由随机变量定义及事件域的性质, 有 注2 2019年4月15日5时31分
概率空间 (Ω, , P) P R Ω B 分布函数F(x) 随机变量X建立了Ω的子集与R的子集之间的对应关系。 R的子集: 以及,由上述区间的任意并、交、差、补所构成的集合。 以上集合构成的集族称为波莱尔域。记为B 。 R Ω 概率空间 B (Ω, , P) P 分布函数F(x) (§2.3,P36) 2019年4月15日5时31分
§2.2 离散型随机变量分布律 看一个例子: 从右边盒中任取3 个球 取到的白球数X是一个随机变量 . §2.2 离散型随机变量分布律 看一个例子: 从右边盒中任取3 个球 取到的白球数X是一个随机变量 . (1) X 可能取的值是0,1,2 ; (2) X 取每个值的概率为: 定义2.2.1 :某些随机变量X的所有可能取值是有限多个或可列无限多个, 这种随机变量称为离散型随机变量 . 2019年4月15日5时31分
(1)非负性 (2)归一性 定义2.2.2 :设 xk (k=1,2, …) 是离散型随机变量 X 所取的一切可能值,称 用这两条性质 判断一个函数 是否是分布律 (2)归一性 2019年4月15日5时31分
k =0,1,2, …, P(X =k)≥0, c≥0 , 例1 设随机变量X的分布律为: 试确定常数c . 解: 依据分布律的性质 即 从中解得 2019年4月15日5时31分
离散型随机变量表示方法 (1)公式法 (2)列表法 2019年4月15日5时31分
另外还可用图形来表示分布律:线条图、概率直方图. 0.075 0.325 0.6 0 1 2 X 线条图 0.2 0.4 0.6 1 2 P X P 0.2 0.4 0.6 1 2 0.075 0.325 X 概率直方图 2019年4月15日5时31分
常用的离散型分布 补充 退化分布 定义 如果随机变量 X 以概率 1 取某一常数 a ,即 P(X = a) = 1,则称随机变量 X 服从 a 处的退化分布。 注: 2019年4月15日5时31分
设随机变量 X 只可能取0与1两个值 , 它的分布律为 1. 两点分布 设随机变量 X 只可能取0与1两个值 , 它的分布律为 则称 X 服从 (0—1) 分布或两点分布. 2019年4月15日5时31分
2. 伯努利试验和二项分布 看一个试验 将一枚均匀骰子抛掷3次. 令X 表示3次中出现“4”点的次数 X的分布律是: 2. 伯努利试验和二项分布 看一个试验 将一枚均匀骰子抛掷3次. 令X 表示3次中出现“4”点的次数 X的分布律是: 2019年4月15日5时31分
一般地,设在一次试验E中我们只考虑两个互逆的 结果:A 或 . 掷骰子:“掷出4点”,“未掷出4点” 抽验产品:“是正品”,“是次品” 这样的试验E称为伯努利试验 . 2019年4月15日5时31分
将伯努利试验E独立地重复地进行n次 ,则称这一串重复的独立试验为n重伯努利试验 . “重复”是指这 n 次试验中P(A)= p 保持不变. “独立”是指各 次试验的结果互不影响 . 用X表示n重伯努利试验中事件A发生的次数,则 2019年4月15日5时31分
且两两互斥. 2019年4月15日5时31分
2019年4月15日5时31分
称这样的分布为二项分布.记为 二项分布 两点分布 易证: (1) (2) 2019年4月15日5时31分
二项分布的图形 2019年4月15日5时31分
伯努利试验对试验结果没有等可能的要求,但有下述要求: (1)每次试验条件相同; (2)每次试验只考虑两个互逆结果 A 或 , 且 P(A)=p , ; (3)各次试验相互独立. 可以简单地说, 二项分布描述的是n重伯努利试验中事件 A 出现的次数 X 的分布律 . 2019年4月15日5时31分
解:设X为三个灯泡在使用1000小时已坏的灯泡数 . 例2 某类灯泡使用时数在1000小时以上 的概率是0.2, 求三个灯泡在使用1000 小时以后最多只有一个坏了的概率. 解:设X为三个灯泡在使用1000小时已坏的灯泡数 . X ~ B (3, 0.8), 把观察一个灯泡的使用 时数看作一次试验, “使用到1000小时已坏” 视为“成功”. 每次试验, “成功”的概率为0.8 2019年4月15日5时31分
X ~ B(3,0.05), 例3 已知100个产品中有5个次品,现从中有放回 地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率. 解: 因为这是有放回地取3次,因此这3 次试验 的条件完全相同且独立,它是贝努里试验. 依题意,每次试验取到次品的概率为0.05. 设X为所取的3个中的次品数, 则 X ~ B(3,0.05), 于是,所求概率为: 2019年4月15日5时31分
若将本例中的“有放回”改为”无放回”, 那么各次试验条件就不同了, 此试验就不是伯努利试验 . 此时, 只能用古典概型求解. 请注意: 若将本例中的“有放回”改为”无放回”, 那么各次试验条件就不同了, 此试验就不是伯努利试验 . 此时, 只能用古典概型求解. 2019年4月15日5时31分
解 :这是n重贝努里试验概型。每次试验取到次品的概率为 例4 设有N件产品,其中有M件次品,现从这N件中有放回地任取n件,求其中恰有k件次品的概率. 解 :这是n重贝努里试验概型。每次试验取到次品的概率为 X ~ B(n, ) 2019年4月15日5时31分
上式即为超几何分布. 例4(续) 设有N件产品,其中有M件次品,现从这N件中无放回地任取n件,求其中恰有k件次品的概率. 解 : 正品 …… 2019年4月15日5时31分
例5 2019年4月15日5时31分
2019年4月15日5时31分 例6 分析 :这是不放回抽样.但由于这批元件的总数很 大, 且抽查元件的数量相对于元件的总数来说又很 小,因而此抽样可近似当作放回抽样来处理. 2019年4月15日5时31分
解 2019年4月15日5时31分
图示分布律 注意:P(X=4)最大。 2019年4月15日5时31分
二项分布中最可能出现次数 则称 为最可能出现的次数 2019年4月15日5时31分
2.2.3. 泊松分布 2019年4月15日5时31分
泊松分布的图形 2019年4月15日5时31分
历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的 . 二项分布与泊松分布的关系 历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的 . , 则对固定的 k,有 设 Possion定理: Poisson定理说明若X ~ B( n, p), 则当n 较大,p 较小, 而 适中, 则可以用近似公式 2019年4月15日5时31分
, 则对固定的 k,有 设 Possion定理: 证: 记 2019年4月15日5时31分
二项分布 泊松分布 2019年4月15日5时31分
例7 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件? 解: 设该商品每月的销售数为X, 已知X服从参数λ=5的泊松分布. 设商店在月底应进某种商品m件, 求满足 P{ X ≤ m }>0.95 的最小的m . 查泊松分布表得 P{ X ≤ 8 }=0.931906 P{ X ≤ 9 }=0.968132 ∴ m=9件 2019年4月15日5时31分
教材:P151 5 P{ X ≤ 8 } =0.931906 P{ X ≤ 9 } =0.968132 =左表中第一行 (m=0)开始一 0.006738 1 0.033690 2 0.084224 3 0.140374 4 0.175467 6 0.146223 7 0.104445 8 0.065278 9 0.036226 10 0.018113 教材:P151 =左表中第一行 (m=0)开始一 直累加到第k+1 行( m=k ). 例如 P{ X ≤ 8 } =0.931906 P{ X ≤ 9 } =0.968132 2019年4月15日5时31分
例8 设有同类型设备90台,每台工作相互独立, 每台设备发生故障的概率都是 0.01. 在通常 情况下,一台设备发生故障可由一个人独立 每台设备发生故障的概率都是 0.01. 在通常 情况下,一台设备发生故障可由一个人独立 维修,每人同时也只能维修一台设备. 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01? (2) 问3个人共同负责90台还是3个人各自独立负 责30台设备发生故障不能及时维修的概率低? 例8 解 (1) 设 需要配备 N 个维修工人,设 X 为90 台 设备中发生故障的台数,则 X ~ B( 90, 0.01) 2019年4月15日5时31分
令 则 查P150附表1得 0.9 0.406570 1 0.365913 2 0.164661 3 0.049398 4 0.011115 5 0.002001 2019年4月15日5时31分
三个人共同负责90台设备发生故障不能 及时维修的概率: 2019年4月15日5时31分
设30台设备中发生故障的台数为 Y ~ B ( 30,0.01) 设每个人独立负责30台设备,第 i 个人负责的 30台设备发生故障不能及时维修为事件 Ai 则 三个人各独立负责30台设备发生故障不能及时 维修为事件 故 三个人共同负责90 台设备比各自负责好! 2019年4月15日5时31分
Poisson分布应用场合 例如,在一定时间间隔内: 电话总机接到的电话次数; 市级医院急诊病人数; 一个容器中的细菌数; 某一地区发生的交通事故的次数 放射性物质发出的粒子数等。 2019年4月15日5时31分
例9设一只昆虫所生虫卵数为随机变量 X ~ π(), 每个虫卵孵出幼虫的概率为 p. 设各个虫卵 是否能发育成幼虫是相互独立的. 求一只昆虫 所生的虫卵孵出的幼虫数 Y 的分布律. 解: 一只昆虫(生出) X 个虫卵(孵出) Y 个幼虫 已知: 2019年4月15日5时31分
由全概率公式 故 2019年4月15日5时31分
例10 某射手连续向一目标射击,直到命中为止,已知他每发命中的概率是p,求所需射击发数X 的分布律. 为计算 P{X =k }, k = 1,2, …, 设 Ak = {第k发命中},k =1, 2, …, 于是 P{X=1}=P(A1)=p, 这就是求所需射击发数X的分布律. 2019年4月15日5时31分
称随机变量 X 服从参数为 p 的几何分布。且记 为 2.2.4 几何分布 考虑可列重伯努利试验 ,事件A发生称为“成功”, ① ② k-1 k 称随机变量 X 服从参数为 p 的几何分布。且记 为 2019年4月15日5时31分
定理 几何分布的无记忆性 设 随机变量X 服从参数为 p 的几何分布,则对任何正整数 m、n,有 P ( X > m+n | X > m ) = P ( X > n ) 。 证明 ∵ 随机变量 X 服从参数为 p 的几何分布: P(X=k) = pqk 1 ,k=1,2,… ( 0 < p < 1 ,q=1p ) ∴ 对任何正整数 m、n,有 反之,具有无记忆性的离散分布一定是几何分布P35充分性证明 2019年4月15日5时31分
§2.3 随机变量的分布函数 前一节介绍的离散型随机变量, 我们可用分布律来完整地描述. 而对于非离散型随机变量, 由于其取值不可能一个一个列举出来, 而且它们取某个值的概率可能是零. 例如: 在测试灯泡的寿命时, 可以认为寿命X的取值充满了区间 , 事件 表示灯泡的寿命正好是 , 在实际中, 即使测试数百万只灯泡的寿命, 可能也不会有一只的寿命正好是 , 也就是说, 事件( )发生的频率在零附近波动, 自然可以认为 . 2019年4月15日5时31分
———|——> 定义 设X是一个随机变量, 称 为X的分布函数. 记作X~F(x)或 FX(x). x 的概率. 2019年4月15日5时31分
问: 在上式中, X, x皆为变量, 二者有什 么区别? x起什么作用? F(x)是不是概率? X是随机变量, x是自变量. 2019年4月15日5时31分
有了分布函数定义, 任意x1, x2∈R, , 随机变量X落在(x1, x2]里的概率可用分布函数来计算: 在这个意义上可以说, 分布函数完整地描述了随机变量的统计规律性, 或者说, 分布函数完整地表示了随机变量的概率分布情况. 2019年4月15日5时31分
分布函数是一个普通的函数, 正是 通过它, 我们可以用微积分的工具来 研究随机变量. 2019年4月15日5时31分
分布函数的性质 (1) F(x)非降, 即若 , 则 ; (2) (3) F(x) 右连续, 即 2019年4月15日5时31分
分布函数性质的证明: 2019年4月15日5时31分
试说明F(x)能否是某个随机变量 的分布函数. 解: 注意到函数 F(x)在 上下降, 不满足性质(1), 故F(x)不能是分布函数. 2019年4月15日5时31分
1 P ( X x ) 1 P ( X < x ) 记忆:大X右开取左极限 证明: 用分布函数计算随机事件 2019年4月15日5时31分 左极限 (1)P ( X < x ) = F( x 0 ) 记忆:大X右开取左极限 证明: (2)P ( X = x ) = F ( x ) F ( x 0 ) ∵ {X = x} = {X x} {X<x} (3)P ( X > x ) = 1 P ( X x ) =1 F ( x ) (4)P ( X x ) = 1 P ( X < x ) =1 F ( x 0 ) 2019年4月15日5时31分
(5)P ( a < X b )= F ( b ) F ( a ) 更进一步,对任意实数 a < b,复合事件 { a < X < b }、 { a X < b }、 { a < X b } 、{ a X b } 的概率,都可以用分布函数来计算: (5)P ( a < X b )= F ( b ) F ( a ) (6)P ( a < X < b ) = F ( b 0 ) F ( a ) (7) P ( a X < b ) = F( b 0 ) F( a 0 ) (8)P ( a X b ) = F ( b ) F ( a 0 ) 左极限规律:大X左闭右开。 2019年4月15日5时31分
例2 , 求 F(x). 不是左连续 解: 当 时, , 故 当 时, 右连续 当 时, 当 时, 2019年4月15日5时31分
故 注意右连续 此分段函数有三个分段点0,1,2,故有 2019年4月15日5时31分
分布律图 (离散的) 1 2 P X 分布函数图 (阶梯形递增右连续) 2019年4月15日5时31分
由于F(x)是X取 的诸值xk的概率之和, 故又称F(x)为累积概率函数. 离散型随机变量的分布函数 设离散型随机变量 X的分布律是: P{X=xk}= pk, k =1, 2, 3,… 则 由于F(x)是X取 的诸值xk的概率之和, 故又称F(x)为累积概率函数. 2019年4月15日5时31分
? 用分布函数描述随机变量不如分布律直观, 对连续型随机变量, 是否有更直观的描述方法? a b 2019年4月15日5时31分
§2.4 连续型随机变量的概率密度 连续型随机变量X所有可能取值充满一个区间, 对这种类型的随机变量, 不能象离散型随机变量那样, 以指定它取每个值概率的方式, 去给出其概率分布, 而是通过给出所谓“概率密度”的方式. 2019年4月15日5时31分
定义 设F(x)是随机变量X的分布函数, 若存在非负可积函数f(x), (-<x<+), 使对一切实数x, 均有 则称X为连续型随机变量, 且称f(x)为随机变量X的概率密度. 常记为X~ f(x), (-<x<+) 注:由积分上限函数的连续性知, F(x)是连续函数。 2019年4月15日5时31分
概率密度的性质 【注】这两条性质是判定一个 1 o 函数 f(x)是否为某个随机变量 X 的 概率密度的充要条件 2 o f(x) 面积为1 x f(x) 面积为1 2019年4月15日5时31分
对于任意实数 x1 , x2 , (x1 < x2 ) , 若 f (x) 在点 x 处连续 , 则有 利用概率密度可确 定随机点落在某个 范围内的概率 x f(x) x1 x2 若 f (x) 在点 x 处连续 , 则有 2019年4月15日5时31分
对 f(x)的进一步理解: 若 x 是 f(x) 的连续点,则 故 X的密度 f(x) 在 x 这一点的值,恰好是X 落 在区间 上的概率与区间长度 之比的极限。 2019年4月15日5时31分
若不计高阶无穷小,有 表示随机变量 X 取值于 的概率近似等于 . 2019年4月15日5时31分
f (x) x o a 要注意的是,概率密度 f (x)在某点处a的高度(取值),并不反映X取值的概率. 但是,这个高度越大,则X取a附近的值的概率就越大. 也可以说,在某点概率密度曲线的高度反映了概率集中在该点附近的程度. 2019年4月15日5时31分
需要指出的是: 连续型随机变量取任一指定值的概率为0. 即: a为任一指定值. 这是因为 2019年4月15日5时31分
由此得, 对连续型 随机变量 X, 有 2019年4月15日5时31分
由于连续型 随机变量唯一被它的概率密度或分布函数所确定 由于连续型 随机变量唯一被它的概率密度或分布函数所确定. 所以, 若已知概率密度或分布函数其中之一, 该连续型随机变量的统计规律就得到了全面描述. f (x) x o 下面给出几个随机变量的例子. 2019年4月15日5时31分
例1 设随机变量X的 概率密度为: 求 分布函数F(x). 由于f(x)是分段 表达的, 求F(x)时 注意分段求. 例1 设随机变量X的 概率密度为: 求 分布函数F(x). 由于f(x)是分段 表达的, 求F(x)时 注意分段求. 2019年4月15日5时31分
三个分段点0,1,2 F(x)= 四段 2019年4月15日5时31分
= F(x) 即 2019年4月15日5时31分
例2 设随机变量X的 分布函数为: 解: 2019年4月15日5时31分
2019年4月15日5时31分
概率密度图像: 1 0 1 2 分布函数图像: 1 2 1 0 2019年4月15日5时31分
解: P(-1<X<1.5) =F(1.5)-0 例3 已知随机变量X的分布函数为: 例3 已知随机变量X的分布函数为: 求X取值在区间 (-1, 1.5)与[ -1, 1.5 ]上的概率。 解: P(-1<X<1.5) =F(1.5)-F(-1) =F(1.5)-0 2019年4月15日5时31分
例4 已知随机变量X的概率密度为: 解: 求X取值在区间 (-1, 1.5)与[ -1, 1.5 ]上的概率。 例4 已知随机变量X的概率密度为: 2019年4月15日5时31分 求X取值在区间 (-1, 1.5)与[ -1, 1.5 ]上的概率。 解: 2019年4月15日5时31分
常用的连续型分布 一、均匀分布 均匀分布是连续型分布中最简单的一种分布,它是用来描述一个随机变量在一个区间上等可能地取每一个值的分布规律 , 它是离散型情形 n 个点上的均匀分布在连续型情形的推广: 在离散型情形, n 个点上的均匀分布描述随机变量在 n 个点上取值,且取每一点的概率都相同; 在连续型情形,[a,b] 区间上的均匀分布,则描述随机变量在该区间上取每一点的概率密度都相同。 2019年4月15日5时31分
向区间[a,b]上均匀地投掷一随机点,以X表示随机点的落点坐标,X为均匀分布。 定义 如果随机变量 X 的概率密度函数为 ,则称随机变量 X 服从区间 [a,b] 上的均匀分布,记作 X~U[a,b] 。 其密度函数的图形为: 如果 随机变量X ~ U[a,b] ,则它的分布函数为: 其分布函数的图形为: a 0 b x f(x) 1/(b a) a 0 b x 1 F(x) 2019年4月15日5时31分
于是,在候车的十位乘客中,只有一个等车时间超过 4 分 钟的概率为: 例 5 设一个汽车站上,某路公共汽车每五分钟有一辆车到达,设乘客在五分钟内的任意时刻到达都是等可能的。计算在候车的十位乘客中,只有一个等车时间超过 4 分钟的概率 . 解 记 X =每位乘客的到达时刻, Y =在候车的十位乘客中,“ 等车 时间超过 4 分钟” 的人数。 则 X ~ U[0,5] , Y ~ B (10,p ) , 其中 于是,在候车的十位乘客中,只有一个等车时间超过 4 分 钟的概率为: 注:公共汽车的到达时刻不是随机变量。 2019年4月15日5时31分
记X 为第一个粒子发射出来的时刻(独立重复试验中首次成功),则 2019年4月15日5时31分
设X 为第一个粒子发射出来的时刻(独立重复试验中首次成功),则 2019年4月15日5时31分
乘客在公交车站等车的时间,电子元件的寿命等, 因而它在可靠性理论和排队论中有广泛的应用. 二、指数分布 如果随机变量 X的密度函数为 则称X服从参数为 的指数分布, 的几何图形如图. 注: 指数分布常用来描述对某 一事件发生的等待时间.例如, 乘客在公交车站等车的时间,电子元件的寿命等, 因而它在可靠性理论和排队论中有广泛的应用. 2019年4月15日5时31分
x f ( x) x F( x) 1 2019年4月15日5时31分
例6 某元件的寿命 服从指数分布, 已知其参数 求 3 个这样的元件使用 1000 小时, 至 少已有一个损坏的概率. 解 由题设知, 的分布函数为 由此得到 各元件的寿命是否超过 1000 小时是独立的, 用 表示三个元件中使用 1000 小时损坏的元件数, 2019年4月15日5时31分
例6 某元件的寿命 服从指数分布, 已知其参数 求 3 个这样的元件使用 1000 小时, 至 少已有一个损坏的概率. 解 各元件的寿命是否超过1000小时是独立的, 用 表示三个元件中使用 1000 小时损坏的元件数, 则 所求概率为 2019年4月15日5时31分
指数分布的一个重要性质就是“无后效性”或“无记忆性”.具体叙述如下: 证 值得指出的是,我们可以证明,指数分布是唯一具有“无记忆性”的连续型分布. 2019年4月15日5时31分
三 正态分布 若X 的 密度 函数为 亦称高斯 (Gauss)分布 为常数, 则称 X 服从参数为 , 2 的正态分布 三 正态分布 若X 的 密度 函数为 亦称高斯 (Gauss)分布 为常数, 则称 X 服从参数为 , 2 的正态分布 记作 X ~ N ( , 2 ) 2019年4月15日5时31分
— 位置参数 即固定 , 对于不同的 , 对应的 f (x) 的形状不变化,只是位置不同 f ( x) 的两个参数: 2019年4月15日5时31分
几何意义 大小与曲线陡峭程度成反比 数据意义 大小与数据分散程度成正比 — 形状参数 若 1< 2 则 小 大 若 1< 2 则 小 大 几何意义 大小与曲线陡峭程度成反比 数据意义 大小与数据分散程度成正比 2019年4月15日5时31分
事实上 , 2019年4月15日5时31分
正态分布 的分布函数 设 X~ , X 的分布函数是 2019年4月15日5时31分
标准正态分布 正态分布表(P154) 2019年4月15日5时31分
根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题. 证: Z 的分布函数为 根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题. 2019年4月15日5时31分
(1)若 X~N(0, 1),则 ~N(0,1) (2)若 2019年4月15日5时31分
棣莫佛-拉普拉斯中心极限定理 (第五章给出证明) 2019年4月15日5时31分
若 随机变量X ① 受众多相互独立的随机因素影响 ② 每一因素的影响都是微小的 正态分布随机变量的条件 2019年4月15日5时31分
可用正态变量描述的实例极多: 各种测量的误差; 人体的生理特征; 工厂产品的尺寸; 农作物的收获量; 股票的对数收益率;学生的考试成绩; 各种测量的误差; 人体的生理特征; 工厂产品的尺寸; 农作物的收获量; 股票的对数收益率;学生的考试成绩; 2019年4月15日5时31分
X 0 0.5 0.6915 1 0.8413 X 0 2.5 0.9938 2019年4月15日5时31分
例7 设 X~N( , 2 ), 求 P(|X-| < k ) k=1,2,3 . P(|X-| < 3 ) = P( - 3 < X < + 3 ) 解: = 0. 9974 这表明 X 的取值几乎全部集中在区间 [- 3 , +3]内, 超出这个范围的可能性不到 0. 3 % , 从而可以忽略不计. 类似计算可得, X 0 1 0.8413 2 0.9772 3 0.9987 2019年4月15日5时31分
例8 从甲地乘车到乙地有两条路线:第一条路线穿过市区,路程较短,但交通拥挤,所需时间(单位:分)服从正态分布 N( 50,100 );第二条路线沿环城公路走,路程较长,但意外阻塞较少,所需时间服从正态分布 N( 60,16 ) 。 (1)假如有 70 分钟可用,问应走哪一条路线? (2)假如有 65 分钟可用,问应走哪一条路线? 解 记 随机变量 为行车时间,则 服从正态分布。 (1)如果还有 70 分钟可用, 走第一条路线时, ~ N( 50,100 ) ,能及时赶到的概率为: 2019年4月15日5时31分
∵ p1 = 0.97725 < 0.99379 = p2 , (1)如果还有 70 分钟可用, 走第一条路线时, ~ N( 50,100 ) ,能及时赶到的概率为: 走第二条路线时 ~ N( 60,16 ) ,能及时赶到的概率为: ∵ p1 = 0.97725 < 0.99379 = p2 , ∴ 如果还有 70 分钟可用,应该走第二条路线。 (2)如果还有 65 分钟可用,应该走第一条路线。 2019年4月15日5时31分
离散 二项分布 几何分布 成功次数 等待时间 随机变量 连续 指数分布 正态分布 2019年4月15日5时31分
§2.5 随机变量函数的分布 问题:已知 随机变量 X 的概率密度 或分布律。。 求: 随机因变量Y= g ( X )的概率密度 或分布律。 §2.5 随机变量函数的分布 问题:已知 随机变量 X 的概率密度 或分布律。。 求: 随机因变量Y= g ( X )的概率密度 或分布律。 方法 将与Y 有关的事件转化成 X 的事件。 例如: 2019年4月15日5时31分
-1 0 1 2 X pk Y 1 -3 -1 1 3 pi 一 离散型 随机变量函数的分布律 例1 已知 X 的概率分布为 -1 0 1 2 X pk 求 Y 1= 2X – 1 与 Y 2= X 2 的分布律 Y 1 解 -3 -1 1 3 pi 2019年4月15日5时31分
X -1 0 1 2 Y 2= X 2 pk Y 2 1 0 1 4 pi 0 1 4 Y 2 pi 2019年4月15日5时31分
其中 p + q = 1, 0 < p < 1, 求 Y = Sin X 的概率分布 解 例2 已知 X 的概率分布为 2019年4月15日5时31分
故 Y 的概率分布为 Y -1 0 1 pi 2019年4月15日5时31分
二 连续型 随机变量函数的概率密度 已知: X 的概率密度 f (x), 求: Y = g( X ) 的。 方法: (1) 从分布函数出发求密度函数; (2)用公式直接求密度函数。 2019年4月15日5时31分
例3 已知 X 密度函数为 为常数,且 a 0, 求 fY ( y ) 解: 当a > 0 时, 2019年4月15日5时31分
当a > 0 时, 当a < 0 时, 一般地,有下列定理: 2019年4月15日5时31分
定理. 证明: 2019年4月15日5时31分
对(2)(3)有: 所以 2019年4月15日5时31分
例4 设随机变量 服从正态分布,证明 也服从正态分布. 解 2019年4月15日5时31分
此例说明:正态变量的线性函数仍是正态变量。 2019年4月15日5时31分
例5 已知 X ~ N (0,1) , Y = X 2 , 求 f Y (y) 解:从分布函数出发 当 y < 0 时,FY (y) = 0 当 y > 0 时, [ y [ ] [ ] y 2019年4月15日5时31分
X ~ N (0,1) 故 结论: 若 X ~ N (0,1) , 则Y = X 2 参数为1的卡方分布 2019年4月15日5时31分
例6 设随机变量 为另一个随机变量 的分布函数,且严格单调递增, 则随机变量 的分布函数是 证明: 2019年4月15日5时31分