第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度

第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度
第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度第五节随机变量函数的概率分布

第一节随机变量一. 随机变量取值随机会而定的变量，它随着随机试验的不同结果而取不同的数值。一个随机变量取值的规律称为它的概率分布，
第一节随机变量一. 随机变量取值随机会而定的变量，它随着随机试验的不同结果而取不同的数值。一个随机变量取值的规律称为它的概率分布，简称 “分布”(distribution) 。随机变量的分布包含两个部分：取哪些值？取这些值相应的概率是多少？

例抛掷均匀硬币两次，用X 表示正面 H 出现的次数。 X = ，，试验结果 = {TT} ， {HT,TH}， {HH} 相应概率 = 1/4 ， /2 ， /4 X 的概率分布也可以表格的形式表示： X p / / /4

例2.1.2 在 n 重 Bernoulli 试验中，事件 A 出现
的次数 X ；它所有可能的值是 0，1，2，…，n 。例独立重复试验中，直到 A 发生为止所需要的试验次数 X ；所有可能的取值是一切正整数。例假设一个随机点从坐标原点出发，每次在数轴上都以 1/3 的概率向左移动一格，或者停留原地，或者向右移动一格，则 n 步移动后这个随机点的位置 X 是随机变量；它可能取 – n ~ + n 之间的任何一个整数。

例某一时间段内，车站到来的乘客数，或在某一个区域里，野生动物的数量 · · · · · ；它所有可能的取值是一切非负整数。例在一个区间中随机等可能的取一个点 X ； X 可能取这个区间中任何一个数。例在一批电子元件中随机抽取一只测试寿命 X ; X 可取任意一个非负的实数。例一个物体的测量值与真实值的误差 X ； X 可取任意一个实数。

定义设 E 是随机试验， S 是它的样本空间，如果对于每一个样本点  ，都有一个实数与它对应，则称这个定义在样本空间上的单值实函数： X = X () 是一个随机变量。 S  X () x

通过引进随机变量的概念，能够把不同的样本空间
抽象化为一些定量的实数，由此就可以利用高等数学的有关方法来研究随机现象。其次，在随机变量的概率分布中我们关注的重点是这个随机变量取某些值的概率，而不是它的取值。就象我们只关心样本空间里一些样本点发生的概率，而这些样本点本身并不是研究的重点。随机变量(random variable) 的缩写为 r. v .

二. 随机变量的基本分类离散随机变量：所有可能的取值为有限、或可数无穷个；连续随机变量：所有可能的取值为不可数无穷，
二随机变量的基本分类离散随机变量：所有可能的取值为有限、或可数无穷个；连续随机变量：所有可能的取值为不可数无穷，即，在某个连续区间或整个实数轴上取值。思考1 一个连续随机变量的概率分布应该如何定义？例如：从 (1,2) 区间中等可能地取一个数 X ，那么 X 的概率分布如何表示？

三. 随机事件与随机变量的关系对任意的随机事件 A ，都可以引进一个离散随机变量来表示 A 是否发生。 1，如果 A 发生 X =
三随机事件与随机变量的关系对任意的随机事件 A ，都可以引进一个离散随机变量来表示 A 是否发生。 1，如果 A 发生 X = 0，如果 A 不发生反之，任何随机变量，在某个范围内取值，都是一个随机事件。思考2：第一章里我们接触过那些随机变量？

第二节离散随机变量及分布律一. 离散随机变量 1. 如果一个随机变量只取有限多个或者可数无穷多个
第二节离散随机变量及分布律一. 离散随机变量 1. 如果一个随机变量只取有限多个或者可数无穷多个 (可列个) 可能值，这种随机变量就称为离散随机变量。古典概型的问题都可以采用取有限值的离散随机变量来处理。 2. 离散随机变量所有可能的取值以及相应的概率称为它的概率分布或者分布律，一般表示成： P { X = xk } = pk , k ≥ 1 。

离散随机变量概率分布的表格形式 X x x x3 … xn … pk p p p3 … pn … 根据概率的定义，离散随机变量分布律必须满足下面两个条件： (1) pk ≥ 0 , k = 1, 2, 3, … (2) ∑k ≥ 1 pk = 1 思考 1 对不同的 k，随机事件{ X = xk }是什么关系？

例2.2.1 假设城市的某条街道有四个路口，汽车在每个
路口是否遇到红灯是独立的，并且概率都是 p ，以 X 记汽车首次停下时通过的路口数，求 X 的概率分布。解。分析： X 的所有可能取值为：0 ，1 ，2 ，3 ，4 。 ① ③ ② ④

因此，如果记 q = 1 – p 则有： P { X = 0 } = p ； P { X = 1 } = pq ； P { X = 2 } = pq2 ；P { X = 3 } = pq3 ； P { X = 4 } = q4 。 □ 练习2.2.2 离散分布涉及的几个数列求和公式 (0 ＜ x ＜1) 1 – x n +1 1 – x ① x + x2 + … + xn = ———— 1 1 – x ② x + x2 + …= —— 1 (1 – x)2 ③ x + 3x2 + 4x3 + … = ———

两点分布用来描述所有只有两个可能结果的随机试验
二. 常见的离散分布 1 . 两点分布 ( 也称 0 – 1 分布，或Bernoulli 分布 ) 记为 X ~ B (1,p) ， 0 ＜p ＜1 。如果 X 只取 0 ，1 两个可能值，分布律为： P { X = 1 } = p ，P { X = 0 } = q = 1 – p 则称随机变量 X 服从参数 p 的两点分布。两点分布用来描述所有只有两个可能结果的随机试验

2. 二项分布 X ~ B (n,p) 这是概率论里最重要的三种分布的第一种 X 全部可能的取值是有限的整数 0，1，…，n ；分布律为： pk = Cnk pk qn – k ，0 ≤ k ≤ n 这里参数 0 ＜ p ＜ 1 , q = 1 – p 。两点分布就是 n = 1 时的二项分布思考2 抛掷均匀硬币 10 次，正面出现次数 X 的分布？

二项分布的背景材料二项分布对应于随机抽样模型中的有放回抽样，二项分布也与独立试验序列概型有关，即在 n 重 Bernoulli 试验中，随机事件 A 发生的次数服从参数为 n、p 的二项分布；二项分布广泛应用于抽样调查的问题中，以及在金融，保险，医学，生物遗传学等等都有重要的应用。

例 (金融保险) 根据生命表知道，在某个年龄段的投保人中一年内每个人死亡的概率是，现在有 10,000 人参加保险，问未来一年中死亡人数不超过 60 人的概率。解。分析：以 X 记这 10,000 人中死亡的人数，则显然有 X ~ B (104，0.005 ) ，需要计算P { X ≤ 60 } 。 P { X ≤ 60 } = ∑k6=00 [C10000k k – k ] ≈ 。 □ 第五章中心极限定理能够有效计算这类求和

超几何分布对应于随机抽样模型中的无放回抽样
超几何分布从包含 M 件次品的 N 件产品中无放回随机取出 n 件产品，其中的次品数 X 是一个随机变量，它的分布称为超几何分布。分布律为：超几何分布对应于随机抽样模型中的无放回抽样思考3 从含有 3 张假钞的 10 张纸币中取出 4 张，这 4 张里包含的假钞张数 X 的分布？

例 (抽奖问题) 一场晚会将根据每个人的入场卷号码现场随机抽出几个幸运号赠送奖品。假设有 100 人参与，每个人入场时随机领取一张入场卷，现场要抽出 3 个幸运号码。求在一个 5 人小团体中至少有一人中奖的概率。解. 分析：设他们中奖的人数为 X ，即求：1 – P { X = 0 } ，问题的关键是找出 X 的分布律。把这 5 个人的号码看成是次品，抽出 3 个幸运号就是从 100 个产品中随机无放回抽取 3 个产品。因此, X 服从超几何分布。

根据超几何分布的分布律，这 5 个人恰好有 k 个人中奖的概率就是： C5k C953 – k C1003 P { X = k } = ————— ，0≤k ≤3 因此至少有一个人中奖的概率是： C95 3 C1003 p = 1 – ——— ≈ □ 思考4 现在有 N 个观众，要抽出 k 个幸运号，则单独一个人他的号码中奖的概率？ ( k/N )

4. 几何分布 X ~ G (p ) 在独立重复试验中，直到事件 A 发生时所需要的试验次数。 X 可能的取值是一切正整数：1 ，2 ，… ；分布律为： P { X = k } = pqk－1 , k ≥ 1 。这里参数 0 ＜ p ＜ 1 , q = 1 – p 。 Remark 由于几何分布满足 P { X ≤m } = 1 – qm ，因此具有一种“无记忆性” ： P { X = k } = P { X = m + k | X ＞m }

例2.2.5 ( 离散随机等待时间) 每张彩票中奖概率 0.01，某人每次只买一张。 (1) 他买到第 5 张才中奖的概率，(2) 买了 8 张都没有中奖的概率， (3) 买到第 13 张才中奖的概率。解. 买到第一张中奖彩票需要的次数 X ~ G (0.01 ) ， (1) 即，P { X = 5 } = 0.01× ≈ ； (2) 即，P { X ＞8 } = ≈ ； (3) 即，P { X = 13 } = 0.01× ≈ 。 □ 练习2.2.6 要以 90%的概率至少中奖一次，他需要买多少张彩票？

5. Poisson (泊松) 分布： X ~  ()
这是最重要的离散分布。 X 可能取值是所有非负整数 0，1，2，…；分布律为： P { X = k } = —— e –  ，k ≥ 0 这里泊松分布的参数  ＞ 0 。  k k ! Remark e x 的泰勒( Taylor )展开公式 ( 对任意实数 x ) e x = 1 + x + —— + —— + … + —— + … x x xk 2 ! ! k !

泊松分布的背景材料大量重复试验中，稀有事件出现的次数； ( 定理的泊松逼近定理 ) 意外事故，非常见病，大的自然灾害，害虫的数量，草原动物的种群等。随机质点流 ( 事件流 )。平稳性，稀有性，无记忆性通讯的呼叫次数，顾客数，衰变产生的粒子数，容器中微生物的数量等。

例 (网络安全) 假定服务器在长度 t 分钟的时间内受到攻击的次数近似服从  (2t )，问 3 分钟内至少受到一次攻击的可能是否比 5 分钟内至少受到两次攻击的可能大？解。 3 分钟内受到攻击的次数 X ~  (6 )，因此 P { X ≥1 } = 1 – P { X = 0 } ≈ ， 5 分钟内受到攻击的次数 Y ~  (10 )，因此 P { Y ≥2 } = 1 – P { Y = 0 } – P { Y = 1 } ≈ 5 分钟里至少两次被攻击的可能更大。 □

三. 超几何、二项、泊松分布之间的近似关系定理2.2.1 超几何分布的极限分布是二项分布即，在超几何分布中对于固定的 n，k ，如果
三. 超几何、二项、泊松分布之间的近似关系定理超几何分布的极限分布是二项分布即，在超几何分布中对于固定的 n，k ，如果 lim N→+∞ — = p 则有极限关系： lim N→+∞ —————— = Cnk pk (1 – p )n – k 对所有的 0 ≤ k ≤ n 都成立。 M N CMk CN – M n – k CNn 一般当 n ≤ 0.1 N 时可以用这个近似的计算公式

定理2.2.2 (泊松定理) 二项分布的极限分布是泊松分布
定理2.2.2 (泊松定理) 二项分布的极限分布是泊松分布设随机变量序列 Xn ~ B(n,pn) , n ≥ 1 ，如果满足极限 lim n→+∞ npn =  ＞ 0 ；则有 lim n→+∞ P { Xn = k } = lim n→+∞ Cnk pnk (1 – pn )n – k = —— e –  ，对所有固定的 k ≥ 0 都成立.  k k ! 一般当 n ≥ 20 ，p ≤ 时可以近似计算

例利用泊松定理计算例题1.6.7 中的概率。某人每次射击的命中率是，他在 2500 次独立重复射击中至少打中一次目标的概率。 (已经计算出的精确值是 ) 解. 这个人击中的次数 X 显然 ~ B(2500,0.001) ，根据泊松定理， X 近似服从  (2.5) 。查泊松分布表，参数 2.5 的泊松分布等于 0 的概率是，因此直接得到： P { X ≥1 } ≈ 。 □

例 (优化问题) 有同类型的机器 300 台，它们独立工作，发生故障的概率都是 0.01 。假设一台机器的故障可由一个人单独处理，现在有两种维修方案： (1) 配备 6 名维修人员共同负责全部 300 台机器； (2) 配备 10 名维修人员，每人各只负责 30 台机器。问这两种方案哪一种更加有效？解。全部 300 台机器里出现故障而不能及时维修的概率越小，这种维修方案也就越有效。以 X、Y 分别记同一时刻 300、30 台机器故障数目， X ~ B(300,0.01) ，Y ~ B(30,0.01) 。

根据泊松定理，X、Y 的近似分布分别是： X 近似 ~  (3) ，Y 近似 ~  (0.3) 。 ① 方案一， 6 个人共同负责 300 台机器， “不能同时维护 300 台机器” 的概率是： P { X ＞ 6 } ≈ ∑k ≥ 7 [ —— e –  ] = ； 3 k k ! ② 方案二，每人负责自己的 30 台机器，他及时维修故障的概率是 P {Y ≤1} ， “不能同时维护 300 台机器” 的概率是： 1 – P {Y ≤1}10 ≈ 1 – {e – ×e – 0.3 }10 = 。 6 个人合作的效率远远高于10 个人的独立工作 □

习题 2.2 1. 教材 69 页第 1 题； 2. 教材 69 页第 3 题； 3. 教材 69 页第 6 题；
习题 2.2 1. 教材 69 页第 1 题； 2. 教材 69 页第 3 题； 3. 教材 69 页第 6 题； 4. 教材 69 页第 10 题； 5. 教材 70 页第 13 题 .

第三节随机变量的分布函数一. 分布函数的定义 X 是一个随机变量， x 是任意实数，函数 F(x) = P {X ≤ x}
第三节随机变量的分布函数一. 分布函数的定义 X 是一个随机变量， x 是任意实数，函数 F(x) = P {X ≤ x} 称为是 X 的分布函数(distribution function ：d.f ) 。 ① 分布函数实际上是随机事件( X ≤ x ) 发生的概率； ② 也理解成随机点 X 落在区间( – ∞ ，x ] 中的概率。思考 1 分布函数 F(x) 应该具有什么样的数学性质？

例计算并画出参数 p 的两点分布的分布函数解. 两点分布的分布律是： P ( X = 0 ) = q， P ( X = 1 ) = p ； q = 1 – p 由于 X 只可能取 0、1 两个值，因此 0 ， x ＜ 0 ， F ( x ) = q ，0 ≤ x ＜ 1 ， 1 ， x ≥ 1 。 o x ○ F (x) 1 q □

离散随机变量分布函数的图形 F (x) 1 . . . 阶梯型跳跃线段 p1+ p2 ○ ○ p1 x ○ x1 x2 x3

二. 分布函数的主要性质 1. 非负有界 0 ≤ F (x) ≤ 1 ； ( 即，概率定义中的非负与规范性 )
2. 单调性当 x1 ＜ x2 ，则 F (x1 ) ≤ F (x2 ) ； ( 即，A  B 则有 P (A) ≤ P (B) ) 3. 极限性质 F ( – ∞) = lim x→ – ∞ F (x) = 0 ， F ( + ∞) = lim x→+ ∞ F (x) = 1 。

例讨论如下的分布函数 F (x) = 1 – e – x , x ＞ 0 (为简便我们总是省略分布函数等于 0 的部分) o x F (x) 1 解. 0 ≤ F (x) ＜ 1，非负有界； ( – ∞ ，0 ] 上恒等于 0，而在 [ 0，+ ∞ ] 单调递增，单调性；极限性质显然满足。 □ 思考 X 落在区间 (1，3 ]的概率是多少？

三. 利用分布函数计算概率 1. 对任意的实数 x1 ＜ x2 ，
三. 利用分布函数计算概率 1. 对任意的实数 x1 ＜ x2 ， P { x1 ＜ X ≤ x2 } = F ( x2 ) – F ( x1 ) ； P { X ＞ x } = 1 – F (x) ； Remark 这两个公式实际上来自于概率的减法公式以及对立事件的概率公式。

练习2.3.3 分析下面的分布函数 0 ， x ＜ 0 ， F ( x ) = x ，0 ≤ x ＜ 1 ， 1 ， x ≥ 1 。练习2.3.4 讨论如下积分表示的分布函数

例2.3.5 向区间 [ 0，a ] 任意投掷一个点，以 X 表示
中的概率与小区间长度成正比。 (1) 计算 X 的分布函数， (2) 计算 P { X ≤ a/2 } ， (3) 计算P { a/4 ＜X ≤ a/3 }，(4) 计算 P { X ＞ a/5 } 。解. 首先需要找出 X 的取值范围， 0 ＜ X ＜ a 。因此 X 的分布函数必然有如下形式： 0 ， x ＜ 0 ， F (x) = ？，0 ≤ x ＜ a ， 1 ， x ≥ a 。

不妨取一个小区间为 [ 0，x ]，其中 0 ＜ x ＜ a ；
因此 P { 0 ＜X ≤ x } = k x ，这里 k 是某个待定常数。取 x = a ，所以推导出 k = 1/a ，得出分布函数： 0 ， x ＜ 0 ， F (x) = x/a ，0 ≤ x ＜ a ， 1 ， x ≥ b 。根据分布函数的性质， P { X ≤ a/2 } = F (a/2 ) = 1/2 ； P { a/4 ＜X ≤ a/3 } = F (a/3 ) – F (a/4 ) = 1/12 ； P { X ＞ a/5 } = 1 – F (a/5 ) = 4/5 。 □

习题 2.3 1. 教材 71 页第题； 2. 教材 71 页第题 .

则称 X 是连续随机变量，p (x) 是 X 的概率密度函数
第四节连续随机变量及概率密度一. 连续随机变量的定义所有可能的取值是连续区间的随机变量 1. 概率密度函数( probability density function：p.d.f ) 定义如果存在一个非负函数 p (x)，使得对任意实数 x，X 的分布函数 F (x) 能够表示成积分形式：则称 X 是连续随机变量，p (x) 是 X 的概率密度函数

例讨论如下的三个分布函数 0 ， x ＜ 0 ， F1 (x) = x/b ，0 ≤ x ＜ b ， 1 ， x ≥ b 。 1/b ，0 ＜ x ＜ b 0 , 其它 p1 (x) = 0 ， x ≤ 0 1 – e – x , x ＞ 0 e – x , x ＞ 0 0 , 其它 F2 (x) = p2 (x) = □

概率密度函数的意义 (1) 概率密度函数的作用类似于离散随机变量的分布律。离散随机变量的分布函数是对分布律 “求和”，得到的是一个阶梯形跳跃的间断函数；连续随机变量分布函数是对密度函数 “积分”，得到的是一个连续的函数。 (2) 连续随机变量只能在密度函数不等于 0 的区间上取值。 (3) 分布函数、分布律、概率密度函数，都是对随机变量的随机性质的完整刻划。

(4) 密度函数是分布函数的一阶导数，分布函数是密度函数的一个特殊的原函数。 F (x) = –x∞ p(t) dt  p(x) =  F (x) / x 这个性质用来计算随机变量函数的分布问题 (5) 连续随机变量在任何一个常数取值的概率是 0，即对每一个常数 c ，P { X = c } = 0 。但是 (X = c) 并不一定是一个不可能事件。思考1 离散随机变量是否也存在这种情况？

也是任何一个函数成为概率密度函数的充分必要条件
2. 概率密度函数的主要性质 o x p(x) 1 y (1) p (x) ≥ 0 ；也是任何一个函数成为概率密度函数的充分必要条件比较，离散随机变量分布律的两个性质： pk ≥ 0 ; ∑k ≥ 1 pk = 1

3. 利用密度函数计算连续随机变量的有关概率对任意的 x1 ＜ x2 ，有： P { x1 ＜X ≤ x2 }
3. 利用密度函数计算连续随机变量的有关概率对任意的 x1 ＜ x2 ，有： P { x1 ＜X ≤ x2 } = F (x2) – F (x1) = o x p(x) y x1 x2

例2.4.2 确定常数 a 使得 p(x) 是一个密度函数。
a x ， 0 ＜ x ＜ 1 ， p (x) = – x ，1 ≤ x ＜ 2 ， 0 ，其它解. 分析：要使 p (x) 成为一个密度函数，必须而且只须满足两个条件，非负、积分为 1 。因此首先有 a ≥ 0 ；其次，计算分段积分 a a = 0 + — + — + 0 = ——— ，因此 a = 1 。

o x F (x) 1 0.5 2 o x p (x) 1 □

二. 常见的连续随机变量 (一) . 均匀分布 X ~ U (a,b) 1 . 概率密度函数定义成： 1 b – a
二. 常见的连续随机变量 (一) . 均匀分布 X ~ U (a,b) 概率密度函数定义成： b – a —— ， a ＜ x ＜ b p (x) = 0 ，其它则称 X 服从区间 (a,b) 上的均匀分布

o a b x p (x) 1 b – a —— o a b x F (x) 1 均匀分布的分布函数 0 ， x ＜ a ， F (x) = —— ，a ≤ x ＜ b ， 1 ， x ≥ b 。 x – a b – a

3. 均匀分布中 “均匀” 的含义均匀分布随机变量落在定义域里一个小区间中的概率只与长度有关，与这个小区间位置没有关系。即， X ~ U (a,b) 时，对(a,b) 区间中任意一个长度为 d 的小区间 (c,c + d ) ，都有： P { c ＜X ≤ c + d }

均匀分布的背景材料均匀分布在随机模拟 ( Monte Carlo 方法) 理论中有重要的应用。 (0,1) 区间上的均匀分布 U (0,1) 在概率论的理论研究中具有特殊的意义。假设连续随机变量 X 有分布函数 F (x) ，则随机变量 F (X) ~ U (0,1) ；反之，如果随机变量 u ~ U (0,1) ，则随机变量 F －1(u) 的分布函数就是 F (x) 。

( 二 ). 指数分布概率密度函数定义成： 1  — e – x/ ， x ＞ 0 p (x) = 0 ，其它其中常数  ＞ 0 则称 X 服从参数为  的指数分布 Remark 有些教材把参数为  的指数分布定义为： p (x) =  e –  x ，x ＞ 0 。

o p (x) 1  — x o F (x) x 2 . 指数分布的分布函数 0 ， x ≤ 0 1 – e – x/ , x ＞ 0 F (x) = 对于指数分布有：P { X ＞ x } = e – x/ , x ＞ 0

指数分布的背景材料指数分布是一种特殊的 Gamma 分布。实际问题中常用来作为各种 “寿命” 的近似分布，例如：电子元件的寿命，动物的寿命，通讯问题中的通讯时间，随机服务系统中的服务时间以及复杂系统中接连两次故障的间隔等等。

补充指数分布的“无记忆性” 对任意的正数 s ＞ 0 ，t ＞ 0 ，都有 P { X ＞s + t | X ＞ s } = P { X ＞ t } 比较，几何分布的 “无记忆性” ： P { X = k } = P { X = m + k | X ＞m } 所有离散分布里只有几何分布具有 “无记忆性” 所有连续分布里只有指数分布才具有“无记忆性” 它们实际上都是某种 “等待分布” 。

例2.4.3 假设乘客在公交车站等车的时间 X ( 分钟) 服从参数为 5 的指数分布，密度函数是：
p (x) = e – 0.2 x ， x ＞ 0 某人每天上班时如果等待的时间超过 10 分钟，他就决定打车。求他在一个月 ( 30 天) 里至少有 3 天是坐出租车上班的概率。解. 分析：首先求出每次等车时间超过 10 分钟的概率 p ，那么在 30 天里坐公交还是打车，相当于一个 30 重 Bernoulli 试验。因此坐出租车上班的次数 Y ~ B(30,p)，而概率 P {Y ≥3 } = ∑k3=03 [C30k pk ( 1 – p)30 – k ]

根据指数分布的分布函数，这个人每次等车时间超过 10 分钟的概率是： p = P { X ＞10 } = 1 – F (10) = 1 – [ 1 – e – 10 / 5 ] = e – 2 ; 每个月等车超过10 分钟的次数 Y ~ B(30,e – 2) ；他至少有三天坐出租车上班的概率就是： P {Y ≥3 } = ∑k3=03 [C30k pk ( 1 – p)30 – k ] = 1 – ∑k=02 [C30k pk ( 1 – p)30 – k ] ≈ □

( 三 ) 正态分布 X ~ N ( , 2 ) 1. 如果连续随机变量 X 具有密度函数：其中 – ∞ ＜  ＜ + ∞ ，  ＞ 0 是常数，则称 X 服从参数为  , 的正态分布 { 又称高斯 ( Gauss ) 分布 } 。

正态分布的背景材料正态分布是概率论中最重要的分布。自然界大量的随机现象近似服从正态，如：测量误差，生物特征数据，农作物的产量，工业产品的质量指标，气象数据等等；一般的，如果某个数量指标受到大量的随机因素的影响，每一个因素所起的作用又很小，则这个数量指标就近似服从正态分布。概率论中的很多重要分布都与正态分布有关。

o  x p (x) o  x F (x) 0.5 2. 正态分布的分布函数

3. 正态分布密度函数的重要性质 (1) 密度函数关于 x =  对称； (2) 密度函数在 x =  处达到最大值； o  x p (x) 两头小，中间大大多数现象的正常状态，即，极端的总是少数。

(3)  是位置参数， 是形状参数 o  x p (x) 即，如果固定  而改变 ，密度函数位置改变，沿 ox 轴平移，但是形状不变；反之，如果固定  而改变  ，密度函数的位置不改变，但形状将随  的增加而变平坦，随  的减小而变陡峭，说明对于同样长度的区间，当参数  越大时，X 落在这个区间里的概率将越小，而当参数  越小时，X 落在这个区间里的概率将越大。

4. 标准正态分布 X ~ N ( 0 ,1 ) 参数  = 0 ， = 1 的正态分布 (1) 标准正态分布的密度函数 (2) 标准正态分布的分布函数

(3) 标准正态分布函数的主要性质  (x)  (– x) 1 –  (x) – x o x  (0) = 1/2 ;  (– x) = 1 –  (x) 练习2.4.4 如果 X ~ N (0,1)，计算P { – 2 ＜ X ≤ 1.5 }

一般正态分布到标准正态分布的转化定理如果 X ~ N ( , 2 ) ，则有： Y = ——— ~ N ( 0 ,1 ) X –   简单证明，对任意实数 y，Y 的分布函数： P {Y ≤ y } = P { X ≤  +  y }

一般正态分布概率的计算如果 X ~ N ( , 2 ) ，那么它的分布函数可以转化成： F (x) =  (——— ) 并且有， x –   x2 –  x1 –    P { x1 ＜ x ≤ x2 } =  (——— ) –  (——— ) 练习4.2.5 如果 X ~ N (3,25) ，则 P { 1 ＜X ≤ 11.2 } = ？

6. 正态分布的 “3” 原则对于任意参数的正态分布 N ( , 2 ) ，则有， P { | X –  | ≤  } = 2 (1) – 1 = ， P { | X –  | ≤ 2 } = 2 (2) – 1 = ， P { | X –  | ≤ 3 } = 2 (3) – 1 = 。思考2 下面的两个说法是否合理？ (1) 某城市成年男子身高近似服从 N (170 ,36 ) ，(2) 期末考试概率成绩近似服从 N (75 ,64 ) 。

例2.4.6 一般可以认为各种考试成绩服从正态分布。
假定在一次公务员资格考试中，只能通过考试人数的 5%，而考生的成绩 X 近似服从 N (60 ,100) ，问至少要多少分才可能通过这次资格考试？解. 分析，假定通过考试的成绩至少要为 d 分，即必须有 P { X ≥ d } ≤  P { X ≤ d } ≥ 0.95 。根据定理 2.4.1， ——— ~ N (0,1) X – 60 10

因此 0.95 ≤P { X ≤ d } =  (——— ) d – 60 10 查正态分布表，有，  (1.64) = ， (1.65) = ； d – 60 10 所以 ——— ≥1.65，即 d ≥ 76.5，至少要 76.5 分才可能通过资格考试。 □ 思考3 假定某城市个人月收入( RMB，元) 近似服从正态 N ( 1000 ,2002 ) ，以 60% 的比例划分中等收入阶层，问相应的上、下限应该是多少？

三.  分位点对于任意随机变量 X ，给定一个数 0 ＜ ＜1，如果存在一个实数 u 使得： P { X ＞u } =  ，
三.  分位点对于任意随机变量 X ，给定一个数 0 ＜ ＜1，如果存在一个实数 u 使得： P { X ＞u } =  ，则称这个实数 u 是随机变量 X 的上 分位点。标准正态分布的上 分位点一般用符号 z 来表示 z0.05 = , z0.025 = , z = 。  (x)  o z x

习题 2.4 1. 教材 71 页第 17 题； 2. 教材 72 页第 20 题； 3. 教材 72 页第 22 题；
习题 2.4 1. 教材 71 页第题； 2. 教材 72 页第题； 3. 教材 72 页第题； 4. 教材 72 页第题； 5. 教材 73 页第题 .

第五节随机变量函数的概率分布 X 是分布已知的随机变量，g ( · ) 是一个已知的连续函数，如何求随机变量 Y =g(X ) 的分布？
第五节随机变量函数的概率分布 X 是分布已知的随机变量，g ( · ) 是一个已知的连续函数，如何求随机变量 Y =g(X ) 的分布？比较常见的一些函数 y = g(x) 的形式是线性函数 y = a + bx、幂函数 y = xk (特别 k = 2 )、指数函数 y = e x、对数函数 y = ln x 等等；概率论中的很多重要的分布都是通过一些简单的分布变换得出来的。

一. 离散随机变量函数的概率分布如果离散随机变量 X 具有分布律： P { X = xk } = pk , k ≥ 1 ；
一. 离散随机变量函数的概率分布如果离散随机变量 X 具有分布律： P { X = xk } = pk , k ≥ 1 ；则 Y = g(X) 也是一个离散随机变量，相应分布律是： P { Y = g(xk ) } = pk , k ≥ 1 。需要把可能重合的一些 g (xk ) 的概率相加思考1 X ~ B (1,p) ，则 Y = X2 服从什么分布？

例已知随机变量 X 具有如下的分布律， X – pk 计算 Y = (X – 1)2 的概率分布。解 (X – 1) pk 整理后立刻得到 Y 的分布律， Y pk □

例 (报童问题) 假定报童有 5 份报纸，卖出的数量 X 分布律如下 k pk 他每卖掉一份报纸将获得报酬 1 元，没有卖出而剩下的每份赔偿 0.5 元。计算最终所得的分布。解. 以 Y 记报童最终的所得，因此有 Y = 1×X – 0.5×( 5 – X) = 1.5 X – 2.5

X 的分布律 k pk Y = 1.5 X – 2.5 的分布律 k – – pk □

二. 连续随机变量函数的概率分布积分号下求导数的公式  y  [ h2(y) ]  y  [ h1(y) ]  y
二. 连续随机变量函数的概率分布积分号下求导数的公式  y  [ h2(y) ]  y  [ h1(y) ]  y = p [ h2(y) ] ———— – p [ h1(y) ] ———— 计算出 Y = g (X) 的分布函数 FY (y) 的具体的表达式，或者是把 FY (y) 写成一个积分的形式，再对 y 求一阶导数，将得到 Y = g (X) 的密度函数。

“分布函数方法”求随机变量函数的分布第一步根据 y = g (x)、c ＜ x ＜ d 求解出Y 的取值范围( 也就是 Y 的密度函数的定义域 )；第二步把随机事件 (Y ≤ y) 转化成一个或若干随机事件 { h1 (y) ＜ X ≤ h2 (y) } 的和事件。这些随机事件必须要互不相容第三步利用积分号下求导公式得到 Y 的密度函数

正态分布的线性变换仍然服从正态分布如果 X ~ N (, 2 ) ，常数 b ≠ 0 ，则有 Y = a + bX ~ N ( a + b , b2 2 ) 一般正态分布与标准正态分布的相互转化 (1) 如果 X ~ N (, 2 ) ，  Y = ——— ~ N (0,1) ； (2) 如果 X ~ N ( 0,1 ) ，  Y =  +  X ~ N (, 2 ) X –  

练习2.5.3 X ~ U (0,1) ，那么 Y = 1 – X 服从什么分布？一般地，均匀分布的线性变换是否仍是均匀分布？随机变量平方的密度函数公式如果随机变量 X 具有密度函数 pX (x) ，则Y = X2 的密度函数具有如下形式： N2(0,1)的密度

习题 2.5 1. 教材 73 页第题； 2. 教材 73 页第题； 3. 教材 73 页第题。

第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度

Similar presentations

Presentation on theme: "第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度"— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第二章 随机变量及其分布 第一节 随机变量 第二节 离散随机变量及分布律 第三节 随机变量的分布函数 第四节 连续随机变量及概率密度

Similar presentations

Presentation on theme: "第二章 随机变量及其分布 第一节 随机变量 第二节 离散随机变量及分布律 第三节 随机变量的分布函数 第四节 连续随机变量及概率密度"— Presentation transcript:

Similar presentations

About project

反馈

第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度

Presentation on theme: "第二章随机变量及其分布第一节随机变量第二节离散随机变量及分布律第三节随机变量的分布函数第四节连续随机变量及概率密度"— Presentation transcript: