1 概率论与数理统计第 9 讲 本幻灯片可在如下网站下载: www. 应用数学.cn
2 三. 独立性
3 多元随机变量的分布的分析是很复杂的,因 此经常希望能够简化。常用的办法就是争取 让这多元随机变量的每一个都来自于相互独 立的试验。因此需要精心设计试验来做到这 一点。
4 定义 3.3 假设多元随机变量 X 1,X 2,…,X n 来自于 n 个相互独立的试验,导致对于任给的 n 个可测 的实数集合 S 1,S 2,…,S n , 事件 {X 1 S 1 },{X 2 S 2 },…,{X n S n } 相互独立,则称 X 1,X 2,…,X n 相互独立。
5 由此定义不难推出,当 X 1,X 2,…,X n 相互独立时, 它们的联合分布函数等于每个随机变量的边 缘分布函数的乘积,它们的联合概率密度函 数等于每一个随机变量的边缘概率密度函数 的乘积,即有 下面进一步分析两个随机变量 X,Y 的相互独立 性的一些结果。
6 当随机变量 X,Y 相互独立时,当然有 f(x,y)=f X (x)f Y (y)(3.23) 因此如果给定了 f(x,y) 要判定 X,Y 的独立性,可 以用上式判定,即先计算出边缘概率密度再 看上式是否成立。但是计算边缘概率密度需 要积分,有的时候很麻烦。注意到上式中二 元函数 f(x,y) 表示为两个一元函数的乘积,因 此可以用这种办法来判定随机变量的独立性。
7 定义 3.4 任何二元函数 f(x,y) 如果能够表示为关 于 x 和关于 y 的两个一元函数 g(x),h(y) 的乘积, f(x,y)=g(x)h(y), 就称 f(x,y) 为可分离变量的。 定理 3.1 随机变量 X,Y 相互独立的充分必要条 件是它们的联合概率密度 f(x,y) 为可分离变量 的,即存在函数 g(x),h(y) 使得 f(x,y)=g(x)h(y) 。
8 f(x,y)=f X (x)f Y (y)(3.23) 证充分性由式 (3.23) 可知,只需要证必要性。 假设 f(x,y)=g(x)h(y) ,计算它的边缘概率密度 如下: 因此
9 但是有的时候证明 X,Y 不独立倒是困难的事情, 例如怎样证明一个普通的二元函数例如 x+y 是 不可分离变量的呢?下面给出一个二元函数 的正四点行列式的概念。
10 定义 3.5 任给四个实数 x 1,x 2,y 1,y 2 ,称四对坐标 值 (x 1,y 1 ), (x 1,y 2 ), (x 2,y 1 ), (x 2, y 2 ) 为 xOy 平面上的 一组正四点,二元函数 f(x,y) 在这四个点上的 函数值构成一个二元行列式 称为 f(x,y) 的一个正四点行列式。
11 定理 3.2 随机变量 X,Y 相互独立的充分必要条 件是它们的概率密度函数 f(x,y) 的任何正四点 行列式都是 0 。
12 f(x,y)=f X (x)f Y (y)(3.23) 证 充分性。假设 X,Y 相互独立,所以 (3.23) 式 成立,因此任何正四点行列式的值为
13 f(x,y)=f X (x)f Y (y)(3.23) 必要性。假设 f(x,y) 的任何正四点行列式都是 0 , 再选取一点 x 0,y 0 使 f(x 0,y 0 )>0, 则对于 x 0,y 0,x,y 这 四个数有 整理得
14 则上式右端的两个方括号分别是 x 和 y 的一元 函数,证毕。
15 因此可以严格证明函数 x+y 是不可分离变量的, 这是因为,只要 x 1 x 2 且 y 1 y 2 就有
16 因此知道例 3.1 中的随机变量 X,Y 不相互独立。 例 3.1 假设连续型随机变量 (X,Y) 的概率密度函 数为
17 有一些概率密度函数具有这样的性质,就是 其中有一个局部的区域,有一条连续曲线将 密度为非 0 值的区域和密度为 0 值的区域分开, 称这样的曲线为 0 与非 0 的分界线。
18 定理 3.3 随机变量 (X,Y) 的概率密度函数 f(x,y) 如果在某一局部区域的 0 与非 0 的分界线既不 和 x 轴平行也不和 y 轴平行,则 X,Y 不相互独立。
19 证 将此局部区域放大,则必导致一小块区域 中分界线近似为直线,且此直线不与 x 轴和 y 轴平行。如图 3 ‑ 3 所示,概率密度函数假设在 阴影区不为 0 ,则很轻易地能够找到一个如图 中所示的矩形,其中有三个点在非 0 区一个点 在 0 区,其对应的正四点行列式只有一个数为 0 其他 3 个数不为 0 ,则行列式的值必不为 0 , 所以 X,Y 不相互独立。 图 3-3
20 例 3.3 随机变量 X,Y 的概率密度 f(x,y) 在满足 x 2 +y 2 <1 的范围内不为 0 ,其他区域全为 0 ,试 判定 X,Y 的独立性。 解 因为存在 0 与非 0 区域的边界是圆这样的曲 线,它既不和 x 轴平行也不和 y 轴平行,根据 定理 3.3 , X,Y 不相互独立。
21 注意在将定理 3.2 用到离散型随机变量的概率 密度时,如果正四点行列式的四个坐标上有 冲击,则只是将冲击值放入行列式的相应位 置再进行判定。
22 假设离散型随机变量 (X,Y) 的概率函数为 p ij =P{X=x i, Y=y j }, (i=1,2,…,m, j=1,2,…,n), 将 p ij 写成线性代数课程中要求的 n 行 m 列的矩阵: 称它为分布率矩阵。则当 X 与 Y 相互独立时, 有 p ij =p i p j (3.26)
23 p ij =p i p j (3.26) 由线性代数矩阵相乘的知识不难证明这时分 布率矩阵是由边缘分布率的两个向量相乘得 到,这就导致了如下定理。
24 定理 3.4 离散型随机变量 X,Y 相互独立的充分 必要条件是它们的分布率矩阵的秩为 1 。或者 等价地,它们的分布率矩阵的各行之间或者 各列之间成比例。
25 例 3.4 设离散型随机变量 X,Y 的分布率如表 3 ‑ 5 所示,试判定它们的独立性。 解 从表中看出,各行的概率值成比例,第 2 行的概率和第 1 行的相等,第 3 行是第一行的 2 倍,所以 X,Y 相互独立。 X Y
26
27
随机变量函数的分布
29 一. 二元随机变量的函数
30 现在讨论随机变量 Z 是二元随机变量 (X,Y) 的 函数 Z=g(X,Y) 的情况,其中 z=g(x,y) 是一个二 元的连续函数,且没有区域取常数值,即我 们假设 X,Y,Z 都将是连续型随机变量。
31 对于二元函数 z=g(x,y) ,可以固定住 y 为一个 常数,下面记 y=y c 来表示它被固定为一个常 数,是为的帮助读者思考,整个推导过程也 完全可以不写 y c 而直接写 y 也行。因此固定住 y=y c , z=g(x,y c ) 就是一个一元函数,这个一元 函数如果是单调函数,存在着反函数 x=h(z,y c ) , 这被称之为局部反函数,且假设这局部反函 数针对 z 的偏导函数存在,记为 h z (z,y c ) 。
32
33
34 现在固定住 Y=y c 条件下对 X 作试验,这时 X 是 一个条件随机变量,它的概率密度就是条件 概率密度 f X|Y (x|y c ), 这时 Z=g(X,y c ) 成为 X 的一元 单调函数,也是条件随机变量,其条件概率 密度为 f Z|Y (z|y c ) ,因此根据上一章的有关随机 变量的单调函数的概率密度的公式可得 f Z|Y (z|y c )=|h z (z,y c )|f X|Y [h(z,y c )|y c ] (3.27) 在这里为简便起见我们假设 X,Y,Z 都是在整个 实数轴上取值,而对于在某些区间取值的情 况由读者自己遇到这种情况时再做相应确定。
35 f(x,y c )=f Y (y c )f X|Y (x|y c ) ( f Y (y c )>0)(3.11) f Z|Y (z|y c )=|h z (z,y c )|f X|Y [h(z,y c )|y c ] (3.27) 下面沿用前面的记号仍然令 (X,Y) 的联合概率 密度为 f(x,y) ,即 f 不带任何下标就表示 (X,Y) 的 联合概率密度,但是 (Z,Y) 的联合概率密度记 为 f Z,Y (z,y) ,且根据乘法公式 (3.11) 有 f Z,Y (z,y)=f Y (y)f Z|Y (z|y)= =f Y (y)|h z (z,y)|f X|Y [h(z,y)|y] (3.28) 但是根据乘法公式又有 f Y (y)f X|Y [h(z,y)|y]=f[h(z,y),y] 将它代入到式 (3.28) 得
36 f Z,Y (z,y)=f Y (y)f Z|Y (z|y)= =f Y (y)|h z (z,y)|f X|Y [h(z,y)|y] (3.28) 但是根据乘法公式又有 f Y (y)f X|Y [h(z,y)|y]=f[h(z,y),y] 将它代入到式 (3.28) 得 f Z,Y (z,y)=|h z (z,y)|f[h(z,y),y](3.29) 这样我们就得到了 (Z,Y) 的联合概率密度。则 再按下式我们就可以得到 Z 的概率密度,也就 是 (Z,Y) 的关于 Z 的边缘概率密度为
37 f Z,Y (z,y)=|h z (z,y)|f[h(z,y),y](3.29) 整个计算的要点就是首先求出 g(x,y) 在固定住 y 条件 下的局部反函数 h(z,y) 及它对 z 的偏导数 h z (z,y) 然后 代入到式 (3.30) 求出 Z 的概率密度函数。 当然,如果固定住 y=y c 后 g(x,y c ) 并不是单调函数的 情况,可以采用上一章讲到的条件切割的办法来进 行分析。对于 X,Y,Z 不是在整个实数轴取值的情况 对上面的推导也可以做相应的修改。
38 f Z,Y (z,y)=|h z (z,y)|f[h(z,y),y](3.29) 上面的分析是固定住第 2 个变量 y=y c 进行的, 当然也可以先固定住 x=x c 为常数进行分析, 也能够得到对应的结论。
39 例 3.5 设 (X,Y) 为二元连续型随机变量,其概率 密度为 f(x,y) , Z = X+Y ,求 Z 的概率密度函数 f Z (z) 。 解 Z=g(X,Y)=X+Y, 这里 z=g(x,y)=x+y ,在固定 住 y 情况下的局部反函数为 x=h(z,y)=z−y , h z (z,y)=1 ,代入到式 (3.30) 得:
40 而两个随机变量的和的运算是在实际应用中 最经常遇到的情况,尤其是当 X,Y 相互独立时, f(x,y)=f X (x)f Y (y), 代入到式 (3.31) 得 Z = X+Y 的概 率密度为:
41 由两个函数 f X 和 f Y 根据式 (3.32) 算出一个新的 函数 f Z (z) 的运算在数学上称之为卷积,真正 具体计算是相当复杂的,为了简化卷积的运 算甚至专门发展了一个数学分支叫积分变换。
42 例 3.6 设随机变量 X 与 Y 相互独立, X 和 Y 的概 率密度函数为 f X (x)=e x in(x;0,+ ), f Y (y)= (y a), 即 Y 服从在实数 a 处的单点分布,试求 Z=X+Y 的分布。 解 将题中的 f X (x) 和 f Y (y) 代入到式 (3.32) 得:
43 当然,一个单点分布的随机变量其实就是一 个常数,所以这个例子简直就是废话,因为 一个随机变量加上一个常数的分布当然就是 原分布平移了一下。这里也不过就是验证了 式 (3.32) 的正确性。
44 二. 线性函数
45 设随机变量 (X,Y) 的概率密度函数为 f(x,y) ,而 随机变量 Z=aX+b 是关于 X 的线性函数,其中 a 0, 看上去是有关 X 的一元随机变量的函数, 但是也可以认为它是 (X,Y) 的二元函数,只不 过 Z 不随 Y 的变化而变化罢了。而且,经常是 希望知道二元随机变量 (Z,Y) 的联合分布,即 它们的联合概率密度函数 f Z,Y (z,y) 与原随机变 量 (X,Y) 的概率密度函数 f(x,y) 的关系。
46 f Z,Y (z,y)=|h z (z,y)|f[h(z,y),y](3.29) 利用上一小节的结果, z=g(x,y)=ax+b, 给定 y=y c 条件下它的反函数 x=h(z,y c )=(z b)/a, 此反 函数关于 z 的偏导为 h z (z,y c )=1/a, 代入到式 (3.29) 中得 这就是对 X 的线性函数导致的概率密度的变 化。
47 同理,可以知道如果有 W=cY+d 是 Y 的线性函 数, c 0, 则按同样的办法可以推导出 (X,W) 的 概率密度 f X,W (x,w) 为 综上所述,可得如下定理。
48 定理 3.5 设随机变量 (X,Y) 的概率密度函数为 f(x,y) ,而随机变量 Z 和 W 分别是 X 和 Y 的线性 函数, Z=aX+b, W=cY+d (a 0, c 0) ,则 (Z,W) 的 联合概率密度 f Z,W (z,w) 为
49 例 3.7 设随机变量 (X,Y) 的概率密度函数为 且已知 求 (Z,W) 的联合概率密度函数。
50 解 由题意可知 X=2Z+1,Y=W 2, 代入式 (3.35) 得
51 三. 线性组合和线性变换
52 现在假设随机变量 (X,Y) 的概率密度函数为 f(x,y), Z=g(X,Y)=aX+bY, a 0, 这时称 Z 为 X,Y 的 一个线性组合,则 z=g(x,y)=ax+by, 固定 y 后关 于 x 的局部反函数为 x=h(x,y)=(z by)/a, 其对 z 的 偏导为 h z (x,y)=1/a, 代入到式 (3.29) ,得 (Z,Y) 的 概率密度函数为
53 再假设随机变量 W=cX+dY, 将 X=(Z bY)/a 代入, 得 假设 ad bc 0, 则 W 关于 Y 的局部反函数 u(z,w) 及关于 w 的偏导为
54 则根据式 (3.28) 可得 再将式 (3.36) 代入到上式得
55 当随机变量 (X,Y) 与随机变量 (Z,W) 有如下关系: 时,称 (Z,W) 是 (X,Y) 的一个线性变换,而此线 性变换如果满足 ad bc 0, 则 (X,Y) 也可以表示 为 (Z,W) 的线性变换,称这样的线性变换为可 逆的线性变换。
56 在式 (3.40) 的推导开始时假设了 a 0, 而如果 a=0, 且仍然有 ad-bc 0, 则必有 c 0, 因此从 W=cX+dY 开始讨论最后仍然能够推导出式 (3.40) 。因此我们已经证明了如下定理。
57 定理 3.6 假设随机变量 (X,Y) 的概率密度函数为 f(x,y), 随机变量 (Z,W) 是 (X,Y) 的一个线性变换, 其中 ad-bc 0, 则 (Z,W) 的概率密度函数 f Z,W (z,w) 满足下式:
58 观察式 (3.42), 式中有关 X,Y 的概率密度 f(x,y) 中,将 x 和 y 分别取代为 x,y 未知 z,w 已知的线性方程组 在系数行列式 时的唯一解 并在函 数前面乘上系数行列式的倒数,就得到了 Z,W 的概 率密度函数 如果能够使用线性代数的记号,可以进一步得到如 下的定理。
59 定理 3.7 假设随机向量 X=(X 1,X 2,…,X n ) T, Y=(Y 1,Y 2,…,Y n ) T, 有线性关系 Y=AX, 其中 A 为 方阵,且有 det(A) 0, X 的概率密度为 f X (x), 其 中自变量 x=(x 1,x 2,…,x n ) T 是 n 维实数向量,则 Y 的概率密度为 其中 y=(y 1,y 2,…,y n ) T 是 n 维实数向量。
60 例 3.8 已知 (X,Y) 的概率密度函数为 令 Z=X, W=Y X, 求 (Z,W) 的概率密度函数。 解 由题意知 X=Z, Y=X+W=Z+W, 代入到式 (3.42) 得
61 作业: 第 91 页开始 第 6,7,8,10,11,12 题