第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全

Slides:



Advertisements
Similar presentations
1 §2.2 离 散 型 随 机 变 量 §2.1 随 机 变 量 的 概 念 §2.3 超几何分布 · 二项分布 · 泊松分布 1. “0-1” 分布 ( 两点分布 ) 3. 二项分布 4. Poisson 分布 2. 超几何分布 n →∞ , N→∞ , (x = 0, 1, 2, , n) (x.
Advertisements

随机变量及其概率分布 第二章 离散型随机变量及其分布律 正态分布 连续型随机变量及其分布律 随机变量函数的分布.
目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第二节 离散型随机变量 及其分布律 一、离散型随机变量的分布律 二、常见离散型随机变量的概率分布 三、小结.
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第二节 微积分基本定理 一、积分上限函数及其导数 二、积分上限函数求导法则 三、微积分基本公式.
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
定积分性质和微积分学基本定理 一、 定积分性质 二、 变上限积分函数 三、 定积分基本公式.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第四章 一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
二、随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第四章 第四节 函数图形的描绘 一、渐近线 二、图形描绘的步骤 三 、作图举例.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
难点:连续变量函数分布与二维连续变量分布
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
三角 三角 三角 函数 余弦函数的图象和性质.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 电子邮件:qkdong@xidian.edu.cn 本科生必修课:概率论与数理统计 第二章 随机变量及其分布 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全 电子邮件:qkdong@xidian.edu.cn 个人主页:http://web.xidian.edu.cn/qkdong/

第二章 随机变量及其分布 §2.1 随机变量 §2.2 离散型随机变量及其概率分布 §2.3 随机变量的分布函数 §2.4 连续型随机变量及其概率密度 §2.5 随机变量的函数的分布

§2.1 随机变量 对于错综复杂的随机现象,如信道噪声、随机信号、测量误差等实际问题难以简单处理。为了更好的用数学方法来分析随机现象地统计规律性,人们将随机试验的结果与实数对应起来(结果数量化),从而引入随机变量的概念 例1:将一枚硬币抛掷三次,观察正反面出现的情况,并考虑每次试验当中正面出现的次数,样本空间是 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} 以X记三次投掷得到正面H的总数,那么对于样本空间S中的每一个样本点e,X都有一个数与之对应

§2.1 随机变量 例1:将一枚硬币抛掷三次,观察正反面出现的情况,并考虑每次试验当中正面出现的次数,样本空间是 S={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT} 以X记三次投掷得到正面H的总数,那么对于样本空间S中的每一个样本点e,X都有一个数与之对应 X是定义在样本空间上的单值实值函数,定义域是样本空间,值域为{0,1,2,3}.使用函数的符号可将X写成

§2.1 随机变量 例2:随机试验:袋中装有编号分别为1,2,3的3只球,在袋中任取一只,放回,然后再取一只球,记录他们的编号 样本点:是一个编号的数对:(i,j),i,j=1,2,3 样本空间:S={e}={(i,j)|i,j=1,2,3} 现在关心的是两个球的号码之和,记做X,则对于每一个样本点e,X都有一个值与之对应 即从样本空间到实数集合上的一个映射 X:S→R X是一个定义在样本空间S上的单值实值函数, 其定义域是样本空间;值域是实数集合{2,3,4,5,6} 因此X可写成 X=X(e)=X((i,j))=i+j,i,j=1,2,3.

§2.1 随机变量 定义: 设随机试验的样本空间为S={e}。X=X{e}是定义在样本空间S上的实值单值函数。称X=X{e}为随机变量

§2.1 随机变量 关于随机变量需要注意的几个方面 X是一个单值实值函数,定义域是样本空间S,值域是X的所有可能取值RX。 注意随机变量的值域不同于样本空间 (2)如果随机试验结果本身是一个数,则直接令X=X(e)=e,X是一个随机变量 如灯泡的寿命T,某学校学生的体重W,掷骰子的点数等等 随机变量的取值可以是有限的,可列的,或不可列的 (3) 随机变量的取值随试验结果而定,是样本点的函数,因此随机变量X(e)的取值是随机出现的,有一定的概率

§2.1 随机变量 随机事件的描述 例如 当然关心的X取值也可能有多个,用关于X的表达式来表示 例1中X的取值为2,记做{X=2},对应的样本点集合为A={HHT,HTH,THH}这是一个随机事件 当且仅当A发生时有{X=2},我们称概率P(A)为{X=2}的概率,即P{X=2}=P(A)=3/8 当然关心的X取值也可能有多个,用关于X的表达式来表示 如{X1}表示随机事件B={TTT,TTH,THT,HTT} P{ X1}=P(B)=4/8 一般的,若L是一个实数集合,将X在L上取值写成{XL},则{XL}表示事件B={e| X(e)L },此时有P{ XL }=P(B)

§2.2 离散型随机变量及其概率分布 本节学习基于随机变量来描述随机现象的一般问题 随机变量的类别:设F(x)是分布函数

§2.2 离散型随机变量及其概率分布 离散型随机变量的例子: 将一枚硬币抛掷三次,观察出现正面的次数: 某电话交换台一分钟内收到的呼叫次数: 随机变量的全部可能取值仅有4个:0,1,2,3 某电话交换台一分钟内收到的呼叫次数: 可列无限多个(理想状态下) 某城市120急救电话台一昼夜收到的呼叫次数 而灯泡的寿命T所有可能取值充满一个区间,无法按一定次序一一列出,非离散型随机变量

§2.2 离散型随机变量及其概率分布 掌握离散随机变量X的统计规律,只需知道X的两个问题 分布律: (1) X所有可能的取值,我们可以通过随机试验的样本空间S来得到 (2) 每一个可能取值的概率,它们构成分布律的概念 在后面我们会进一步学习X的数字特征等概念 分布律: 设离散型随机变量X的所有可能取值为xk(k=1,2,…),X取各个可能值的概率,即事件{X=xk}的概率为 P{X=xk}=pk,k=1, 2, … 由概率的定义,pk满足如下两个条件: (1) 非负性:pk0; (2) 规范性: =1 则称P{X=xk}=pk,k=1,2,…为离散型随机变量X的分布律

§2.2 离散型随机变量及其概率分布 分布律也可表示为表格的形式 分布律含义:由分布律定义中的条件,概率1以一定的规律分布在各个可能值上 X x1 x2 … xn … pk p1 p2 … pn … 分布律含义:由分布律定义中的条件,概率1以一定的规律分布在各个可能值上 规范性的证明: {X=x1}∪{X=x2}∪…是必然事件,与样本空间相对应,且{X=xk}∩{X=xj}=Φ,k≠j 所以,1=P({X=x1}∪{X=x2}∪…)

§2.2 离散型随机变量及其概率分布 例 1设随机变量 X 的分布律为: P(X=n)=c/4n (n=1,2,…,), 求常数c. 解:由规范性 1= = = (c/4)/(1-1/4) =c/3  c=3

§2.2 离散型随机变量及其概率分布 几种重要的离散型随机变量的分布律 (一)(0-1)分布 设随机变量X只可能取两个值0与1,它的分布律是 P{X=k}=pk(1-p)1-k,k=0,1,0<p<1, 则称X服从(0-1)分布或两点分布,记作 b(1,p) 应用:(0-1)分布是经常遇到的一种分布 一般的对于一个随机试验,如果它的样本空间只包含两个元素,即S={e1,e2},总能在S上定义一个服从(0-1)分布的随机变量描述这个随机试验结果 X=X(e)= 例如:对新生儿的性别进行登记 抛一枚硬币,观察其正面和反面出现的情况

§2.2 离散型随机变量及其概率分布 (二)伯努利试验、二项分布 伯努利试验Bernouli 设试验E只有两个可能结果:A及 ,则称E为伯努利试验。设P(A)=p (0<p<1),则P( )=1-p。将试验E独立地重复地进行n次,则称这一串重复的独立试验为n重伯努利试验 其中,“重复”是指每次试验都有P(A)=p “独立”是指各次试验的结果A互不影响,相互独立 n重伯努利试验应用非常广泛,是研究最多的模型之一 (0-1)分布的模型就是1重伯努利实验 E :抛一枚硬币,观察H和T出现情况,将E独立进行n次,观察H次数 而一些不放回抽样的随机试验则可能不满足这种独立性,也就不是n重伯努利试验。

§2.2 离散型随机变量及其概率分布 伯努利试验的分布律 以X表示n重伯努利试验中事件A发生的次数(比如n次抛币试验中正面出现的频数),求X的分布律,即求 1)X的所有可能取的值为0,1,2,...,n 2)X的分布律,即求对任意的k(0kn),概率P{X=k} 解:P{X=k}即相当于求在n次试验中,有k次试验事件A发生,另外n-k次试验事件A不发生的概率

§2.2 离散型随机变量及其概率分布 首先看一下事件A在某指定k次试验中发生,比如在第i1,i2,...,ik次试验中A发生,而其余n-k次试验中不发生的概率。由于这n次试验是相互独立的,则相应概率为 p•p•...•p•(1-p)•(1-p)•...•(1-p)=pk(1-p)n-k i1 i2 ... ik 这样的指定方式共有 种两两互不相容的方式(两两不同的方式) 因此n次试验中事件A发生k次的概率为 pk(1-p)n-k,令q=1-p有 P{X=k}= pkqn-k,k=0,1,...,n

§2.2 离散型随机变量及其概率分布 分布律的两个条件的验证: P{X=k}= pkqn-k0,k=0,1,2,...,n 而 即非负性和归一性均满足 所以P{X=k}= pkqn-k,k=0,1,...,n即为所求分布 由于pkqn-k恰好是(p+q)n的二项展开式中出现pk的那一项,故称随机变量X服从参数为n,p的二项分布,记为 X~b(n,p),n=1时化为(0-1)分布

§2.2 离散型随机变量及其概率分布 Matlab实验 已知Y~b(20, 0.2)求Y分布率的值,并划出图形 binopdf(10,20,0.2) x=0:1:20; y=binopdf(x,20,0.2) plot(x,y, ‘r.’) Matlab实验 结果: ans = 0.0020 y =0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

§2.2 离散型随机变量及其概率分布 二项分布中的概率最大项: 先求分布律中的极大值点,它应该满足如下不等式组 1)P{X=k}= pkqn-k pk-1qn-k+1=P{X=k-1} 2)P{X=k}= pkqn-k pk+1qn-k-1=P{X=k+1} 由1)得k≤(n+1)p 由2)得k≥(n+1)p-1 联立1)和2) 有(n+1)p-1≤k≤(n+1)p 当(n+1)p为整数时,k=(n+1)p和(n+1)p-1时取得最大值 当(n+1)p为非整数,k=[(n+1)p]时取得最大值 二项分布的一般图示:

§2.2 离散型随机变量及其概率分布 例2:近似二项分布 解: 按规定,某种型号的电子元件的使用寿命超过1500小时的为一级品。已知某一大批产品的一级品率为0.2,现在随机抽取20只,问20只元件中恰有k只为一级品的概率是多少? 解: 本题是不放回抽样问题,由于元件总数很大,而抽查元件数量远远小于元件总数,可以近似当作放回抽样来处理。 A:抽取一只元件是一级品 P(A)=0.2 如果看作放回抽样,每次检查元件是相互独立的,则检查20只元件相当于做20重伯努利试验,以X记20只元件中一级品的只数,那么随机变量X服从二项分布,即X~b(20, 0.2)即有 P{X=k}= 0.2k0.820-k,k=0,1,2,...,20.

§2.2 离散型随机变量及其概率分布 例3 大量试验条件下的小概率事件问题 解: 某人进行射击,设每次击中的命中率为0.02,独立射击400次,试求至少击中两次的概率 解: 将一次射击看成是一次试验,设射击次数为400,则X~b(400, 0.02) X的分布律为P{X=k}= 0.02k0.98400-k,k=0,1,2,...,400. 所求的概率为P{X2}=1-P{X=0}-P{X=1} =1-0.98400-400(0.02)0.98399 =0.9972 结果接近于1 一次射击击中目标是个小概率事件 若400次中击中目标次数竟真的达不到两次,而由于这一事件的概率P{X<2}=0.003是小概率事件,由实际推断原理,有理由怀疑命中率达不到0.02,可能更低 大量独立试验条件下,小概率发生几乎是肯定的,如抽奖问题

§2.2 离散型随机变量及其概率分布 例4 维修工分配问题(用工优化) 解:按方案(1) 不考虑维修时间长短问题 设有80台同类型设备,各台工作独立,发生故障的概率都是0.01,且一台设备的故障仅能由一人处理,考虑两种配备维修工人的方法 (1)由4人维护,每人20台; (2)由3人共同维护80台; 试比较发生故障时不能及时维修的概率大小? 解:按方案(1) 不考虑维修时间长短问题 记X为 “第一人维护的20台中同一时刻发生故障的台数“, 则X~b(20, 0.01) 用事件Ai表示:“第i人维护的20台中发生故障不能及时维修”这一事件 则80台中发生故障不能及时维修的概率为 P(A1∪A2∪A3∪A4) P(A1)=P(X 2)

§2.2 离散型随机变量及其概率分布 按方案(2) 而X~b(20, 0.01),故有 P(X2)= 1-P(X=0)-P(X=1)=1-0.9920-20(0.01)0.9919=0.0169 即有P(A1∪A2∪A3∪A4)0.0169 按方案(2) 记Y为80台中同一时刻发生故障的台数,则Y~b(80, 0.01) 发生故障不能及时维修的概率 P(A)=1-P(Y=0)-P(Y=1)-P(Y=2)-P(Y=3) =1-0.9980- - - =0.0087<<0.0169 方案(2)不能及时维修的概率远远小于方案(1) 因此方案(2)的用工方案更优,而且节省人力

§2.2 离散型随机变量及其概率分布 (三)泊松分布 泊松分布是概率论中比较重要的一种分布,描述一系列在给定时间区间内到达某区域的随机质点数的分布规律,在排队论、路由优化等方面有广泛的应用... 如:到达某十字路口的汽车数、电话交换台接到的要求通话的呼唤数、纺织机上出现的断点数、到达某区域的放射性粒子数、人类的生育胎数、到达某铁路售票处要求售票的顾客数、某一秒种内路由器等待转发的数据包的个数(队列长度) 主要描述那些具有无穷可列个取值的离散型随机变量 这类问题的显著特点是可列个取值的总概率为1,服从泊松分布的数学模型在第十章,在学习随机过程时会接触到,这里直接给出泊松分布的定义形式

§2.2 离散型随机变量及其概率分布 泊松分布: 泊松分布关于分布律的两个条件 设随机变量X的所有可能取值为0,1,2,..., 而取各值的概率为 ,k=0,1,2,... 其中λ>0为常数(也叫泊松强度,具体含义在第四章介绍),则称X服从参数为λ的泊松分布,记为X~π(λ) 泊松分布关于分布律的两个条件 非负性是显然的 规范性: = = 考虑麦克劳林级数展开 所以

§2.2 离散型随机变量及其概率分布 泊松分布的概率最大值问题 与二项分布的求解方法类似,先找极大值点,它应满足如下不等式组 1)P{X=k}= ≥ =P{X=k-1} 2)P{X=k}= ≥ =P{X=k+1} 由1)得k≤λ 由2得k≥λ-1 联立1)和2)有λ-1≤k≤λ 当λ为整数时, k=λ和λ-1时取得最大值 当λ为非整数, k=[λ]时取得最大值 三种分布之间的关系: (1) 0-1分布考察一次试验中两个可能结果的概率 (2) 二项分布是把以上试验独立重复进行n次,考察出现某一个结果的次数的概率,n=1时即是结果0-1分布 (3) 泊松分布考察一段时间内某一事件发生的次数的概率

§2.2 离散型随机变量及其概率分布 泊松定理 (针对稀有事件) (用泊松分布来逼近二项分布的定理) 设λ>0是一个常数,n是任意正整数,设npn=λ,则对于任意固定的非负整数k,有 证 由pn=λ/n,有 = 对任意固定的k,当n趋近于无穷大时,上式第二项极限为1,第三项是自然对数极限为e--λ,最后一项极限为1,所以定理成立。 npn=λ是常数,当n很大时pn必定很小,所以当n很大,pn很小时,可用泊松分布来近似二项分布。 当n≥10, p≤0.1, np≤5时:二项分布≈泊松分布。 当试验次数n很大时,稀有事件A发生的次数可以近似用泊松分布来描述,而=np为n次中A发生的平均次数

§2.2 离散型随机变量及其概率分布 历史上Poisson分布是作为二项分布的一种近似,其前提是二项分布是稀有事件 而二项分布的真正极限分布是正态分布(见中心极限定理) 于1837年由法国数学家S.D.Poisson(1781 ~ 1840年)引入。 近些年来,人们发现该分布在物理学及社会生活中对服务的各种要求等方面有愈来愈多的应用

§2.2 离散型随机变量及其概率分布 (四) 超几何分布,抽样检查,无放回抽样 产品抽样检查中,假定在N件产品中有D件不合格品,即不合格率p=D/N。随机抽n件做检查,发现k件不合格品的概率为超几何分布 通常称这个随机变量X服从超几何分布。这种抽样检查方法等于无放回抽样。 数学上不难证明,N趋近无穷时 P(X=k)=CkDCn-kN-D/CnN 近似为b(n,p) (二项分布) 因此,在实际应用时,当N≥10n时,可用二项分布近似描述不合格品个数 ,当实验次数足够多的时候,不放回抽样可近似为放回抽样,而如果放回抽样则刚好满足二项分布,p=废品率D/N P(X=k)=CkDCn-kN-D/CnN,(k=0,1,… min{n, D})

§2.2 离散型随机变量及其概率分布 Matlab实验 假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布,求 (1) 每小时恰有4次呼叫的概率 (2) 一小时内呼叫不超过5次的概率 (3) 画出分布律图像 Matlab实验 在Matlab中输入以下命令: (1)p1= poisspdf(4,3) (2)p2= poisscdf(5,3) (3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

§2.2 离散型随机变量及其概率分布 Matlab实验

§2.2 离散型随机变量及其概率分布 二项分布与泊松分布的关系 例:X~b(200,0.02),Y 服从参数为4的泊松分布,划出分布率图像 y1=binopdf(x,200,0.02); y2=poisspdf(x,4); plot(x,y1,’r.’,x,y2,’b.’) Matlab实验

§2.2 离散型随机变量及其概率分布 分赌注问题  (problem of rational divilion of stakes)是对创立概率论有重大影响的著名问题。 水平相同的两个赌徒A和B,约定先胜t局的人赢得赌注,在赌博中的某时刻,两赌徒中止赌博,此时A胜r局,B胜s局,应如何合理分配赌注? 这个问题通常称为点数问题,是嗜好赌博的法国学者梅雷(Meray,H. C. R.)于1654年向法国数学家帕斯卡(Pascal ,B.)提出的. 为此帕斯卡和法国数学家费马(Fer-mat,P. de)于1654年7月到10月之间进行了一系列通信讨论.赌注分配问题成为概率论的起源. 当荷兰数学家惠更斯(Huygens,C.)到巴黎时,听说费马和帕斯卡在研究赌注问题,他也进行了研究,并在1657年撰写了《论赌博中的计算》一书,提出数学期望的概念,推动了概率论的发展.1713年,瑞士数学家雅各布·伯努利(Bernoulli , Jakob)的《猜度术》一书的面世,标志着概率论已成为数学的一个重要分支.

§2.2 离散型随机变量及其概率分布 如果以r和s之比来分的话不是很合理。 设A每局取胜的概率为p,分赌注为题可描述为在伯努利试验中,求A出现t-s次赌博失败之前,出现t-r次获胜的概率,记为pA。最终赌注按pA:1-pA来分配 解:A若胜则后面至少要进行t-r次试验,最多要进行(t-r)+(t-s)-1次即可分出结果。 A的概率等于 (组合下标减1是因为第i次一定胜利) 帕斯卡分布、负二项分布

§2.3 随机变量的分布函数 非离散型随机变量X,由于其可能取值不能一个一个的列举而无法用分布律来描述。而且所遇到的非离散型随机变量通常取任一指定的实数值的概率都等于0 实际问题中有很多此类变量:误差ε,元件寿命T等. 对于此类问题,主要研究随机变量取值落在某一个区间的概率,即: P{x1<X≤x2}= P{ X≤x2}-P{X≤x1} 物理意义 问题变为计算P{ X≤x2}及P{ X≤x1},于是引入分布函数的概念。

§2.3 随机变量的分布函数 分布函数定义: 左开右闭区间上的概率表示: 设X是一个随机变量,x是任意实数,函数 F(x)=P{X≤x},-<x< 称为X的分布函数 左开右闭区间上的概率表示: 对于任意实数x1,x2 (x1<x2),有 P{x1<X≤x2}= P{ X≤x2}-P{X≤x1}=F(x2)-F(x1) ∴已知分布函数,就可以计算出x落在任意区间(x1,x2]上的概率 分布函数完整地描述了随机变量的统计规律性。

§2.3 随机变量的分布函数 分布函数的物理意义: 将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在(-∞,x]上的概率。

§2.3 随机变量的分布函数 分布函数具有以下基本性质 1°F(x)是一个不减函数 对任意实数x1,x2 (x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}0 2°0F(x)1且F(-∞)= =0,F(∞)= =1 仅从物理意义上加以说明:当x趋于-∞时,即区间端点沿x轴无限左移,{X<x}逐渐趋于不可能事件,从而其概率趋于0,即有F(-∞)=0;反之,若点x无限右移,则{X<x}趋于必然事件,从而概率趋于1,即有F(∞)=1 3°F(x+0)=F(x) 即F(x)为右连续的 F(x)在点x处的右极限等于点x处的函数值,即F(x)是右连续的

§2.3 随机变量的分布函数 例1:随机变量的分布律用分布函数来表示 设随机变量X的分布律为 X -1 2 3 pk 1/4 1/2 1/4 求X的分布函数,并求P{X≤1/2},P{3/2<X≤5/2},P{2≤X≤3} 解:随机变量落在-1,2,3三个点上的概率为非0,落在其它点上为不可能事件,因此有

§2.3 随机变量的分布函数 P{X≤1/2}=F(1/2)=1/4 P{3/2<X≤5/2}= F(5/2)-F(3/2)=3/4-1/4=1/2 P{2≤X≤3}= F(3)-F(2)+ P{X=2}=1-3/4+1/2=3/4 注意区间左端的等号 1 概率函数与普通的代数函数不同之处在于物理意义不同,前者是随机变量X的取值落在(-∞,x]区间上的概率 2 求分布函数,一定要讨论区间(-∞,∞)上的所有情况 3 F(x)的值即为所有x的X取值中落在xk处的概率pk之和 4 F(x)的图形是一条阶梯形曲线, 在x=-1,2,3处有阶跃点 阶跃值分别为1/4,1/2,1/4 曲线的阶跃点处,上为实心点,下为空心点,体现右连续,小于-1时F(x)=0也应画一个粗实线

§2.3 随机变量的分布函数 分布律用分布函数表示的一般方法: 一般的,设离散型随机变量X的分布律为 P{X=xk}=pk,k=1,2,… F(x)= P{ X≤x}= 即F(x)= 这里和式是对所有满足xkx的k求和的,分布函数在点x=xk(k=1,2,…)处有跳跃,其跳跃值为pk=P{X=xk} 分布函数能表达所有随机变量的概率问题

§2.3 随机变量的分布函数 已知Y~b(20, 0.3)求Y分布函数的值,画出函数图像 在Matlab中输入以下命令: Matlab实验 binocdf(10,20,0.3) x=0:1:20; y=binocdf(x,20,0.3) ezplot('binocdf(t,20,0.3)',[0,20]) Matlab实验 结果: ans = 0.9994 y = 0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

§2.3 随机变量的分布函数 Matlab实验

§2.3 随机变量的分布函数 例2 一般随机变量的分布函数的求解方法 一个靶子是半径2米的圆盘,设击中耙上任一同心圆盘上的点的概率与该同心圆盘的面积成正比,并设射击都能中耙,以X表示弹着点与圆心的距离,试求随机变量X的分布函数F(x)=P{Xx}

§2.3 随机变量的分布函数 解:分段讨论: 1°当x<0时,{Xx}是不可能事件,F(x)=0 2°在圆盘上,0x2,由题意,P{0Xx}=kπx2 当x=2时由于假定每次射击都能中耙, 有P{0X2}=1 ∴1=kπ22 即kπ=1/4代入得F(x)=P{X<0}+P{0Xx} = 0+(1/4)x2=(1/4)x2 3°当x>2时,由题意{Xx}是必然事件,F(x)=1

§2.3 随机变量的分布函数 综上,F(x)是一个分段函数,具体为 它的图形是一条连续曲线 ※注意区间端点的取值 ※注意x是值,X是随机变量

§2.3 随机变量的分布函数 现在对F(x)求导数 (不可导的点的导数设为0) 有 这样有F(x)= 即F(x)是非负函数f(t)在区间(-∞,x]上的积分,f(t)即为概率密度函数,其中X是连续型。

§2.4 连续型随机变量及其概率密度 连续型随机变量及概率密度 定义: 如果对于随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有 F(x)= 则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称概率密度 ※由数学分析的知识,连续型随机 变量的分布函数是连续函数 ※在实际应用中遇到的基本上是 离散和连续型随机变量 几种提法: X的概率分布:是指分布函数 X为连续型时:是指概率密度 X为离散型时:是指分布律

§2.4 连续型随机变量及其概率密度 概率密度函数的性质: 1º 非负性:f(x)0. 由定义可知 2º 规范性: 曲线y=f(x)与Ox轴之间的面积等于1 3º 对任意实数x1,x2 (x1x2),有P{x1<X≤x2}=F(x2)-F(x1) = 概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下曲边梯形的面积 4º 若f(x)在点x处连续,则有F(x)=f(x) 比右连续强,一般的是右连续)

§2.4 连续型随机变量及其概率密度 a) 一维随机变量的概率密度的线密度含义: 由连续性定义,在连续点x处有 f(x)= = 这正好与物理学中的线密度的定义类似:随机点落在单位区间上概率的大小 当∆x充分小时,点x处的曲边梯形可近似为长∆x高f(x)的矩形。 即P{x<X≤x+∆x }≈f(x)∆x,随机变量X落在(x,x+∆x]的概率近似等于f(x)∆x,忽略了高阶无穷小。

§2.4 连续型随机变量及其概率密度 b) 对于连续型随机变量,单点概率为0 即若X为连续型随机变量,对任意的实数a,有P{X=a }=0 证:显然有包含关系{X=a}{a-∆x<X≤a } ∴0≤P{X=a }≤P{a-∆x<X≤a }=F(a)-F(a-∆x) 而F(x)是连续的(也满足左连续),因为连续型随机变量的分布函数是连续的 ∴当∆x→0时有0P{X=a}≤ 即P{X=a}=0 要注意几点: 1°只有当X为连续型时,才一定有P{X=a}=0,否则不一定 2°尽管P{X=a}=0,但{X=a }不是不可能事件 3°连续型随机变量中区间的端点不影响概率值,即对以下概率不加区分 P{a<X≤b}=P{a≤X≤b}=P{a≤X<b}=P{a<X<b}

§2.4 连续型随机变量及其概率密度 例:由分布函数求概率密度 设 ,求f(x) 解:先判断F(x)在区间端点的连续性(是否有阶跃特性),如果连续则直接对F(x)进行分段求导即可,由于连续型随机变量单点概率为0,不可导的点可直接取右导数即可,也可随意给定

§2.4 连续型随机变量及其概率密度 例1:由概率密度求分布函数和概率 设随机变量X具有概率密度 (1)确定常数k;(2)求F(x);(3)求P{1<X≤7/2 } 解: (1) 由规范性得 1= ,解得k=1/6; (2) 由定义 (3) P{1<X≤7/2 }=F(7/2)-F(1)=41/48 或者用性质(3)在区间(1,7/2]上对f(x)积分

§2.4 连续型随机变量及其概率密度 三种重要的连续型随机变量 (一)均匀分布 概率密度的两个条件显然成立: 设连续型随机变量X具有概率密度 则称x在区间(a,b)上服从均匀分布.记为X~U(a,b)。 例如:电子和量子在一定能级上的运动轨迹 数值计算中,研究四舍五入引起的误差。 概率密度的两个条件显然成立: 非负性成立f(x)0,且规范性: =1

§2.4 连续型随机变量及其概率密度 X的分布函数: F(x)为f(x)的积分图像 均匀分布的含义:代表一种等可能性,即X落在区间(a,b)中任意等长度的子区间内的概率是等可能的,或者说X落在区间(a,b)中的概率只依赖于子区间长度而与子区间位置无关。 证:对任意长度为l的子区间(c,c+l),a≤c<c+l≤b,有 几何概型

§2.4 连续型随机变量及其概率密度 例2: 设电阻值R是一个随机变量,均匀分布在900Ω~1100Ω。求R的概率密度及R落在950Ω~1050Ω的概率。X~U(900,1100) 解:首先由题意均匀分布,得到R的概率密度函数为 ∴P{950<R≤1050}= =0.5

§2.4 连续型随机变量及其概率密度 Matlab实验 均匀分布再MATLAB中的图像 MATLAB为常见自然概率分布提供了下列5类函数 ①概率密度函数(pdf) ②累积分布函数(cdf),即分布函数 ③逆累积分布函数(inv),求随机变量X在概率点处的分布函数反函数值 ④均值与方差计算函数(stat),求给定分布的随机变量X的数学期望E(X)和方差var(X) ⑤随机数生成函数(rnd),模拟生成指定分布的样本数据 (调用格式:x=分布+rnd(分布参数),如x=normrnd(0,1)) Matlab实验

§2.4 连续型随机变量及其概率密度 常见分布的类型名称 Matlab实验 分布类型 MATLAB名称 正态分布 norm 二项分布 bino 指数分布 exp Poisson分布 poiss 均匀分布 unif 几何分布 geo β分布 beta 超几何分布 hyge Γ分布 gam 离散均匀分布 unid 对数正态分布 logn 连续均匀分布 rayleigh分布 rayl 负二项分布 nbin weibull 分布 weib 2分布 chi2 F分布 f 学生氏t分布 t

§2.4 连续型随机变量及其概率密度 Matlab实验 具体函数的命名规则是: 函数名=分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd) 例如,normpdf、normcdf、norminv、normstat和normrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。 关于这5类函数的语法,请详见有关书籍 快捷的学习可借助MATLAB的系统帮助,通过指令doc获得具体函数的详细信息,语法是 doc <函数名> Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验 离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N) 随机变量X在1到N上的N各自然数之间等可能取值 在Matlab中输入以下命令: x=1:1:10; y=unidpdf(x,10) 结果:y = 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 x=0:1:10; y=unidcdf(x,10) 结果:y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000 1.0000 Matlab实验

§2.4 连续型随机变量及其概率密度 连续均匀分布 Matlab实验 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. 密度函数:f=unifpdf(x,a,b) 分布函数:f=unifcdf(x,a,b) 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. 在Matlab中输入以下命令: x=0:0.01:7; y=unifpdf(x, 2, 5); z=unifcdf(x, 2, 5); plot(x,y,x,z) Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验

§2.4 连续型随机变量及其概率密度 (二)指数分布 概率密度的两个条件显然成立: X的分布函数: 设连续型随机变量X的概率密度为 易知非负性成立f(x)0,且规范性: =1 X的分布函数:

§2.4 连续型随机变量及其概率密度 无记忆性: (指数分布又称“永远年青”的分布) 应用:排队论,可靠性理论 服从指数分布的X有如下性质:P{X>s+t|X>s}=P{X>t} 证:P{X>s+t|X>s}=P{X>s+t∩X>s}/P{X>s}=P{X>s+t}/P{X>s} =[1-F(s+t)]/[1-F(s)] =e-(s+t)/θ/e-s/θ= e-t/θ = P{X>t} 含义:如果X是某一元件寿命,那么已知元件使用了s小时,它还能再使用t小时(即s+t小时)的条件概率,等于从开始使用时算起它至少能使用t小时的概率。即元件对它使用s小时没有记忆,符合这样数学模型的随机现象有很多。 应用:排队论,可靠性理论 描述衰老作用不明显的寿命分布; θ为寿命X的平均值 衰老作用明显的时候常采用weibull分布

§2.4 连续型随机变量及其概率密度 (2) 指数分布 Matlab实验 密度函数:f=exppdf(x,) 分布函数:F=expcdf(x,) 例: 画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20). 在Matlab中输入以下命令: x=0:0.1:5; y=exppdf(x,2); z=expcdf(x,2); plot(x,y,x,z) result1=expcdf(5,2)-expcdf(0,2) result2=expcdf(20,2)-expcdf(0,2) Matlab实验

§2.4 连续型随机变量及其概率密度 结果:result1 = 0.91791500137610

§2.4 连续型随机变量及其概率密度 (三)正态分布 在自然界中大量的随机现象服从或近似的服从正态分布 人的身高、体重;农作物的收获量;测量误差; 产品的尺寸、炮弹弾着点、考试成绩 器件中的电子热噪声;信道噪声 若随机变量 X 受到众多相互独立的随机因素的影响,而每一个别因素的影响都是微小的,且这些影响可以叠加, 则 X 服从正态分布(大量微小的独立的随机因素综合作用的结果(第五章进一步学习)) 这些现象的分布常具有两头小、中间大,呈左右对称的特点,钟型曲线

§2.4 连续型随机变量及其概率密度 定义:设连续型随机变量X的概率密度为 f(x)= ,-∞<x<∞ 其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布或高斯(Gauss)分布,记为X~N(μ, σ2) 注意,第二个参数是平方的形式 μ,σ的含义在第四章介绍,它们分别是均值和方差的概念 此分布的数学表达式最早(1718年)由法国哲学、数学家A.DeMoivre提出,以后由(德)数学家C.F.Gauss(1777~1855年)作了系统研究,故又称de Moivre分布或Gauss分布。

§2.4 连续型随机变量及其概率密度 概率密度的两个条件: 易知非负性成立f(x)0,现在证规范性: =1 令t=(x-μ)/σ,有dt=dx/σ,-∞<t<∞,代入得 记 I= 则 利用极坐标系将它化成累次积分,dtdu =rdrdθ, 0<r=(t2+u2)1/2<∞, 0<θ<2π得 即I=1 于是 =I=1

§2.4 连续型随机变量及其概率密度 正态函数的性质:函数曲线的性质 1°对称轴: 意义:X落在关于x=μ对称的两个区间的概率相等 曲线关于x=μ对称,对任意的h>0有 P{μ-h<Xμ}=P{μ<Xμ+h } 函数的对称性即证明,对任意的a有f(μ-a)= f(μ+a) 证明略。 意义:X落在关于x=μ对称的两个区间的概率相等 对称轴平移,曲线形状不变。曲线f(x)的位置完全由μ决定,μ称为位置参数

§2.4 连续型随机变量及其概率密度 2°最大值:当x=μ时取到最大值f(μ)= 3°拐点:上凸和下凹的分界点 只需令df(x)/dx=0,可解出x=μ时取得唯一极值 意义:极大值与σ有关,σ越小,最值越大,X落在对称轴附近的概率越大,x离μ越远f(x)的值越小 3°拐点:上凸和下凹的分界点 在x=μ±σ处曲线有拐点。可由df(x)2/dx=0解出。 上凸部分增加得慢,下凹部分增加得快 4°渐近线:y=0(Ox轴)为渐近线,无限接近但不相交 由 可得 由以上性质可见4个特征基本描述了曲线的特征,f(x)的特征均由μ,σ决定

§2.4 连续型随机变量及其概率密度 分布函数:不可积 标准正态分布: 当μ=0,σ=1时称X服从标准正态分布,其概率密度和分布函数分别用φ(x),Φ(x),记做X~N(0,12) φ(x)= ,-∞<x<∞,Φ(x)= Φ(x)是超越积分,为此人们编制了一张Φ(x)函数表,以供查用

§2.4 连续型随机变量及其概率密度 Φ(x)的性质:Φ(-x)=1-Φ(x) Φ(-x)= , 令t=-u,Φ(-x)= = =

§2.4 连续型随机变量及其概率密度 正态分布随机变量的标准化:线性变换 引理:若X~N(μ,σ2),则Z= ~N(0,1) 随机变量Z是随机变量X的函数,更一般情形留到第五节 证:先由分布函数的含义,由X的分布函数求随机变量Z的分布函数 F(z)=P{Zz}= P{ z}=P{Xμ+σz} 由X的分布函数有 = 令 =u,则dt=σdu,积分换限,而由t=μ+σu,及t的范围,得出u的范围 = =Φ(z) 所以Z= ~N(0,1)

§2.4 连续型随机变量及其概率密度 对于一般的正态分布随机变量可表示为标准正态分布的形式 于是若X~N(μ,σ2),则其分布函数 F(x)=P{Xx}=P{ }=Φ( ) 而标准正态函数可查表求值 对于任意的区间(x1,x2],有 P{x1<Xx2}= P{ }=Φ( )-Φ( ) 例:设X~N(1,4),求P{0<X1.6} 解:μ=1,σ=2 P{0<X1.6}=Φ((1.6-1)/2)-Φ((0-1)/2)=Φ(0.3)-Φ(-0.5) 查表及由标准正态分布函数的性质 =0.6179-[1-Φ(0.5)] =0.6179-1+0.6915=0.3094

§2.4 连续型随机变量及其概率密度 Matlab实验 (3) 正态分布 密度函数:f=normpdf(x,,) 分布函数:F=normcdf(x,,) 例: 画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求P(1<X<6). 在Matlab中输入以下命令: x=-5:0.1:6; y=normpdf(x,1,2); z=normcdf(x,1,2); plot(x,y,x,z) result=normcdf(6,1,2)-normcdf(1,1,2) Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验 结果:Result =0.4938

§2.4 连续型随机变量及其概率密度 Matlab实验 例:在同一坐标下,画下列正态分布的密度函数图像 (1) μ=3, σ=0.5, 0.7, 1, 1.5, 2 (2) σ=0.5, μ=1,2,3,4 (1)命令: x=-6:0.1:6; y1=normpdf(x,3,0.5); y2=normpdf(x,3,0.7); y3=normpdf(x,3,1); y4=normpdf(x,3,1.5); y5=normpdf(x,3,2); plot(x,y1,‘.’,x,y2,‘+’,x,y3,‘*’,x,y4,‘d’,x,y5) Matlab实验

§2.4 连续型随机变量及其概率密度 3σ准则: 尽管正态变量X~N(μ,σ2)的取值范围是(-∞,∞),但X落在(μ-3σ,μ+3σ)内几乎是肯定的 1σ: P{μ-σ<Xμ+σ}=Φ(1)-Φ(-1)=0.6826 2σ:P{μ-2σ<Xμ+2σ}=Φ(2)-Φ(-2)=0.9544 3σ:P{μ-3σ<Xμ+3σ}=Φ(3)-Φ(-3)=0.9974 使得正态分布函数值的表只需要做到0到3.49即可,再大都近似为1 企业管理中,经常应用3--规则进行质量检查

§2.4 连续型随机变量及其概率密度 解:>> clear,clf %(标准)正态分布密度曲线下的面积 Matlab实验 例 正态分布参数μ和σ对变量x取值规律的约束——3σ准则 解:>> clear,clf %(标准)正态分布密度曲线下的面积 X=linspace(-5,5,100); Y=normpdf(X,0,1); yy=normpdf([-3,-2,-1,0,1,2,3],0,1); plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.') hold on plot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:') plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:') plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7), yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:') Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验 hold off text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') text(-3.2,-0.03,'\fontsize{10}μ-3σ') text(-2.2,-0.03,'\fontsize{10}μ-2σ') text(-1.2,-0.03,'\fontsize{10}μ-σ') text(-0.05,-0.03,'\fontsize{10}μ') text(0.8,-0.03,'\fontsize{10}μ+σ') text(1.8,-0.03,'\fontsize{10}μ+2σ') text(2.8,-0.03,'\fontsize{10}μ+3σ') Matlab实验

§2.4 连续型随机变量及其概率密度 例3:正态分布随机变量X~N(d,0.52) 解:(1)此时X~N(90,0.52) 若X>80的概率不低于0.99,问d至少为多少? 解:(1)此时X~N(90,0.52) P{X<89}=P{(X-90)/0.5<(89-90)/0.5} =Φ((89-90)/0.5)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228 (2) 0.99P{X80}= P{(X-d)/0.5(80-d)/0.5}=1-Φ((80-d)/0.5) 即Φ((80-d)/0.5)1-0.99=1-Φ(2.327)=Φ(-2.327) 以上用了反查表:由概率值求自变量取值,且变换为大于0.5的概率值才可查 又由分布函数的不减性知 (80-d)/0.5-2.327,故需d>81.1635

§2.4 连续型随机变量及其概率密度 关于上α分位点: 为了数理统计中的应用而引入 设X~N(0,1),若zα满足条件,P{Xzα}=α,0<α<1,则称点zα为标准正态分布的上α分位点。 性质:z1-α=-zα 注意上α分位点与正态分布函数表的关系

例 标准正态分布α分位数的概念图示。 解 >> %α分位数示意图(标准正态分布,α=0.05) clear,clf 例 标准正态分布α分位数的概念图示。 解 >> %α分位数示意图(标准正态分布,α=0.05) clear,clf data=normrnd(0,1,300,1); xalpha1=norminv(0.05,0,1); xalpha2=norminv(0.95,0,1); xalpha3=norminv(0.025,0,1); xalpha4=norminv(0.975,0,1); subplot(3,1,1) capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) subplot(3,1,2) capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) subplot(3,1,3) capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) hold on capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) hold off xalpha1 xalpha2 xalpha3 xalpha4

xalpha1 = -1.6449 xalpha2 = 1.6449 xalpha3 = -1.9600 xalpha4 = 1.9600

§2.4 连续型随机变量及其概率密度 对数正态分布 一些正偏态资料的变量值,通过对数转换后,由偏态分布转为正态分布。某些正偏态资料,如血铅含量、某些传染病的潜伏期等,经对数变换后可符合正态分布。在金融、工程、医学、生物学等领域有广泛的应用  如果 X 是服从正态分布的随机变量,则 eX 服从对数正态分布;同样,如果 Y 服从对数正态分布,则 ln(Y) 服从正态分布。 如果一个变量可以看作是许多很小独立因子的乘积(与正态的多个很小独立因子的求和相对应),则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。

§2.4 连续型随机变量及其概率密度 函数及其相关的几种重要连续型分布介绍 函数  分布、 分布、Weibull分布 Г函数在概率分布中具有极其重要的地位 Г(s)= ,s>0,这是一个广义积分,不可积 重要的性质Г(s+1)=sГ(s),Г(1/2)= , 余元公式Г(s)Г(1-s)=π/sinsπ 当0<s<1时,Г(s)的值可查表求得,

§2.4 连续型随机变量及其概率密度 (1) Г分布 Г分布可记作:X~Г(α, β),等待第α件事发生所需要的等待时间 fX(x)= α>0,β>0 Г分布的可加性:X~Г(α1,β), Y~Г(α2,β),X和Y相互独立 则Z=X+Y~Г(α1+α2,β) 其中α是形状参数,决定曲线形状,β是尺度参数决定曲线的伸缩 Г分布与很多分布都有关系 当α =n/2, β =2时, Г分布即为自由度为n的2分布 当α =1时, Г分布即为参数为β的指数分布 当α =k+1 , β =1时, Г分布的表达式与泊松分布表达式的形式是一致的,但参数(即x)是连续的

§2.4 连续型随机变量及其概率密度 (2) β分布 β分布定义在区间(0, 1),可记作:X~Beta(α, β) α>0,β>0 β分布与贝叶斯理论有联系,常用来描述取值在(0, 1)的概率模式, 比如描述由后验概率来查看抛硬币中使用硬币的不均匀度(正反面 可能不是等概出现) 当α =1, β =1时, β分布就是U(0, 1) 期望等于α /(α+β)

§2.4 连续型随机变量及其概率密度 Beta分布的曲线

§2.4 连续型随机变量及其概率密度 (3) 韦布尔分布(Weibull分布) Weib(α, , b)分布:它是可靠性工程中广泛使用的一种连续性分布,常用来描述各种产品、材料疲劳失效的分布规律,如真空管的疲劳失效、机械轴承的疲劳失效等,该分布为三参数分布,其中α为形态参数,β为尺度参数,b为位置参数。当α=1,α>1,α<1时分别对应了某些产品(或材料)的偶发期故障(正常随机故障)、耗损期故障(老化严重故障多发期)和早发故障(新设备投入运行)三种形态的失效分布。考虑损耗衰老作用时比指数分布更准确 该分布由瑞典数学家W.Weibull是在对双参数指数分布 E1(1,b) 和Ray()的研究基础上综合推广而成。该分布同样在无线电信号分析和元器件可靠性分析中有重要应用

§2.4 连续型随机变量及其概率密度 概率密度表达式 xb, b0, m为正整数 令=α,带入则可得到概率密度的另一种表达式 当α=1时, Weib(1,,b)即双参数指数分布 E1(,b) 从上面的描述可知,指数分布只适用于浴盆曲线(指产品从投入到报废为止的整个寿命周期内)的底部,但任何产品都有早期故障,也总有耗损失效期。在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况

§2.5 随机变量的函数的分布 实际应用中,某些人们关心的随机变量Y往往不能直接测量得到,而它可能是某个能测量的随机变量的函数X 问题: 比如我们有时很关心圆柱轴截面的面积S,但无法直接获得,而我们能够获得圆柱轴截面的直径D,而随机变量S是随机变量D的函数,即S=(1/4)πD2 问题: 怎样由已知的随机变量X的概率分布求它的函数Y=g(X)的概率分布,其中g(•)是连续函数? 一般的步骤是什么?

§2.5 随机变量的函数的分布 例1:设随机变量X具有以下的分布律,试求Y=(X-1)2的分布律 解:首先获得Y的所有可能取值:0,1,4 pk 0.2 0.3 0.1 0.4 解:首先获得Y的所有可能取值:0,1,4 求解各取值的概率 P{Y=0}=P{(X-1)2=0}= P{X=1}=0.1 P{Y=1}=P{(X-1)2=1}= P{(X=0}+P{X=2}=0.7 P{Y=4}=P{(X-1)2=4}= P{(X=-1}=0.2 即得Y的分布律为 Y 0 1 4 pk 0.1 0.7 0.2 对于离散型随机变量 P{Y=yk}等于所有满足yk=g(X)的X的取值的概率之和

§2.5 随机变量的函数的分布 例2:设随机变量X具有概率密度 求随机变量Y=2X+8的概率密度 解:分别记X,Y的分布函数为FX(x),FY(y),先求Y的分布函数FY(y) FY(y)=P{Yy} //由分布函数的含义 将Y=2X+8代入 =P{2X+8y} 表示为关于X的概率 =P{X(y-8)/2} 即 =FX((y-8)/2) 将FY(y)关于y求导得 fY(y)=dFY(y)/dy=dFX((y-8)/2)/dy = fX((y-8)/2)d((y-8)/2)/dy = 注意:代入时, fX的自变量及分段函数取值范围用g-1(y)来代

§2.5 随机变量的函数的分布 求连续型随机变量X的函数Y=g(X)的概率密度的一般步骤: 已知fX(x),Y=g(X),求fY(y) 1°先写出Y的分布函数定义式:FY(y)=P{Yy} 由Y=g(X)确定Y的值域,当y不在值域范围内时单独讨论 fY(y) 2°将Y=g(X)代入上式 =P{g(X)y} //在y的值域范围内讨论 3°由g(X)y求解X的范围 =P{X|g(X)y} 表示为y的形式 4°由X的分布函数FX(x)表示以上概率,得到关于y的表达式FY(y),其中FX(x)的自变量x用关于y的表达式来代。 5°求导得fY(y)=dFY(y)/dy,将fY(y)的所有可能的情况合并 掌握变上下限积分求导公式

§2.5 随机变量的函数的分布 例3:设随机变量X具有概率密度fX(x), -∞<x<∞,求Y=X2的概率密度 解:1°FY(y)=P{Yy}, 由Y=X20,当y0时,FY(y)=0 2°当y>0时,代入Y=X2得 FY(y)=P{Yy}=P{ X2y} 3° =P{ } 4°由FX(x)得 FY(y)= 5°fY(y)=dF(y)/dy=

§2.5 随机变量的函数的分布 在Y=g(X),且g(X)为严格单调函数时的一般结果 定理:设随机变量X具有概率密度fX(x),-∞<x<∞,又设函数g(x)处处可导且恒有g(x)>0(或g(x)<0),则Y= g(X)是连续型随机变量,其概率密度为 其中α=min{g(-∞),g(∞)}, β=max{g(-∞),g(∞)}, h(y)是g(x)的反函数

§2.5 随机变量的函数的分布 证:g(x)>0的情况 FY(y)=P{Yy}=P{g(X)y} 此时g(x)为单调增函数,所以h(y)也是单调增函数,且有y的取值范围为 α=g(-∞)yg(∞)=β, 因此当yα时,FY(y)=0; 当yβ时,FY(y)=1 当 αyβ时,FY(y)=P{Yy}=P{g(X)y} h(y)是单调增函数 =P{Xh(y)} = FX(h(y)) 求导fY(y)=dFY(y)/dy=dFX(h(y))/dy= g(x)<0的情况,此时h(y)<0 P{g(X)y}=P{Xh(y)}=1-FX(h(y)) fY(y)=dF(y)/dy=d[1-FX(h(y))]/dy= 两种情况合并即可得证

§2.5 随机变量的函数的分布 推广 分段单调函数的情况下,上述定理可进一步推广为下面形式 若fX(x)在有限区间[a,b]以外等于0,则只需假设在[a,b]上恒有g(x)>0(或g(x)<0),α=min{g(a),g(b)},β=max{g(a),g(b)},以上结论还成立 分段单调函数的情况下,上述定理可进一步推广为下面形式 假设g(x)在下面两个区间(a1,b1)和(a2,b2)分别是单调的函数,其中在(a1,b1)上的反函数为h1(y),在(a2,b2) 上的反函数为h2(y),且fX(x)在其它有限区间等于0,则有 fY(y)= 其中y的范围由g(x)确定 可参考教材中Y=X2的求解过程

§2.5 随机变量的函数的分布 例4:正态分布的随机变量的线性变换问题 证:X的概率密度为 所以有 已知随机变量X~N(μ,σ2),试证明X的线性函数Y=aX+b(a≠0)也服从正态分布。 证:X的概率密度为 f(x)= ,-∞<x<∞ 现在y=g(x)=ax+b,由这一式子解得x=h(y)=(y-b)/a,且有h(y)=1/a 显然g(x)是严格单调的,由定理有 fY(y)= ,-∞<y<∞ = = ,-∞<y<∞ 所以有 Y= aX+b~N(aμ+b,(aσ)2) 特别的当a=1/σ,b=-μ/σ时,Y=(X-μ)/σ=~N(0,1) 即上一节的引理的结果

§2.5 随机变量的函数的分布 思考: 设f(x)是连续函数,若X是离散型随机变量,则Y= f(x),也是离散型随机变量吗?若X为连续型又如何? 若X是离散型随机变量,它的取值是有限个或可列无限多个,因此Y的取值也是有限个或可列无限多个,因此Y是离散型随机变量 若X是连续型随机变量,则Y不一定是连续型随机变量,比如:

本章小结

作业 第一次: 第二次: 第三次: P55:2,4,5,8 P56:10,12,13, 17,21,24,26,29

Matlab实验作业 1. 已知二项分布Xb(18,0.2) 求: (1) 分布率和分布函数值,并画出曲线 (2) 求该分布的数学期望和方差 (3) 计算分布函数值为0.1,0.4,0.7时对应的x值 2. 对于正态分布: (1)给出N(2,9)的密度曲线和分布函数曲线 (2)在同一图上划出均值为2,标准差为0.5,0.7,1,2的密度曲线 (3)已知=0.05,求N(0,1)的上分位点,并与查表值比较.