第二章随机变量及其分布主讲教师：董庆宽副教授研究方向：密码学与信息安全

Slides:

Advertisements

Similar presentations

1 §2.2 离散型随机变量 §2.1 随机变量的概念 §2.3 超几何分布 · 二项分布 · 泊松分布 1. “0-1” 分布 ( 两点分布 ) 3. 二项分布 4. Poisson 分布 2. 超几何分布 n →∞ ， N→∞ ， (x = 0, 1, 2, , n) (x.

Advertisements

随机变量及其概率分布第二章离散型随机变量及其分布律正态分布连续型随机变量及其分布律随机变量函数的分布.

目录上页下页返回结束习题课一、导数和微分的概念及应用二、导数和微分的求法导数与微分第二章.

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

第八章第四节机动目录上页下页返回结束一个方程所确定的隐函数及其导数隐函数的微分法.

2.6 隐函数微分法第二章第二章二、高阶导数一、隐式定义的函数三、可微函数的有理幂. 一、隐函数的导数若由方程可确定 y 是 x 的函数, 由表示的函数, 称为显函数. 例如, 可确定显函数可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此隐函数求导方法.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

第二章导数与微分. 二、微分的几何意义三、微分在近似计算中的应用一、微分的定义 2.3 微分.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第三章函数逼近 — 最佳平方逼近.

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

第二节离散型随机变量及其分布律一、离散型随机变量的分布律二、常见离散型随机变量的概率分布三、小结.

例题教学目的: 微积分基本公式教学重点: 牛顿----莱布尼兹公式教学难点: 变上限积分的性质与应用.

第二节微积分基本定理一、积分上限函数及其导数二、积分上限函数求导法则三、微积分基本公式.

高等数学电子教案第五章　定积分第三节微积分基本定理.

第五节微积分基本公式、变速直线运动中位置函数与速度函数的联系二、积分上限函数及其导数三、牛顿—莱布尼茨公式.

一、原函数与不定积分二、不定积分的几何意义三、基本积分公式及积分法则四、牛顿—莱布尼兹公式五、小结

第四章定积分及其应用 4.3 定积分的概念与性质微积分基本公式定积分的换元积分法与分部积分法 4.5 广义积分

定积分性质和微积分学基本定理一、定积分性质二、变上限积分函数三、定积分基本公式.

第四章　函数的积分学第六节　微积分的基本公式一、变上限定积分二、微积分的基本公式.

第四章一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

主要内容 § 3.1 多维随机变量及联合分布联合分布函里数联合分布律联合概率密度 § 3.2 二维随机变量的边缘分布

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第二章　导数与微分第二节　函数的微分法一、导数的四则运算二、复合函数的微分法.

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第5章 §5.3 定积分的积分法换元积分法不定积分分部积分法换元积分法定积分分部积分法.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

二、随机变量及其分布主讲教师：董庆宽副教授研究方向：密码学与信息安全

例1 ：甲击中的环数； X ：乙击中的环数； Y 平较高？试问哪一个人的射击水：的射击水平由下表给出甲、乙两人射击，他们

本次课讲授：第二章第十一节，第十二节，第三章第一节，下次课讲第三章第二节，第三节，第四节；下次上课时交作业P29—P30

计算机数学基础主讲老师: 邓辉文.

§2 求导法则 2.1 求导数的四则运算法则下面分三部分加以证明, 并同时给出相应的推论和例题 .

第一章　函数函数 — 研究对象—第一章分析基础极限 — 研究方法—第二章连续 — 研究桥梁—第二章.

概率统计主讲教师叶宏山东大学数学院.

第八模块复变函数第二节　复变函数的极限与连续性一、复变函数的概念二、复变函数的极限二、复变函数的连续性.

连续型随机变量及其概率密度一、概率密度的概念与性质二、常见连续型随机变量的分布三、小结.

第一章函数与极限.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

概率统计主讲教师叶宏山东大学数学院.

应用概率统计主讲:刘剑平.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

正切函数的图象和性质周期函数定义：一般地，对于函数 (x),如果存在一个非零常数T，使得当x取定义域内的每一个值时，都有

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

第四章第四节函数图形的描绘一、渐近线二、图形描绘的步骤三、作图举例.

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

概率统计主讲教师叶宏山东大学数学院.

第一节不定积分的概念与性质一、原函数与不定积分的概念二、不定积分的几何意义三、基本积分表四、不定积分的性质五、小结思考题.

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

第4课时绝对值.

多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer

学习任务三偏导数结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.

第三章多维随机变量及其分布第一节二维随机变量第二节边缘分布第三节条件分布第四节相互独立的随机变量

第四节随机变量函数的概率分布 X 是分布已知的随机变量，g ( · ) 是一个已知的连续函数，如何求随机变量 Y =g(X ) 的分布？

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

难点：连续变量函数分布与二维连续变量分布

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

三角三角三角函数余弦函数的图象和性质.

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

Presentation transcript:

第二章随机变量及其分布主讲教师：董庆宽副教授研究方向：密码学与信息安全电子邮件：qkdong@xidian.edu.cn 本科生必修课：概率论与数理统计第二章随机变量及其分布主讲教师：董庆宽副教授研究方向：密码学与信息安全电子邮件：qkdong@xidian.edu.cn 个人主页：http://web.xidian.edu.cn/qkdong/

第二章随机变量及其分布 §2.1 随机变量 §2.2 离散型随机变量及其概率分布 §2.3 随机变量的分布函数 §2.4 连续型随机变量及其概率密度 §2.5 随机变量的函数的分布

§2.1 随机变量对于错综复杂的随机现象，如信道噪声、随机信号、测量误差等实际问题难以简单处理。为了更好的用数学方法来分析随机现象地统计规律性，人们将随机试验的结果与实数对应起来(结果数量化)，从而引入随机变量的概念例1：将一枚硬币抛掷三次，观察正反面出现的情况，并考虑每次试验当中正面出现的次数，样本空间是 S＝{HHH，HHT，HTH，HTT，THH，THT，TTH，TTT} 以X记三次投掷得到正面H的总数，那么对于样本空间S中的每一个样本点e，X都有一个数与之对应

§2.1 随机变量例1：将一枚硬币抛掷三次，观察正反面出现的情况，并考虑每次试验当中正面出现的次数，样本空间是 S＝{HHH，HHT，HTH，HTT，THH，THT，TTH，TTT} 以X记三次投掷得到正面H的总数，那么对于样本空间S中的每一个样本点e，X都有一个数与之对应 X是定义在样本空间上的单值实值函数，定义域是样本空间，值域为{0,1,2,3}.使用函数的符号可将X写成

§2.1 随机变量例2：随机试验：袋中装有编号分别为1，2，3的3只球，在袋中任取一只，放回，然后再取一只球，记录他们的编号样本点：是一个编号的数对：(i，j)，i，j=1,2,3 样本空间：S={e}={(i，j)|i，j=1,2,3} 现在关心的是两个球的号码之和，记做X，则对于每一个样本点e，X都有一个值与之对应即从样本空间到实数集合上的一个映射 X：S→R X是一个定义在样本空间S上的单值实值函数，其定义域是样本空间；值域是实数集合{2,3,4,5,6} 因此X可写成 X=X(e)＝X((i,j))＝i+j，i，j＝1，2，3.

§2.1 随机变量定义：设随机试验的样本空间为S＝{e}。X=X{e}是定义在样本空间S上的实值单值函数。称X=X{e}为随机变量

§2.1 随机变量关于随机变量需要注意的几个方面 X是一个单值实值函数，定义域是样本空间S，值域是X的所有可能取值RX。注意随机变量的值域不同于样本空间 (2)如果随机试验结果本身是一个数，则直接令X＝X(e)=e，X是一个随机变量如灯泡的寿命T，某学校学生的体重W，掷骰子的点数等等随机变量的取值可以是有限的，可列的，或不可列的 (3) 随机变量的取值随试验结果而定，是样本点的函数，因此随机变量X(e)的取值是随机出现的，有一定的概率

§2.1 随机变量随机事件的描述例如当然关心的X取值也可能有多个，用关于X的表达式来表示例1中X的取值为2，记做{X=2}，对应的样本点集合为A={HHT,HTH,THH}这是一个随机事件当且仅当A发生时有{X=2}，我们称概率P(A)为{X=2}的概率，即P{X=2}=P(A)＝3/8 当然关心的X取值也可能有多个，用关于X的表达式来表示如{X1}表示随机事件B＝{TTT,TTH,THT,HTT} P{ X1}=P(B)＝4/8 一般的，若L是一个实数集合，将X在L上取值写成{XL}，则{XL}表示事件B={e| X(e)L },此时有P{ XL }=P(B)

§2.2 离散型随机变量及其概率分布本节学习基于随机变量来描述随机现象的一般问题随机变量的类别：设F(x)是分布函数

§2.2 离散型随机变量及其概率分布离散型随机变量的例子：将一枚硬币抛掷三次，观察出现正面的次数：某电话交换台一分钟内收到的呼叫次数：随机变量的全部可能取值仅有4个：0，1，2，3 某电话交换台一分钟内收到的呼叫次数：可列无限多个（理想状态下）某城市120急救电话台一昼夜收到的呼叫次数而灯泡的寿命T所有可能取值充满一个区间，无法按一定次序一一列出，非离散型随机变量

§2.2 离散型随机变量及其概率分布掌握离散随机变量X的统计规律，只需知道X的两个问题分布律： (1) X所有可能的取值，我们可以通过随机试验的样本空间S来得到 (2) 每一个可能取值的概率，它们构成分布律的概念在后面我们会进一步学习X的数字特征等概念分布律：设离散型随机变量X的所有可能取值为xk(k=1,2,…)，X取各个可能值的概率，即事件{X=xk}的概率为 P{X=xk}=pk，k=1, 2, … 由概率的定义，pk满足如下两个条件： (1) 非负性：pk0; (2) 规范性：＝1 则称P{X=xk}=pk，k=1,2,…为离散型随机变量X的分布律

§2.2 离散型随机变量及其概率分布分布律也可表示为表格的形式分布律含义：由分布律定义中的条件，概率1以一定的规律分布在各个可能值上 X x1 x2 … xn … pk p1 p2 … pn … 分布律含义：由分布律定义中的条件，概率1以一定的规律分布在各个可能值上规范性的证明： {X=x1}∪{X=x2}∪…是必然事件，与样本空间相对应，且{X=xk}∩{X=xj}＝Φ，k≠j 所以，1＝P({X=x1}∪{X=x2}∪…)

§2.2 离散型随机变量及其概率分布例 1设随机变量 X 的分布律为： P(X=n)=c/4n (n=1,2,…,), 求常数c. 解：由规范性 1= = = (c/4)/(1-1/4) =c/3  c=3

§2.2 离散型随机变量及其概率分布几种重要的离散型随机变量的分布律（一）(0－1)分布设随机变量X只可能取两个值0与1，它的分布律是 P{X=k}＝pk(1－p)1－k，k=0,1，0<p<1，则称X服从(0－1)分布或两点分布，记作 b(1,p) 应用：(0－1)分布是经常遇到的一种分布一般的对于一个随机试验，如果它的样本空间只包含两个元素，即S={e1,e2}，总能在S上定义一个服从(0－1)分布的随机变量描述这个随机试验结果 X=X(e)＝例如：对新生儿的性别进行登记抛一枚硬币，观察其正面和反面出现的情况

§2.2 离散型随机变量及其概率分布（二）伯努利试验、二项分布伯努利试验Bernouli 设试验E只有两个可能结果：A及，则称E为伯努利试验。设P(A)=p (0<p<1)，则P( )=1－p。将试验E独立地重复地进行n次，则称这一串重复的独立试验为n重伯努利试验其中，“重复”是指每次试验都有P(A)=p “独立”是指各次试验的结果A互不影响，相互独立 n重伯努利试验应用非常广泛，是研究最多的模型之一 (0-1)分布的模型就是1重伯努利实验 E :抛一枚硬币，观察H和T出现情况，将E独立进行n次，观察H次数而一些不放回抽样的随机试验则可能不满足这种独立性，也就不是n重伯努利试验。

§2.2 离散型随机变量及其概率分布伯努利试验的分布律以X表示n重伯努利试验中事件A发生的次数（比如n次抛币试验中正面出现的频数），求X的分布律，即求 1）X的所有可能取的值为0，1，2，...，n 2）X的分布律，即求对任意的k(0kn)，概率P{X=k} 解：P{X=k}即相当于求在n次试验中，有k次试验事件A发生，另外n－k次试验事件A不发生的概率

§2.2 离散型随机变量及其概率分布首先看一下事件A在某指定k次试验中发生，比如在第i1，i2，...，ik次试验中A发生，而其余n－k次试验中不发生的概率。由于这n次试验是相互独立的，则相应概率为 p•p•...•p•(1－p)•(1－p)•...•(1－p)＝pk(1－p)n－k i1 i2 ... ik 这样的指定方式共有种两两互不相容的方式（两两不同的方式）因此n次试验中事件A发生k次的概率为 pk(1－p)n－k，令q＝1－p有 P{X=k}＝ pkqn－k，k＝0，1，...，n

§2.2 离散型随机变量及其概率分布分布律的两个条件的验证： P{X=k}＝ pkqn－k0，k＝0，1，2，...，n 而即非负性和归一性均满足所以P{X=k}＝ pkqn－k，k＝0，1，...，n即为所求分布由于pkqn－k恰好是(p+q)n的二项展开式中出现pk的那一项，故称随机变量X服从参数为n，p的二项分布，记为 X～b(n，p)，n＝1时化为(0-1)分布

§2.2 离散型随机变量及其概率分布 Matlab实验已知Y~b(20, 0.2)求Y分布率的值，并划出图形 binopdf(10,20,0.2) x=0:1:20; y=binopdf(x,20,0.2) plot(x,y, ‘r.’) Matlab实验结果： ans = 0.0020 y =0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

§2.2 离散型随机变量及其概率分布二项分布中的概率最大项：先求分布律中的极大值点，它应该满足如下不等式组 1）P{X=k}＝ pkqn－k pk－1qn－k＋1＝P{X=k-1} 2）P{X=k}＝ pkqn－k pk＋1qn－k－1＝P{X=k+1} 由1)得k≤(n+1)p 由2)得k≥(n+1)p-1 联立1)和2) 有(n+1)p-1≤k≤(n+1)p 当(n+1)p为整数时，k＝(n+1)p和(n+1)p-1时取得最大值当(n+1)p为非整数，k＝[(n+1)p]时取得最大值二项分布的一般图示：

§2.2 离散型随机变量及其概率分布例2：近似二项分布解：按规定，某种型号的电子元件的使用寿命超过1500小时的为一级品。已知某一大批产品的一级品率为0.2，现在随机抽取20只，问20只元件中恰有k只为一级品的概率是多少？解：本题是不放回抽样问题，由于元件总数很大，而抽查元件数量远远小于元件总数，可以近似当作放回抽样来处理。 A：抽取一只元件是一级品 P(A)＝0.2 如果看作放回抽样，每次检查元件是相互独立的，则检查20只元件相当于做20重伯努利试验，以X记20只元件中一级品的只数，那么随机变量X服从二项分布，即X～b(20, 0.2)即有 P{X=k}＝ 0.2k0.820－k，k＝0，1，2，...，20.

§2.2 离散型随机变量及其概率分布例3 大量试验条件下的小概率事件问题解：某人进行射击，设每次击中的命中率为0.02，独立射击400次，试求至少击中两次的概率解：将一次射击看成是一次试验，设射击次数为400，则X～b(400, 0.02) X的分布律为P{X=k}＝ 0.02k0.98400－k，k＝0，1，2，...，400. 所求的概率为P{X2}=1－P{X＝0}－P{X＝1} =1－0.98400－400(0.02)0.98399 =0.9972 结果接近于1 一次射击击中目标是个小概率事件若400次中击中目标次数竟真的达不到两次，而由于这一事件的概率P{X<2}=0.003是小概率事件，由实际推断原理，有理由怀疑命中率达不到0.02，可能更低大量独立试验条件下，小概率发生几乎是肯定的，如抽奖问题

§2.2 离散型随机变量及其概率分布例4 维修工分配问题(用工优化) 解：按方案(1) 不考虑维修时间长短问题设有80台同类型设备，各台工作独立，发生故障的概率都是0.01，且一台设备的故障仅能由一人处理，考虑两种配备维修工人的方法 (1)由4人维护，每人20台； (2)由3人共同维护80台；试比较发生故障时不能及时维修的概率大小? 解：按方案(1) 不考虑维修时间长短问题记X为 “第一人维护的20台中同一时刻发生故障的台数“，则X～b(20, 0.01) 用事件Ai表示：“第i人维护的20台中发生故障不能及时维修”这一事件则80台中发生故障不能及时维修的概率为 P(A1∪A2∪A3∪A4) P(A1)＝P(X 2)

§2.2 离散型随机变量及其概率分布按方案(2) 而X～b(20, 0.01)，故有 P(X2)= 1－P(X=0)－P(X=1)=1－0.9920－20(0.01)0.9919=0.0169 即有P(A1∪A2∪A3∪A4)0.0169 按方案(2) 记Y为80台中同一时刻发生故障的台数，则Y～b(80, 0.01) 发生故障不能及时维修的概率 P(A)=1－P(Y=0)－P(Y=1)－P(Y=2)－P(Y=3) =1－0.9980－－－ =0.0087<<0.0169 方案(2)不能及时维修的概率远远小于方案(1) 因此方案(2)的用工方案更优，而且节省人力

§2.2 离散型随机变量及其概率分布（三）泊松分布泊松分布是概率论中比较重要的一种分布，描述一系列在给定时间区间内到达某区域的随机质点数的分布规律，在排队论、路由优化等方面有广泛的应用... 如：到达某十字路口的汽车数、电话交换台接到的要求通话的呼唤数、纺织机上出现的断点数、到达某区域的放射性粒子数、人类的生育胎数、到达某铁路售票处要求售票的顾客数、某一秒种内路由器等待转发的数据包的个数(队列长度) 主要描述那些具有无穷可列个取值的离散型随机变量这类问题的显著特点是可列个取值的总概率为1，服从泊松分布的数学模型在第十章，在学习随机过程时会接触到，这里直接给出泊松分布的定义形式

§2.2 离散型随机变量及其概率分布泊松分布：泊松分布关于分布律的两个条件设随机变量X的所有可能取值为0，1，2，...，而取各值的概率为，k＝0，1，2，... 其中λ>0为常数(也叫泊松强度，具体含义在第四章介绍)，则称X服从参数为λ的泊松分布，记为X～π(λ) 泊松分布关于分布律的两个条件非负性是显然的规范性： = = 考虑麦克劳林级数展开所以

§2.2 离散型随机变量及其概率分布泊松分布的概率最大值问题与二项分布的求解方法类似，先找极大值点，它应满足如下不等式组 1）P{X=k}＝ ≥ ＝P{X=k-1} 2）P{X=k}＝ ≥ ＝P{X=k+1} 由1）得k≤λ 由2得k≥λ-1 联立1）和2）有λ－1≤k≤λ 当λ为整数时， k＝λ和λ－1时取得最大值当λ为非整数， k＝[λ]时取得最大值三种分布之间的关系： (1) 0－1分布考察一次试验中两个可能结果的概率 (2) 二项分布是把以上试验独立重复进行n次，考察出现某一个结果的次数的概率，n＝1时即是结果0－1分布 (3) 泊松分布考察一段时间内某一事件发生的次数的概率

§2.2 离散型随机变量及其概率分布泊松定理 (针对稀有事件) (用泊松分布来逼近二项分布的定理) 设λ>0是一个常数，n是任意正整数，设npn＝λ，则对于任意固定的非负整数k，有证由pn＝λ/n，有＝对任意固定的k，当n趋近于无穷大时，上式第二项极限为1，第三项是自然对数极限为e--λ，最后一项极限为1，所以定理成立。 npn＝λ是常数，当n很大时pn必定很小，所以当n很大，pn很小时，可用泊松分布来近似二项分布。当n≥10, p≤0.1, np≤5时：二项分布≈泊松分布。当试验次数n很大时，稀有事件A发生的次数可以近似用泊松分布来描述，而=np为n次中A发生的平均次数

§2.2 离散型随机变量及其概率分布历史上Poisson分布是作为二项分布的一种近似，其前提是二项分布是稀有事件而二项分布的真正极限分布是正态分布(见中心极限定理) 于1837年由法国数学家S.D.Poisson（1781 ～ 1840年）引入。近些年来，人们发现该分布在物理学及社会生活中对服务的各种要求等方面有愈来愈多的应用

§2.2 离散型随机变量及其概率分布 (四) 超几何分布，抽样检查，无放回抽样产品抽样检查中，假定在N件产品中有D件不合格品，即不合格率p=D/N。随机抽n件做检查，发现k件不合格品的概率为超几何分布通常称这个随机变量X服从超几何分布。这种抽样检查方法等于无放回抽样。数学上不难证明，N趋近无穷时 P(X=k)=CkDCn-kN-D/CnN 近似为b(n,p) (二项分布) 因此，在实际应用时，当N≥10n时，可用二项分布近似描述不合格品个数，当实验次数足够多的时候，不放回抽样可近似为放回抽样，而如果放回抽样则刚好满足二项分布，p=废品率D/N P(X=k)=CkDCn-kN-D/CnN,(k=0,1,… min{n, D})

§2.2 离散型随机变量及其概率分布 Matlab实验假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布，求 (1) 每小时恰有4次呼叫的概率 (2) 一小时内呼叫不超过5次的概率 (3) 画出分布律图像 Matlab实验在Matlab中输入以下命令： (1)p1= poisspdf(4,3) (2)p2= poisscdf(5,3) (3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

§2.2 离散型随机变量及其概率分布 Matlab实验

§2.2 离散型随机变量及其概率分布二项分布与泊松分布的关系例：X~b(200,0.02)，Y 服从参数为4的泊松分布，划出分布率图像 y1=binopdf(x,200,0.02); y2=poisspdf(x,4); plot(x,y1,’r.’,x,y2,’b.’) Matlab实验

§2.2 离散型随机变量及其概率分布分赌注问题 (problem of rational divilion of stakes)是对创立概率论有重大影响的著名问题。水平相同的两个赌徒A和B，约定先胜t局的人赢得赌注，在赌博中的某时刻，两赌徒中止赌博，此时A胜r局，B胜s局，应如何合理分配赌注? 这个问题通常称为点数问题，是嗜好赌博的法国学者梅雷(Meray,H. C. R.)于1654年向法国数学家帕斯卡(Pascal ,B.)提出的. 为此帕斯卡和法国数学家费马(Fer-mat,P. de)于1654年7月到10月之间进行了一系列通信讨论.赌注分配问题成为概率论的起源. 当荷兰数学家惠更斯(Huygens,C.)到巴黎时，听说费马和帕斯卡在研究赌注问题，他也进行了研究，并在1657年撰写了《论赌博中的计算》一书，提出数学期望的概念，推动了概率论的发展.1713年，瑞士数学家雅各布·伯努利(Bernoulli , Jakob)的《猜度术》一书的面世，标志着概率论已成为数学的一个重要分支.

§2.2 离散型随机变量及其概率分布如果以r和s之比来分的话不是很合理。设A每局取胜的概率为p，分赌注为题可描述为在伯努利试验中，求A出现t-s次赌博失败之前，出现t-r次获胜的概率，记为pA。最终赌注按pA：1-pA来分配解：A若胜则后面至少要进行t-r次试验，最多要进行(t-r)+(t-s)-1次即可分出结果。 A的概率等于 (组合下标减1是因为第i次一定胜利) 帕斯卡分布、负二项分布

§2.3 随机变量的分布函数非离散型随机变量X，由于其可能取值不能一个一个的列举而无法用分布律来描述。而且所遇到的非离散型随机变量通常取任一指定的实数值的概率都等于0 实际问题中有很多此类变量：误差ε，元件寿命T等. 对于此类问题，主要研究随机变量取值落在某一个区间的概率，即： P{x1<X≤x2}= P{ X≤x2}－P{X≤x1} 物理意义问题变为计算P{ X≤x2}及P{ X≤x1}，于是引入分布函数的概念。

§2.3 随机变量的分布函数分布函数定义：左开右闭区间上的概率表示：设X是一个随机变量，x是任意实数，函数 F(x)=P{X≤x}，-<x< 称为X的分布函数左开右闭区间上的概率表示：对于任意实数x1，x2 (x1<x2)，有 P{x1<X≤x2}= P{ X≤x2}－P{X≤x1}＝F(x2)－F(x1) ∴已知分布函数，就可以计算出x落在任意区间(x1，x2]上的概率分布函数完整地描述了随机变量的统计规律性。

§2.3 随机变量的分布函数分布函数的物理意义：将X看成是数轴上的随机点的坐标，那么，分布函数F(x)在x处的函数值就表示X落在(－∞，x]上的概率。

§2.3 随机变量的分布函数分布函数具有以下基本性质 1°F(x)是一个不减函数对任意实数x1，x2 (x1<x2)，有F(x2)－F(x1)＝P{x1<X≤x2}0 2°0F(x)1且F(－∞)＝＝0，F(∞)＝＝1 仅从物理意义上加以说明：当x趋于－∞时，即区间端点沿x轴无限左移，{X<x}逐渐趋于不可能事件，从而其概率趋于0，即有F(－∞)＝0；反之，若点x无限右移，则{X<x}趋于必然事件，从而概率趋于1，即有F(∞)＝1 3°F(x+0)=F(x) 即F(x)为右连续的 F(x)在点x处的右极限等于点x处的函数值，即F(x)是右连续的

§2.3 随机变量的分布函数例1：随机变量的分布律用分布函数来表示设随机变量X的分布律为 X －1 2 3 pk 1/4 1/2 1/4 求X的分布函数，并求P{X≤1/2}，P{3/2<X≤5/2}，P{2≤X≤3} 解：随机变量落在－1，2，3三个点上的概率为非0，落在其它点上为不可能事件，因此有

§2.3 随机变量的分布函数 P{X≤1/2}＝F(1/2)=1/4 P{3/2<X≤5/2}= F(5/2)－F(3/2)＝3/4－1/4＝1/2 P{2≤X≤3}= F(3)－F(2)+ P{X=2}=1－3/4+1/2=3/4 注意区间左端的等号 1 概率函数与普通的代数函数不同之处在于物理意义不同，前者是随机变量X的取值落在(－∞，x]区间上的概率 2 求分布函数，一定要讨论区间(－∞，∞)上的所有情况 3 F(x)的值即为所有x的X取值中落在xk处的概率pk之和 4 F(x)的图形是一条阶梯形曲线，在x＝－1，2，3处有阶跃点阶跃值分别为1/4，1/2，1/4 曲线的阶跃点处，上为实心点，下为空心点，体现右连续,小于-1时F(x)=0也应画一个粗实线

§2.3 随机变量的分布函数分布律用分布函数表示的一般方法：一般的，设离散型随机变量X的分布律为 P{X=xk}=pk，k=1,2,… F(x)= P{ X≤x}＝即F(x)= 这里和式是对所有满足xkx的k求和的，分布函数在点x＝xk（k＝1，2，…）处有跳跃，其跳跃值为pk＝P{X=xk} 分布函数能表达所有随机变量的概率问题

§2.3 随机变量的分布函数已知Y~b(20, 0.3)求Y分布函数的值，画出函数图像在Matlab中输入以下命令： Matlab实验 binocdf(10,20,0.3) x=0:1:20; y=binocdf(x,20,0.3) ezplot('binocdf(t,20,0.3)',[0,20]) Matlab实验结果： ans = 0.9994 y = 0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

§2.3 随机变量的分布函数 Matlab实验

§2.3 随机变量的分布函数例2 一般随机变量的分布函数的求解方法一个靶子是半径2米的圆盘，设击中耙上任一同心圆盘上的点的概率与该同心圆盘的面积成正比，并设射击都能中耙，以X表示弹着点与圆心的距离，试求随机变量X的分布函数F(x)＝P{Xx}

§2.3 随机变量的分布函数解：分段讨论： 1°当x<0时，{Xx}是不可能事件，F(x)＝0 2°在圆盘上，0x2，由题意，P{0Xx}＝kπx2 当x＝2时由于假定每次射击都能中耙，有P{0X2}＝1 ∴1＝kπ22 即kπ＝1/4代入得F(x)=P{X<0}+P{0Xx} = 0+(1/4)x2=(1/4)x2 3°当x>2时，由题意{Xx}是必然事件，F(x)＝1

§2.3 随机变量的分布函数综上，F(x)是一个分段函数，具体为它的图形是一条连续曲线 ※注意区间端点的取值 ※注意x是值，X是随机变量

§2.3 随机变量的分布函数现在对F(x)求导数（不可导的点的导数设为0）有这样有F(x)＝即F(x)是非负函数f(t)在区间(－∞，x]上的积分，f(t)即为概率密度函数，其中X是连续型。

§2.4 连续型随机变量及其概率密度连续型随机变量及概率密度定义：如果对于随机变量X的分布函数F(x)，存在非负函数f(x)，使对于任意实数x有 F(x)＝则称X为连续型随机变量，其中函数f(x)称为X的概率密度函数，简称概率密度 ※由数学分析的知识，连续型随机变量的分布函数是连续函数 ※在实际应用中遇到的基本上是离散和连续型随机变量几种提法： X的概率分布：是指分布函数 X为连续型时：是指概率密度 X为离散型时：是指分布律

§2.4 连续型随机变量及其概率密度概率密度函数的性质： 1º 非负性：f(x)0. 由定义可知 2º 规范性：曲线y＝f(x)与Ox轴之间的面积等于1 3º 对任意实数x1，x2 (x1x2)，有P{x1<X≤x2}＝F(x2)－F(x1) ＝概率P{x1<X≤x2}等于区间(x1,x2]上曲线y＝f(x)之下曲边梯形的面积 4º 若f(x)在点x处连续，则有F(x)=f(x) 比右连续强，一般的是右连续）

§2.4 连续型随机变量及其概率密度 a) 一维随机变量的概率密度的线密度含义：由连续性定义，在连续点x处有 f(x)＝＝这正好与物理学中的线密度的定义类似：随机点落在单位区间上概率的大小当∆x充分小时，点x处的曲边梯形可近似为长∆x高f(x)的矩形。即P{x<X≤x＋∆x }≈f(x)∆x，随机变量X落在(x，x＋∆x]的概率近似等于f(x)∆x，忽略了高阶无穷小。

§2.4 连续型随机变量及其概率密度 b) 对于连续型随机变量，单点概率为0 即若X为连续型随机变量，对任意的实数a，有P{X=a }=0 证：显然有包含关系{X=a}{a－∆x<X≤a } ∴0≤P{X=a }≤P{a－∆x<X≤a }=F(a)－F(a－∆x) 而F(x)是连续的（也满足左连续），因为连续型随机变量的分布函数是连续的 ∴当∆x→0时有0P{X=a}≤ 即P{X=a}＝0 要注意几点： 1°只有当X为连续型时，才一定有P{X=a}＝0，否则不一定 2°尽管P{X=a}＝0，但{X=a }不是不可能事件 3°连续型随机变量中区间的端点不影响概率值，即对以下概率不加区分 P{a<X≤b}＝P{a≤X≤b}＝P{a≤X<b}＝P{a<X<b}

§2.4 连续型随机变量及其概率密度例：由分布函数求概率密度设，求f(x) 解：先判断F(x)在区间端点的连续性(是否有阶跃特性)，如果连续则直接对F(x)进行分段求导即可，由于连续型随机变量单点概率为0，不可导的点可直接取右导数即可，也可随意给定

§2.4 连续型随机变量及其概率密度例1：由概率密度求分布函数和概率设随机变量X具有概率密度 (1)确定常数k；(2)求F(x)；(3)求P{1<X≤7/2 } 解： (1) 由规范性得 1= ，解得k＝1/6； (2) 由定义 (3) P{1<X≤7/2 }＝F(7/2)－F(1)＝41/48 或者用性质(3)在区间(1,7/2]上对f(x)积分

§2.4 连续型随机变量及其概率密度三种重要的连续型随机变量 (一)均匀分布概率密度的两个条件显然成立：设连续型随机变量X具有概率密度则称x在区间(a,b)上服从均匀分布.记为X～U(a，b)。例如：电子和量子在一定能级上的运动轨迹数值计算中，研究四舍五入引起的误差。概率密度的两个条件显然成立：非负性成立f(x)0，且规范性：＝1

§2.4 连续型随机变量及其概率密度 X的分布函数： F(x)为f(x)的积分图像均匀分布的含义：代表一种等可能性，即X落在区间(a,b)中任意等长度的子区间内的概率是等可能的，或者说X落在区间(a,b)中的概率只依赖于子区间长度而与子区间位置无关。证：对任意长度为l的子区间(c,c＋l)，a≤c<c＋l≤b，有几何概型

§2.4 连续型随机变量及其概率密度例2：设电阻值R是一个随机变量，均匀分布在900Ω～1100Ω。求R的概率密度及R落在950Ω～1050Ω的概率。X～U(900，1100) 解：首先由题意均匀分布，得到R的概率密度函数为 ∴P{950<R≤1050}= ＝0.5

§2.4 连续型随机变量及其概率密度 Matlab实验均匀分布再MATLAB中的图像 MATLAB为常见自然概率分布提供了下列5类函数 ①概率密度函数（pdf） ②累积分布函数（cdf），即分布函数 ③逆累积分布函数（inv），求随机变量X在概率点处的分布函数反函数值 ④均值与方差计算函数（stat），求给定分布的随机变量X的数学期望E(X)和方差var(X) ⑤随机数生成函数（rnd），模拟生成指定分布的样本数据 (调用格式：x=分布+rnd(分布参数)，如x=normrnd(0,1)) Matlab实验

§2.4 连续型随机变量及其概率密度常见分布的类型名称 Matlab实验分布类型 MATLAB名称正态分布 norm 二项分布 bino 指数分布 exp Poisson分布 poiss 均匀分布 unif 几何分布 geo β分布 beta 超几何分布 hyge Γ分布 gam 离散均匀分布 unid 对数正态分布 logn 连续均匀分布 rayleigh分布 rayl 负二项分布 nbin weibull 分布 weib 2分布 chi2 F分布 f 学生氏t分布 t

§2.4 连续型随机变量及其概率密度 Matlab实验具体函数的命名规则是：函数名＝分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd) 例如，normpdf、normcdf、norminv、normstat和normrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。关于这5类函数的语法，请详见有关书籍快捷的学习可借助MATLAB的系统帮助，通过指令doc获得具体函数的详细信息，语法是 doc <函数名> Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N) 随机变量X在1到N上的N各自然数之间等可能取值在Matlab中输入以下命令： x=1:1:10; y=unidpdf(x,10) 结果：y = 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 x=0:1:10; y=unidcdf(x,10) 结果：y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000 1.0000 Matlab实验

§2.4 连续型随机变量及其概率密度连续均匀分布 Matlab实验例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. 密度函数：f=unifpdf(x,a,b) 分布函数：f=unifcdf(x,a,b) 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. 在Matlab中输入以下命令： x=0:0.01:7; y=unifpdf(x, 2, 5); z=unifcdf(x, 2, 5); plot(x,y,x,z) Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验

§2.4 连续型随机变量及其概率密度 (二)指数分布概率密度的两个条件显然成立： X的分布函数：设连续型随机变量X的概率密度为易知非负性成立f(x)0，且规范性：＝1 X的分布函数：

§2.4 连续型随机变量及其概率密度无记忆性：（指数分布又称“永远年青”的分布）应用：排队论，可靠性理论服从指数分布的X有如下性质：P{X>s+t|X>s}=P{X>t} 证：P{X>s+t|X>s}＝P{X>s+t∩X>s}/P{X>s}=P{X>s+t}/P{X>s} =[1－F(s+t)]/[1－F(s)] ＝e－(s+t)/θ/e－s/θ= e－t/θ = P{X>t} 含义：如果X是某一元件寿命，那么已知元件使用了s小时，它还能再使用t小时（即s+t小时）的条件概率，等于从开始使用时算起它至少能使用t小时的概率。即元件对它使用s小时没有记忆，符合这样数学模型的随机现象有很多。应用：排队论，可靠性理论描述衰老作用不明显的寿命分布； θ为寿命X的平均值衰老作用明显的时候常采用weibull分布

§2.4 连续型随机变量及其概率密度 (2) 指数分布 Matlab实验密度函数：f=exppdf(x,) 分布函数：F=expcdf(x,) 例: 画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20). 在Matlab中输入以下命令： x=0:0.1:5; y=exppdf(x,2); z=expcdf(x,2); plot(x,y,x,z) result1=expcdf(5,2)-expcdf(0,2) result2=expcdf(20,2)-expcdf(0,2) Matlab实验

§2.4 连续型随机变量及其概率密度结果：result1 = 0.91791500137610

§2.4 连续型随机变量及其概率密度 (三)正态分布在自然界中大量的随机现象服从或近似的服从正态分布人的身高、体重；农作物的收获量；测量误差；产品的尺寸、炮弹弾着点、考试成绩器件中的电子热噪声；信道噪声若随机变量 X 受到众多相互独立的随机因素的影响，而每一个别因素的影响都是微小的，且这些影响可以叠加, 则 X 服从正态分布(大量微小的独立的随机因素综合作用的结果(第五章进一步学习)) 这些现象的分布常具有两头小、中间大，呈左右对称的特点，钟型曲线

§2.4 连续型随机变量及其概率密度定义：设连续型随机变量X的概率密度为 f(x)＝，－∞<x<∞ 其中μ，σ(σ>0)为常数，则称X服从参数为μ，σ的正态分布或高斯(Gauss)分布，记为X～N(μ, σ2) 注意，第二个参数是平方的形式 μ，σ的含义在第四章介绍，它们分别是均值和方差的概念此分布的数学表达式最早（1718年）由法国哲学、数学家A.DeMoivre提出，以后由（德）数学家C.F.Gauss（1777～1855年）作了系统研究，故又称de Moivre分布或Gauss分布。

§2.4 连续型随机变量及其概率密度概率密度的两个条件：易知非负性成立f(x)0，现在证规范性：＝1 令t＝(x－μ)/σ，有dt=dx/σ，－∞<t<∞，代入得记 I= 则利用极坐标系将它化成累次积分，dtdu =rdrdθ, 0<r=(t2+u2)1/2<∞, 0<θ<2π得即I=1 于是＝I=1

§2.4 连续型随机变量及其概率密度正态函数的性质：函数曲线的性质 1°对称轴：意义：X落在关于x＝μ对称的两个区间的概率相等曲线关于x＝μ对称，对任意的h>0有 P{μ－h<Xμ}=P{μ<Xμ+h } 函数的对称性即证明，对任意的a有f(μ－a)= f(μ+a) 证明略。意义：X落在关于x＝μ对称的两个区间的概率相等对称轴平移，曲线形状不变。曲线f(x)的位置完全由μ决定，μ称为位置参数

§2.4 连续型随机变量及其概率密度 2°最大值：当x＝μ时取到最大值f(μ)= 3°拐点：上凸和下凹的分界点只需令df(x)/dx=0，可解出x＝μ时取得唯一极值意义：极大值与σ有关，σ越小，最值越大，X落在对称轴附近的概率越大，x离μ越远f(x)的值越小 3°拐点：上凸和下凹的分界点在x＝μ±σ处曲线有拐点。可由df(x)2/dx=0解出。上凸部分增加得慢，下凹部分增加得快 4°渐近线：y＝0（Ox轴）为渐近线，无限接近但不相交由可得由以上性质可见4个特征基本描述了曲线的特征，f(x)的特征均由μ，σ决定

§2.4 连续型随机变量及其概率密度分布函数：不可积标准正态分布：当μ＝0，σ＝1时称X服从标准正态分布，其概率密度和分布函数分别用φ(x)，Φ(x)，记做X～N(0，12) φ(x)＝，－∞<x<∞，Φ(x)＝ Φ(x)是超越积分，为此人们编制了一张Φ(x)函数表，以供查用

§2.4 连续型随机变量及其概率密度 Φ(x)的性质：Φ(－x)＝1－Φ(x) Φ(－x)＝，令t＝－u，Φ(－x)＝＝＝

§2.4 连续型随机变量及其概率密度正态分布随机变量的标准化：线性变换引理：若X～N(μ，σ2)，则Z= ～N(0，1) 随机变量Z是随机变量X的函数，更一般情形留到第五节证：先由分布函数的含义，由X的分布函数求随机变量Z的分布函数 F(z)=P{Zz}= P{ z}＝P{Xμ+σz} 由X的分布函数有＝令＝u，则dt＝σdu，积分换限，而由t＝μ+σu，及t的范围，得出u的范围＝＝Φ(z) 所以Z= ～N(0，1)

§2.4 连续型随机变量及其概率密度对于一般的正态分布随机变量可表示为标准正态分布的形式于是若X～N(μ，σ2)，则其分布函数 F(x)=P{Xx}=P{ }=Φ( ) 而标准正态函数可查表求值对于任意的区间(x1,x2]，有 P{x1<Xx2}= P{ }=Φ( )－Φ( ) 例：设X～N(1，4)，求P{0<X1.6} 解：μ＝1，σ＝2 P{0<X1.6}＝Φ((1.6－1)/2)－Φ((0－1)/2)＝Φ(0.3)－Φ(－0.5) 查表及由标准正态分布函数的性质＝0.6179－[1－Φ(0.5)] ＝0.6179－1＋0.6915＝0.3094

§2.4 连续型随机变量及其概率密度 Matlab实验 (3) 正态分布密度函数：f=normpdf(x,,) 分布函数：F=normcdf(x,,) 例: 画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求P(1<X<6). 在Matlab中输入以下命令： x=-5:0.1:6; y=normpdf(x,1,2); z=normcdf(x,1,2); plot(x,y,x,z) result=normcdf(6,1,2)-normcdf(1,1,2) Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验结果：Result =0.4938

§2.4 连续型随机变量及其概率密度 Matlab实验例：在同一坐标下,画下列正态分布的密度函数图像 (1) μ=3, σ=0.5, 0.7, 1, 1.5, 2 (2) σ=0.5, μ=1,2,3,4 (1)命令： x=-6:0.1:6; y1=normpdf(x,3,0.5); y2=normpdf(x,3,0.7); y3=normpdf(x,3,1); y4=normpdf(x,3,1.5); y5=normpdf(x,3,2); plot(x,y1,‘.’,x,y2,‘+’,x,y3,‘*’,x,y4,‘d’,x,y5) Matlab实验

§2.4 连续型随机变量及其概率密度 3σ准则：尽管正态变量X～N(μ，σ2)的取值范围是(－∞,∞)，但X落在(μ－3σ，μ＋3σ)内几乎是肯定的 1σ: P{μ－σ<Xμ＋σ}＝Φ(1)－Φ(－1)＝0.6826 2σ:P{μ－2σ<Xμ＋2σ}＝Φ(2)－Φ(－2)＝0.9544 3σ:P{μ－3σ<Xμ＋3σ}＝Φ(3)－Φ(－3)＝0.9974 使得正态分布函数值的表只需要做到0到3.49即可，再大都近似为1 企业管理中，经常应用3--规则进行质量检查

§2.4 连续型随机变量及其概率密度解：>> clear,clf %（标准）正态分布密度曲线下的面积 Matlab实验例正态分布参数μ和σ对变量x取值规律的约束——3σ准则解：>> clear,clf %（标准）正态分布密度曲线下的面积 X=linspace(-5,5,100); Y=normpdf(X,0,1); yy=normpdf([-3,-2,-1,0,1,2,3],0,1); plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.') hold on plot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:') plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:') plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7), yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:') Matlab实验

§2.4 连续型随机变量及其概率密度 Matlab实验 hold off text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') text(-3.2,-0.03,'\fontsize{10}μ-3σ') text(-2.2,-0.03,'\fontsize{10}μ-2σ') text(-1.2,-0.03,'\fontsize{10}μ-σ') text(-0.05,-0.03,'\fontsize{10}μ') text(0.8,-0.03,'\fontsize{10}μ+σ') text(1.8,-0.03,'\fontsize{10}μ+2σ') text(2.8,-0.03,'\fontsize{10}μ+3σ') Matlab实验

§2.4 连续型随机变量及其概率密度例3：正态分布随机变量X～N(d，0.52) 解：(1)此时X～N(90，0.52) 若X>80的概率不低于0.99，问d至少为多少？解：(1)此时X～N(90，0.52) P{X<89}=P{(X－90)/0.5<(89-90)/0.5} =Φ((89-90)/0.5)＝Φ(－2)＝1－Φ(2)＝1－0.9772＝0.0228 (2) 0.99P{X80}= P{(X－d)/0.5(80-d)/0.5}=1－Φ((80-d)/0.5) 即Φ((80-d)/0.5)1－0.99=1－Φ(2.327)＝Φ(－2.327) 以上用了反查表：由概率值求自变量取值，且变换为大于0.5的概率值才可查又由分布函数的不减性知 (80-d)/0.5－2.327，故需d>81.1635

§2.4 连续型随机变量及其概率密度关于上α分位点：为了数理统计中的应用而引入设X～N(0，1)，若zα满足条件，P{Xzα}=α，0<α<1，则称点zα为标准正态分布的上α分位点。性质：z1-α＝-zα 注意上α分位点与正态分布函数表的关系

例标准正态分布α分位数的概念图示。解 >> %α分位数示意图（标准正态分布，α=0.05） clear,clf 例标准正态分布α分位数的概念图示。解 >> %α分位数示意图（标准正态分布，α=0.05） clear,clf data=normrnd(0,1,300,1); xalpha1=norminv(0.05,0,1); xalpha2=norminv(0.95,0,1); xalpha3=norminv(0.025,0,1); xalpha4=norminv(0.975,0,1); subplot(3,1,1) capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) subplot(3,1,2) capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) subplot(3,1,3) capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) hold on capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) hold off xalpha1 xalpha2 xalpha3 xalpha4

xalpha1 = -1.6449 xalpha2 = 1.6449 xalpha3 = -1.9600 xalpha4 = 1.9600

§2.4 连续型随机变量及其概率密度对数正态分布一些正偏态资料的变量值，通过对数转换后，由偏态分布转为正态分布。某些正偏态资料，如血铅含量、某些传染病的潜伏期等，经对数变换后可符合正态分布。在金融、工程、医学、生物学等领域有广泛的应用如果 X 是服从正态分布的随机变量，则 eX 服从对数正态分布；同样，如果 Y 服从对数正态分布，则 ln(Y) 服从正态分布。如果一个变量可以看作是许多很小独立因子的乘积（与正态的多个很小独立因子的求和相对应），则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率，它可以看作是每天收益率的乘积。

§2.4 连续型随机变量及其概率密度 函数及其相关的几种重要连续型分布介绍 函数  分布、 分布、Weibull分布 Г函数在概率分布中具有极其重要的地位 Г(s)= ，s>0，这是一个广义积分，不可积重要的性质Г(s＋1)=sГ(s)，Г(1/2)= ，余元公式Г(s)Г(1－s)＝π/sinsπ 当0<s<1时，Г(s)的值可查表求得,

§2.4 连续型随机变量及其概率密度 (1) Г分布 Г分布可记作：X～Г(α, β)，等待第α件事发生所需要的等待时间 fX(x)= α>0,β>0 Г分布的可加性：X～Г(α1,β), Y～Г(α2,β)，X和Y相互独立则Z＝X+Y～Г(α1＋α2,β) 其中α是形状参数，决定曲线形状，β是尺度参数决定曲线的伸缩 Г分布与很多分布都有关系当α =n/2， β =2时， Г分布即为自由度为n的2分布当α =1时， Г分布即为参数为β的指数分布当α =k+1 ， β =1时， Г分布的表达式与泊松分布表达式的形式是一致的，但参数(即x)是连续的

§2.4 连续型随机变量及其概率密度 (2) β分布 β分布定义在区间(0, 1)，可记作：X～Beta(α, β) α>0,β>0 β分布与贝叶斯理论有联系，常用来描述取值在(0, 1)的概率模式，比如描述由后验概率来查看抛硬币中使用硬币的不均匀度(正反面可能不是等概出现) 当α =1， β =1时， β分布就是U(0, 1) 期望等于α /(α+β)

§2.4 连续型随机变量及其概率密度 Beta分布的曲线

§2.4 连续型随机变量及其概率密度 (3) 韦布尔分布(Weibull分布) Weib(α, , b)分布:它是可靠性工程中广泛使用的一种连续性分布，常用来描述各种产品、材料疲劳失效的分布规律，如真空管的疲劳失效、机械轴承的疲劳失效等，该分布为三参数分布，其中α为形态参数，β为尺度参数，b为位置参数。当α=1，α＞1，α＜1时分别对应了某些产品（或材料）的偶发期故障(正常随机故障)、耗损期故障(老化严重故障多发期)和早发故障(新设备投入运行)三种形态的失效分布。考虑损耗衰老作用时比指数分布更准确该分布由瑞典数学家W.Weibull是在对双参数指数分布 E1(1,b) 和Ray()的研究基础上综合推广而成。该分布同样在无线电信号分析和元器件可靠性分析中有重要应用

§2.4 连续型随机变量及其概率密度概率密度表达式 xb, b0, m为正整数令=α，带入则可得到概率密度的另一种表达式当α=1时， Weib(1,,b)即双参数指数分布 E1(,b) 从上面的描述可知，指数分布只适用于浴盆曲线(指产品从投入到报废为止的整个寿命周期内)的底部，但任何产品都有早期故障，也总有耗损失效期。在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况

§2.5 随机变量的函数的分布实际应用中，某些人们关心的随机变量Y往往不能直接测量得到，而它可能是某个能测量的随机变量的函数X 问题：比如我们有时很关心圆柱轴截面的面积S，但无法直接获得，而我们能够获得圆柱轴截面的直径D，而随机变量S是随机变量D的函数，即S=(1/4)πD2 问题：怎样由已知的随机变量X的概率分布求它的函数Y=g(X)的概率分布，其中g(•)是连续函数? 一般的步骤是什么？

§2.5 随机变量的函数的分布例1：设随机变量X具有以下的分布律，试求Y=(X－1)2的分布律解：首先获得Y的所有可能取值：0，1，4 pk 0.2 0.3 0.1 0.4 解：首先获得Y的所有可能取值：0，1，4 求解各取值的概率 P{Y=0}＝P{(X－1)2=0}= P{X=1}=0.1 P{Y=1}＝P{(X－1)2=1}= P{(X=0}+P{X=2}=0.7 P{Y=4}＝P{(X－1)2=4}= P{(X=－1}=0.2 即得Y的分布律为 Y 0 1 4 pk 0.1 0.7 0.2 对于离散型随机变量 P{Y=yk}等于所有满足yk＝g(X)的X的取值的概率之和

§2.5 随机变量的函数的分布例2：设随机变量X具有概率密度求随机变量Y=2X+8的概率密度解：分别记X,Y的分布函数为FX(x)，FY(y)，先求Y的分布函数FY(y) FY(y)＝P{Yy} //由分布函数的含义将Y=2X+8代入＝P{2X＋8y} 表示为关于X的概率＝P{X(y－8)/2} 即＝FX((y－8)/2) 将FY(y)关于y求导得 fY(y)=dFY(y)/dy=dFX((y－8)/2)/dy = fX((y－8)/2)d((y－8)/2)/dy = 注意：代入时， fX的自变量及分段函数取值范围用g－1(y)来代

§2.5 随机变量的函数的分布求连续型随机变量X的函数Y=g(X)的概率密度的一般步骤：已知fX(x)，Y=g(X)，求fY(y) 1°先写出Y的分布函数定义式：FY(y)＝P{Yy} 由Y=g(X)确定Y的值域，当y不在值域范围内时单独讨论 fY(y) 2°将Y=g(X)代入上式＝P{g(X)y} //在y的值域范围内讨论 3°由g(X)y求解X的范围＝P{X|g(X)y} 表示为y的形式 4°由X的分布函数FX(x)表示以上概率，得到关于y的表达式FY(y)，其中FX(x)的自变量x用关于y的表达式来代。 5°求导得fY(y)＝dFY(y)/dy，将fY(y)的所有可能的情况合并掌握变上下限积分求导公式

§2.5 随机变量的函数的分布例3：设随机变量X具有概率密度fX(x)，－∞<x<∞，求Y=X2的概率密度解：1°FY(y)＝P{Yy}，由Y=X20，当y0时，FY(y)＝0 2°当y>0时，代入Y=X2得 FY(y)＝P{Yy}＝P{ X2y} 3° ＝P{ } 4°由FX(x)得 FY(y)＝ 5°fY(y)＝dF(y)/dy＝

§2.5 随机变量的函数的分布在Y=g(X)，且g(X)为严格单调函数时的一般结果定理：设随机变量X具有概率密度fX(x)，－∞<x<∞，又设函数g(x)处处可导且恒有g(x)>0(或g(x)<0)，则Y= g(X)是连续型随机变量，其概率密度为其中α＝min{g(－∞)，g(∞)}， β＝max{g(－∞)，g(∞)}， h(y)是g(x)的反函数

§2.5 随机变量的函数的分布证：g(x)>0的情况 FY(y)＝P{Yy}＝P{g(X)y} 此时g(x)为单调增函数，所以h(y)也是单调增函数，且有y的取值范围为 α＝g(－∞)yg(∞)＝β，因此当yα时，FY(y)＝0；当yβ时，FY(y)＝1 当 αyβ时，FY(y)＝P{Yy}＝P{g(X)y} h(y)是单调增函数＝P{Xh(y)} ＝ FX(h(y)) 求导fY(y)＝dFY(y)/dy＝dFX(h(y))/dy＝ g(x)<0的情况，此时h(y)<0 P{g(X)y}=P{Xh(y)}=1－FX(h(y)) fY(y)＝dF(y)/dy＝d[1－FX(h(y))]/dy＝两种情况合并即可得证

§2.5 随机变量的函数的分布推广分段单调函数的情况下，上述定理可进一步推广为下面形式若fX(x)在有限区间[a,b]以外等于0，则只需假设在[a,b]上恒有g(x)>0(或g(x)<0)，α＝min{g(a)，g(b)}，β＝max{g(a)，g(b)}，以上结论还成立分段单调函数的情况下，上述定理可进一步推广为下面形式假设g(x)在下面两个区间(a1,b1)和(a2,b2)分别是单调的函数，其中在(a1,b1)上的反函数为h1(y)，在(a2,b2) 上的反函数为h2(y)，且fX(x)在其它有限区间等于0，则有 fY(y)＝其中y的范围由g(x)确定可参考教材中Y=X2的求解过程

§2.5 随机变量的函数的分布例4：正态分布的随机变量的线性变换问题证：X的概率密度为所以有已知随机变量X～N(μ，σ2)，试证明X的线性函数Y=aX+b(a≠0)也服从正态分布。证：X的概率密度为 f(x)＝，－∞<x<∞ 现在y＝g(x)=ax+b，由这一式子解得x＝h(y)=(y-b)/a，且有h(y)＝1/a 显然g(x)是严格单调的，由定理有 fY(y)＝，－∞<y<∞ ＝＝，－∞<y<∞ 所以有 Y= aX+b～N(aμ＋b，(aσ)2) 特别的当a＝1/σ，b＝－μ/σ时，Y=(X－μ)/σ=～N(0，1) 即上一节的引理的结果

§2.5 随机变量的函数的分布思考：设f(x)是连续函数，若X是离散型随机变量，则Y= f(x),也是离散型随机变量吗？若X为连续型又如何？若X是离散型随机变量，它的取值是有限个或可列无限多个，因此Y的取值也是有限个或可列无限多个，因此Y是离散型随机变量若X是连续型随机变量，则Y不一定是连续型随机变量，比如：

本章小结

作业第一次：第二次：第三次： P55：2，4，5，8 P56：10，12，13， 17，21，24，26，29

Matlab实验作业 1. 已知二项分布Xb(18,0.2) 求: (1) 分布率和分布函数值，并画出曲线 (2) 求该分布的数学期望和方差 (3) 计算分布函数值为0.1,0.4,0.7时对应的x值 2. 对于正态分布： (1)给出N(2，9)的密度曲线和分布函数曲线 (2)在同一图上划出均值为2，标准差为0.5,0.7,1,2的密度曲线 (3)已知=0.05，求N(0，1)的上分位点，并与查表值比较.