第二章 随机变量及其分布 在第一章里,我们研究了随机事件及其概率.而对于一个随机试验,我们除了对某些特定的事件发生的概率感兴趣外,往往还会关心某个与试验结果相联系的变量.由于这一变量依赖于试验结果,因而这一变量的取值具有随机性,这种变量被称为随机变量.本章将着重介绍两类随机变量——离散型随机变量和连续型随机变量及其分布.

Slides:



Advertisements
Similar presentations
随机变量及其概率分布 第二章 离散型随机变量及其分布律 正态分布 连续型随机变量及其分布律 随机变量函数的分布.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第三章 函数逼近 — 最佳平方逼近.
第四节 对数留数与辐角原理 一、对数留数 二、辐角原理 三、路西定理 四、小结与思考.
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
数 学 分 析 第九章 定积分 第二节 微积分学基本公式 主讲:师建国.
定积分性质和微积分学基本定理 一、 定积分性质 二、 变上限积分函数 三、 定积分基本公式.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第四章 一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
离散型随机变量.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
难点:连续变量函数分布与二维连续变量分布
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
三角 三角 三角 函数 余弦函数的图象和性质.
§4.1数学期望.
Presentation transcript:

第二章 随机变量及其分布 在第一章里,我们研究了随机事件及其概率.而对于一个随机试验,我们除了对某些特定的事件发生的概率感兴趣外,往往还会关心某个与试验结果相联系的变量.由于这一变量依赖于试验结果,因而这一变量的取值具有随机性,这种变量被称为随机变量.本章将着重介绍两类随机变量——离散型随机变量和连续型随机变量及其分布.

§2、1 随机变量 2、1、1 随机变量的定义 在上一章中,我们研究了随机事件与概率的一些基本概念和理论。为了更深入地研究随机试验的结果,揭示其相应的随机现象的统计规律性,从本章起,我们将引进随机变量的概念。其基本想法是把随机试验的结果数量化,即用一个变量X 来描述试验的结果。先看下面的例子。

例1 投掷一枚硬币,观察出现正反面的情形。试验有两个可能结果: — 出现正面 — 出现反面 我们引入一个变量如下: 这个变量可以看作是定义在样本空间

上的函数,称其为随机变量。实际上此变量是依试验结果的不同而随机地取值1或0。 例2 掷一枚骰子面上出现的点数。 这个试验结果本身就是一个数.(与数值有关) 我们引入一个变量 当 时, ,这里 是随机变量,

它是依试验结果的不同而随机地取值1,2,3,4,5,6。 类似的例子: 七月份武汉的最高温度; 每天从汉口火车站下火车的人数; 昆虫的产卵数;

正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系. 在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化. 正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.

定义 设随机试验为 ,其样本空间为 如果对于每个 ,都有一个实数 和它对应,于是就得到一个定义在 上的实值单值函数 ,称 为随机变量。

随机变量通常用大写字母 X,Y,Z或希腊字母ζ,η等表示 而表示随机变量所取的值 时,一般采用小写字母x,y,z等.

例如,从某一学校随机选一学生,测量他的身高. 我们可以把可能的身高看作随机变量X, 然后我们可以提出关于X 的各种问题. 如 P(X>1.7)=? P(X≤1.5)=? P(1.5<X<1.7)=?

随机变量与随机事件的关系 对所考察的随机现象,当引入随机变量以后,随机事件即可用随机变量满足某关系式来描述,反之,给出随机变量X满足某关系式,它将表达随机现象中的某个事件。 比如:例1中, 表示该试验中“正面朝上”事件。 表示该试验中“反面朝上”事件。 例2中,事件{点数不少于3次}可表示为

2、1、2 随机变量的分类 通常分为两类: 离散型随机变量 随机变量 连续型随机变量 所有取值可以逐个 一一列举 全部可能取值不仅 无穷多,而且还不 能一一列举,而是 充满一个区间. 连续型随机变量

随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究。 这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处,但因其取值方式不同,又有其各自的特点。 学习时请注意它们各自的特点和描述方法。

§2、2 离散型随机变量 2、2、1 离散型随机变量 如果随机变量的取值是有限个或可数个(即能与自然数的集合一一对应),则称该变量为离散型随机变量。 为了描述随机变量 X ,我们不仅需要知道随机变量X的所有可能取值,而且还应知道X 取每个值的概率.为此我们有以下定义:

定义2、2、1 设X是一个离散型随机变量,它可能取值为 并且取各个值的对应概率为 即 则称上式为离散型随机变量X的概率分布,又称分布密度或分布列。 其中 且 反过来,假如有一列数 满足

且 则该数列可以定义为某离散型随机变量的分布列。 分布列也可以通过列表表示: 其中第一行表示随机变量所有可能的取值,第二行表示这些取值所对应的概率。

2、2、2 退化分布 在所有的分布中,最简单的分布是退化分布 定义2、2、2 如果一个随机变量X以概率1取某 一常数,即 2、2、2 退化分布 在所有的分布中,最简单的分布是退化分布 定义2、2、2 如果一个随机变量X以概率1取某 一常数,即 (其中a R) 则称X服从a处的退化分布(或单点分布).

2、2、3 两点分布 定义2、2、3 随机变量X只取两个值 和 ,并且已知 称这种只取两个值的分布为两点分布。 特别:若 2、2、3 两点分布 随机变量X只取两个值 和 ,并且已知 定义2、2、3 称这种只取两个值的分布为两点分布。 特别:若 则称这种分布为(0-1)分布。其分布列为: 0 1

2、2、4 二项分布 定义2、2、4 在独立试验概型中,重复进行n次试验时A发生k次的概率已知为: 如果用随机变量 表示 发生的次数,则 的 2、2、4 二项分布 定义2、2、4 在独立试验概型中,重复进行n次试验时A发生k次的概率已知为: 如果用随机变量 表示 发生的次数,则 的 可能取值为: 相应的分布列为: 容易验证:

这种分布称为二项分布,又称Y服从参数为 和 的二项分布,记为: 例1 在事件A 发生概率为 的贝努利试验中,如果用 表示事件A 首次发生时的试验次数,则 为一随机变量,可能的取值为: 如果A在第 次发生,则前 次 都是 发生,从而 的概率为: 称 服从参数为 的几何分布。

2、2、5 泊松分布 定义2、2、5 设随机变量X的分布列为: 试确定常数a . 解: 依据分布列的性质: 且 从而 解得 2、2、5 泊松分布 定义2、2、5 设随机变量X的分布列为: 试确定常数a . 解: 依据分布列的性质: 且 从而 解得 这个分布称为泊松(Poisson)分布.

泊松分布的应用是相当广泛的,比如电信传呼台每天接受到的传呼次数,某繁华交叉街口每小时经过的车辆数等都服从泊松分布 ,而且由下面定理可以看到二项分布与泊松分布有着密切的联系。 泊松定理 在二项分布 中,如果 是常数),则成立

例2 某种药品的过敏反应率为 ,今有20000人使用此药品,求20000人中发生过敏反应的人数不超过3的概率。 解 以 表示20000人中发生过敏反应的人数,则 服从二项分布 ,所求的概率为:

如果利用近似公式 计算,可以得到: ,且 比较两个结果可以看到,近似程度是很高的。

例3 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布. P(X =0)=(0.1)(0.1)=0.01 P(X =1)= 2(0.9)(0.1) =0.18 P(X =2)=(0.9)(0.9)=0.81 且 P(X =0)+ P(X =1)+ P(X =2)=1

例4 某射手连续向一目标射击,直到命中为止,已知他每发命中的概率是p,求所需射击发数X的概率函数分布列. 设 = {第 发命中}, , 于是

类似地,有 这就是求所需射击发数X的分布列. 这一节,我们介绍了离散型随机变量及其概率分布. 对于离散型随机变量,如果知道了它的概率函数,也就知道了该随机变量取值的概率规律.下一节,我们将介绍连续型随机变量。

§2、3 随机变量的分布函数 2、3、1 分布函数的定义 §2、3 随机变量的分布函数 2、3、1 分布函数的定义 为了对离散型的和连续型的随机变量以及更广泛类型的随机变量给出一种统一的描述方法,我们引进了分布函数的概念. 定义:设 是一个随机变量,对任意的实数 ,随机变量 取值落入区间 内的概率为

称 为随机变量 的分布函数. 显然,对任意 从而,只要知道了随机变量X的分布函数,它的统计特性就可以得到全面的描述.

分布函数的性质: 即 是右连续的。

如果一个函数具有上述性质,则一定是某个随机变量X的分布函数。也就是说,前面三个性质是鉴别一个函数是否是某随机变量的分布函数的充分必要条件。

2、3、2 离散型随机变量的分布函数 设离散型随机变量X 的分布律是 则 。 由于 是X 取 的诸值 的概率之和,故又称 为累积概率函数. 则 。 由于 是X 取 的诸值 的概率之和,故又称 为累积概率函数. 离散型随机变量分布函数的计算举例:

例 求 。 解 由定义 当 时, 故 当 时, 当 时, 当 时,

故 注意右连续 下面我们从图形上来看一看。 不难看出, 的图形是阶梯状的图形, 在 处有跳跃,其跃度分别等于

分布函数图 概率函数图

§2、4 连续性随机变量 2、4、1 连续型随机变量的概率分布 §2、4 连续性随机变量 2、4、1 连续型随机变量的概率分布 定义2、4、1 设 是随机变量 的分布函数如果存在一非负函数 ,使对任意实数 有 则称 为连续型随机变量, 为 的概率密度函数,简称概率密度。 由定义可知,连续型随机变量的分布函数是连续函数,是密度函数的可变上限的定积分.

由上式可得,在 的连续点, 概率密度函数的性质: 这两条性质是判定一个函数 是否为某连续型随机变量的概率密度函数的充要条件。 利用以上关系可以推得,随机变量 落入某有限区间 内的概率为

它是以 为底,以曲线 为顶的曲边梯形的面积。 类似可得 取值落入 内的概率为: 需要指出的是: 连续型随机变量取任一指定值的概率为0,即:

为任一指定值这是因为: 从而知, (1) 对连续型随机变量X ,有 (2) 由 可推知

而 并非不可能事件, 并非必然事件。可见, 由 不能推出 由 不能推出 o 面积为1

2、4、2 均匀分布 由于连续型随机变量唯一被它的密度函数所确定。所以,若已知密度函数,该连续型随机变量的规律就得到了全面描述. 下面给出几个连续型随机变量的常用分布 2、4、2 均匀分布 定义2、4、2 若随机变量X取值在区间 上,并且取每一点的可能性是相同的,则称X服从区间 上的均匀分布,记作: 写出它的分布函数及概率密度函数。

由几何概率的定义容易得到 的分布函数为 从而概率密度为:

2、4、3 指数分布 则称X 服从参数为 的指数分布。 常简记为: 容易看出: 且 所以 确是一概率密度。 所以 确是一概率密度。 指数分布常用于可靠性统计研究中,如元件的寿命.

例1 对服从参数为0.015的指数分布的变量X,试计算: (2)若要求P(X >x) <0.1,问x应在什么范围内? 解 (1)由指数分布的定义可得

(2) 若要求 即 指数分布经常被用来近似描述各种“寿命”分布,如无线电元件的寿命,动物的寿命,电话问题中的通话时间,传呼台首次传呼来到的时刻,随机服务系统中的服务时间等都假定是服从指数分布的。

例2设 求 。 由于 是分段表 达的,求 时 注意分段求. 解 由定义

即 例3 设随机变量X 的分布函数为 求X取值在区间(0.3,0.7)的概率及概率密度。

解: 要注意的是,密度函数 在某点 处的高度,并不反映X取值的概率。 但是这个高度越大,则X取 附近的值的概率就越大。 也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度。

2、4、4 正态分布 正态分布是应用最广泛的一种连续型分布。德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面。正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布。 在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成

男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布。 (1)正态分布的定义及图形特点 定义2、4、4 若随机变量X的概率密度为 其中 和 都是常数, 任意, ,则称

X服从参数为 和 的正态分布。 记作: 可以证 证明: 作变量代换 左边

化为极坐标 其中 正态分布 的图形:

正态分布的密度曲线是一条关于 对称的钟形曲线。特点是“两头小,中间大,左右对称”。 决定了图形的中心位置, 决定了图形中峰的陡峭程度。

其分布函数是: (2)标准正态分布 的正态分布称为标准正态分布. 其密度函数和分布函数常用 和 表示:

标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布. ,则 设 定理2、4、1 根据定理,只要将标准正态分布的分布函数

制成表,就可以解决一般正态分布的概率问题。 书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表。 若 若

(3) 3 准则 由标准正态分布的查表计算可以求得, 当 时, 这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.

将上述结论推广到一般的正态分布, 当 时, 可以认为,Y 的取值几乎全部集中在 区间内。 这在统计学上称作“3 准则”(三倍标准差原则)。

例1 设 ,计算: 解

例2 设 ,计算: 解

例3 假设某种电池寿命(单位:小时)为一随机变量,它服从参数为300和352的正态分布,计算: 这种电池寿命在250小时以上的概率; 确定数字 ,使电池寿命落在区间 内的概率不低于 。 解 设电池的寿命为 ,则

由 可得 利用分布函数的单调不减性,查表可得: 电池寿命落在区间[242.5,357.5]内的概率不低于 。

(4)以下介绍关于概率分布的分位数的概念 设随机变量X的分布函数为F ( x ),对于给定的正数 p(0< p <1)若数xp满足 则称数xp为此概率分布的 p 分位数。

标准正态分布 的p分位数 是指满足 即 的数 ,其值可由正态分布表查得,如图5—6 所示。 图5—6

§2、5 随机变量函数的分布 2、5、1 离散型随机变量函数的分布 §2、5 随机变量函数的分布 一般来讲,若 是一随机变量, 是 的某函数 ,由于 的取值会随 的变化而变化,从而 也是一个随机变量,也需要研究它的分布情况,下面我们分几种情况进行讨论。 2、5、1 离散型随机变量函数的分布

假设 是一维离散型随机变量, ,则 也是一离散型随机变量。如果已知 的分布列为: 则 的分布列容易得到:

应当注意的是有些 可能会相等,要在分布列中将其对应的概率相加合并成一项。 例1 设 的分布列为: 求下列各函数的分布列:

解 将 的分布列中两行对调可以算的下表: 的分布列:

的分布列: 的分布列:

(注:使反函数无意义的 ,定义概率密度为0) 2、5、2 连续型随机变量函数的分布 对于连续型随机变量的函数,有下列定理: ,且 是严格单调函数,其反函数 有连续的导数。则 也是连续型随机变量,且 的概率密度为 定理 设连续型随机变量 的概率密度为 (注:使反函数无意义的 ,定义概率密度为0)

例2 设连续型随机变量 的概率密度为 ,求 的概率密度。 为单调函数,反函数为 解 且 ,由定理可得 的 密度函数为 。 即若 将此结论用于正态分布的情形, ,则 的概率密度为

即 服从正态分布 ,所以正 态随机变量的线性函数仍是正态的。 特别地,若令 ,则 服从标准 正态分布 。 对一般的连续型随机变量函数,不一定

满足单调性的条件,上述定理不能直接引用。 例3 设随机变量 ,试求下列函数的概率密度。 是单调增加的函数,且 反函数为 解 从而 当 时, 无意义,概率密度 ; 当 时,由定理可得概率密度为

从而 的概率密度为 不是单调函数,按分布函数的定义 当 时, 的分布函数 ; 当 时,

由此可得 的概率密度为