Presentation is loading. Please wait.

Presentation is loading. Please wait.

第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则

Similar presentations


Presentation on theme: "第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则"— Presentation transcript:

1 第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则
第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则 (3)熟悉定义和解释随机变量及其分布 (4)掌握离散型随机变量的概率分布和概率计算 (5)掌握连续型随机变量的概率分布和概率计算

2 第一节 事件与概率 一、事件 (一)必然现象与随机现象
必然现象:在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生的,这类现象称为必然现象或确定性现象。 随机现象:在保持条件不变的情况下,重复进行试验,其结果未必相同。这类在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象或不确定性现象。

3 (二)随机试验与随机事件 1、试验及随机实验 实验:通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或实验统称为试验(trial)。如: 掷一颗骰子,观察其出现的点数; 随机试验:如果一个试验满足下述三个特性,则称其为随机试验,简称为试验。 (1)试验可以在相同条件下多次重复进行; (2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果; (3)每次 试验总是恰好出现这些可能结果中的一个 ,但一次试验之前却不能肯定这次试验会出现哪一个结果。

4 2、样本空间与样本点 样本空间(sample Space):一个试验中所有结果的集合,称为样本空间。用表示。例如: 在掷一颗骰子的试验中,样本空间表示为: {1,2,3,4,5,6} 样本点( sample point):样本空间中每一个特定的试验结果称为样本点。用符号表示。

5 (1)事件:试验的每一个可能结果(任何样本点集合)。例如:掷一颗骰子出现的点数为3。
3、事件及随机事件 (1)事件:试验的每一个可能结果(任何样本点集合)。例如:掷一颗骰子出现的点数为3。 事件用大写字母A,B,C,…,表示。 (2)随机事件(random event):每次随机试验可能出现也可能不出现的事件,或随机实验的结果,称为随机事件,简称 事 件(event),通常用A、B、C等来表示。 (3)必然事件,我们把在一定条件下必然会发生的事件称为必然事件,用Ω表示。例如:掷一颗骰子出现的点数小于7 (4)不可能事件:我们把在一定条件下不可能发生的事件称为不可能事件,用ф表示。

6 二 、概率 (一)概率的定义 1、概率的统计定义
在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。这样定义的概率又称为统计概率。 在一般情况下,通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即:

7 2、概率的古典定义 很多随机试验具有以下特征: ⑴ 试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个; ⑵ 各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的; ⑶ 试验的所有可能结果两两互不相容。 具有上述特征的随机试验,称为古典概型。古典概型概率的定义如下: 设样本空间由 n 个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即 P(A)=m/n

8 3、几何定义 对于一个随机试验,我们将每个基本事件理解为从某个特定的几何区域内随机地取一点,该区域中每一个点被取到的机会都一样;而一个随机事件的发生则理解为恰好取到中述区域内的某个指定区域中的点。这里的区域可以是线段,平面图形,立体图形等。用这种方法处理随机试验,称为几何概型。即当随机试验的样本空间是某一可度量的区域,并且任意一点落在度量(长度、面积与体积)相同的子区域内是等可能的,则事件A的概率定义为: 古典概型与几何概型的主要区别在于:几何概型是另一类等可能概型,它与古典概型的区别在于试验的结果不是有限个。

9 (二)概率的性质 根据概率的定义,概率有如下基本性质: 1、对于任何事件A,有; 2、必然事件的概率为1,即P(Ω)=1; 3、不可能事件的概率为0,即P(ф)=0。

10 (三)小概率事件实际不可能性原理 随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0. 05、0
(三)小概率事件实际不可能性原理 随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。 在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。 小概率事件实际不可能性原理是统计学上进行假设检验的基本依据。

11 第二节 概率分布 一、随机变量及分布函数 (1)随机变量:
作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。变量x称随机变量。 离散型随机变量:如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量 。离散型随机变量有以下特点: ① 随机变量 X 取有限个值或所有取值都可以逐个列举出来 ② 以确定的概率取这些不同的值。

12 连续型随机变量:如果表示试验结果的变量X,其可能取值为某范围内的任何数值,且X在其取值范围内的任一区间中取值时,其概率是确定的,则称X为连续型随机变量。连续型随机变量有以下特点:
① 可以取一个或多个区间中任何值; ② 所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点。

13 (2)分布函数 引入随机变量的概念后,对随机试验的概率分布的研究就转为对随机变量概率分布的研究了。与确定性变量研究不同之处在于,描述一个随机变量,不仅要说明它能够取那些值,而且还要关心它取这些值的概率,因此需要引入随机变量的分布函数的概念。 分布函数概念:设X是一个随机变量,对任意实数x,令: 则称F(x)为随机变量X的分布函数,也称为概率累积函数。从直观上看,分布函数F(x)是一个定义在(﹣∞ ,﹢∞ )上的实值函数, F(x)在点x取值为随机变量X落在区间(﹣∞,x ] 上的概率。

14 二、离散型随机变量的概率分布 (一)离散型随机变量的分布律及分布函数
要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。 如果我们将离散型随机变量x的一切可能取值xi (i=1,2,…),及其对应的概率pi,记作: P(x=xi)=pi i=1,2,… 则称上式为离散型随机变量x的分布律,也称概率函数。 常用下表形式表示离散型随机变量分布律 :

15 常用下表形式表示离散型随机变量分布律 : 显然离散型随机变量的概率分布具有pi≥0和Σpi=1这两个基本性质。离散型随机变量的分布函数为:

16 (二)离散型随机变量的数学期望和方差 1、数学期望(expected value) 离散型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和称为其数学期望,记为 或E(X),是对离散型随机变量取值集中程度的度量。 计算公式为: 2、离散型随机变量的方差(variance) 离散型随机变量X的每一个取值与期望值的离差平方和的数学期望,记为 2 或D(X),是对离散型随机变量取值的分散程度的度量。

17 三、连续型随机变量的概率分布 (一)连续型随机变量的概率密度函数及分布函数
连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。需要用概率密度函数来表示。 对于随机变量X,如果存在一个定义在(﹣∞ ,﹢∞ )上的非负函数f(x),使得对于任意实数x,总有: 则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度。

18 (1)分布密度函数总是大于或等于0,即f(x)≥0; (2)当随机变量x取某一特定值时,其概率等于0;即 (c为任意实数)
连续型随机变量概率分布还具有以下性质: (1)分布密度函数总是大于或等于0,即f(x)≥0; (2)当随机变量x取某一特定值时,其概率等于0;即 (c为任意实数) 因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率。 (3)在一次试验中随机变量x之取值必在-∞<x<+∞范围内,为一必然事件。

19 (二)连续型随机变量的期望和方差 1、连续型随机变量的数学期望 2、方差 标准差记为 或

20 第三节 常用离散型概率分布 一、二项分布 (一)贝努利试验及其概率分布
对于n次独立的试验,如果每次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征。在每次试验“成功”的概率是常数p(0<p<1),失败的概率为是1-p=q,试验是相互独立的,并可以重复进行n次,在n次试验中,“成功”的次数对应一个离散型随机变量X。则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验。

21 一般,在n重贝努利试验中,事件A恰好发生k(0≤k≤n)次的概率为
若把该式与二项展开式 相比较就可以发现,在n重贝努利试验中,事件A发生k次的概率恰好等于 展开式中的第k+1项,所以也把=称作二项概率公式。

22 (二)二项分布的意义 1、二项分布定义 设随机变量x所有可能取的值为零和正整数:0,1,2,…,n,且有 其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的二项分布 ,记为 x~B(n, p)。

23 2、二项分布由n和p两个参数决定 (1)当p值较小且n不大时,分布是偏倚的。但随着n的增大 ,分布逐渐趋于对称; (2)当p值趋于0.5时,分布趋于对称; (3)对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降。 此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当n→∞时,二项分布的极限分布是正态分布。

24 (三)二项分布的概率计算及应用条件 二项分布的应用条件有以下三条: (1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料; (2)已知发生某一结果(如死亡) 的概率为p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值; (3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。

25 则7头愈好,3头死去的概率为: 8头愈好,2头死去的概率为:
【例题】 某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少? 则7头愈好,3头死去的概率为: 8头愈好,2头死去的概率为:

26 (四)二项分布的平均数与标准差 前面已经指出二项分布由两个参数n和p决定。统计学证明,服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系: 1、当试验结果以事件A发生次数k表示时 2、当试验结果以事件发生的频率k/n表示时

27 波松分布可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。
二、波松分布 (一)波松分布的意义 泊松分布:1837年法国数学家泊松首次提出。用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布。 泊松分布的例子: 一定时间段内,某航空公司接到的订票电话数 一定时间内,到车站等候公共汽车的人数 一定时间段内,放射性物质放射的粒子数 一匹布上发现的疵点个数 波松分布可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。

28 则称X服从参数为λ 的泊松分布,记为: X~P (λ )。
λ=2.5、5、10时Poisson分布的概率函数折线图

29 (二)泊松分布的数学期望和方差 数学期望 E ( X ) =  方差 D ( X ) = 
【例】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少? 解:设X=10分钟内航空公司预订票处接到的电话次数

30 当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即
(三)泊松分布作为二项分布的近似 当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即 实际应用中,P0.05,n>20,np5时,近似效果良好。 λ是波松分布所依赖的唯一参数。λ值愈小分布愈偏倚,随着λ的增大,分布趋于对称。当λ=20时分布接近于正态分布;当λ=50时,可以认为波松分布呈正态分布。所以在实际工作中,当λ≥20时就可以用正态分布来近似地处理波松分布的问题。

31 第四节 常用连续型概率分布 1、连续型随机变量可以取某一区间或整个实数轴上的任意一个值; 2、它取任何一个特定的值的概率都等于0;
第四节 常用连续型概率分布 1、连续型随机变量可以取某一区间或整个实数轴上的任意一个值; 2、它取任何一个特定的值的概率都等于0; 3、不能列出每一个值及其相应的概率; 4、通常研究它取某一区间值的概率; 5、用概率密度函数的形式和分布函数的形式来描述。

32 一、正态分布 由高斯作为描述误差相对频数分布的模型而提出; 描述连续型随机变量的最重要的分布; 许多现象都可以由正态分布来描述; 可用于近似离散型随机变量的分布,如: 二项分布; 经典统计推断的基础。
x f (x)

33 (一)正态分布的定义及特征 1、正态分布的定义 若连续型随机变量X的概率分布密度函数为 其中μ为平均数,σ2为方差,称随机变量X服从正态分布, 记为x~N(μ,σ2)。相应的概率分布函数为:

34 2、正态分布的特征 ⑴ 密度曲线是单峰、对称的悬钟形曲线,对称轴为x=μ; ⑵ f(x)在x=μ处达到极大,极大值 ;
⑸ 正态分布有两个参数,即平均数μ和标准差σ。μ是位置参数,σ是变异度参数; ⑹ 分布密度曲线与横轴所夹的面积为1。

35 (二)标准正态分布 正态分布是依赖于参数μ和σ2(或σ)的一簇分布, 正态曲线之位置及形态随μ和σ2的不同而不同。
我们称μ=0,σ2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及分布函数分别记作ψ(u)和Φ(u)。 随机变量u服从标准正态分布,记作u~N(0,1)。

36 对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换: u=(x-μ)/σ 将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差 按标准正态分布,对不同的u值编成函数表,称为正态分布表,见附表1,从中可查到u在意一个区间内取值的概率。这就给解决不同μ、σ 2的正态分布概率计算问题带来很大方便。

37 设u服从标准正态分布,则u在[u1,u2]内取值的概率为:
(三)正态分布的概率计算 1、标准正态分布的概率计算 设u服从标准正态分布,则u在[u1,u2]内取值的概率为: 而Φ(u1)与Φ(u2)可由附表1查得。 【例】 已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =? 解:利用标准正态分布公式,查附表1得: (1) P(u<-1.64)= (2) P (u≥2.58)=Φ(-2.58)= (3) P (|u|≥2.56)=2Φ(-2.56)=2× = (4) P (0.34≤u<1.53)=Φ(1.53)-Φ(0.34)= =

38 2、一般正态分布的概率计算 对一般正态分布公式作变换u=(x-μ)/σ,得dx=σdu,故有 其中, 表明服从正态分布N(μ,σ2)的随机变量x在[x1,x2)内取值的概率,等于服从标准正态分布的随机变量u在[(x1-μ)/σ, (x2-μ)/σ)内取值的概率。因此,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。

39 【例】 设x服从μ=30.26,σ2=5.102的正态分布,试求P(21.64≤x<32.98)。
解: 令 则u服从标准正态分布,故

40 前面讨论的三个重要的概率分布中,前两个属离散型随机变量的概率 分布,后一个属连续型随机变量的概率分布。三者间的关系如下:
对于二项分布,在n→∞,p→0,且n p =λ(较小常数)情况下,二项分布 趋于波松布。在这种场合,波松分布中的参数λ用二项分布的n p代之 ;在n→∞, p→0.5时,二项分布趋于正态分布。在这种场合,正态分 布中的μ、σ2用二项分布的n p、n p q代之。在实际计算中,当p<0.1 且n很大时,二项分布可由波松分布近似;当p>0.1且n很大时,二项 分布可由正态分布近似。 对于波松分布,当λ→∞时,波松分布以正态分布为极限。在实际计算 中,当λ≥20时,用波松分布中的λ代替正态分布中的μ及σ2,即可由后 者对前者进行近似计算。


Download ppt "第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则"

Similar presentations


Ads by Google