Statistical Probability for Production Simulation 生产系统建模与仿真 Modeling and Simulation of Production System 第2章 生产系统仿真用的概率统计 Statistical Probability for Production Simulation
第2章 生产系统仿真用的概率统计 §2.1 随机变量、概率函数、随机数 §2.2 均匀的连续分布随机数及其生成 §2.1 随机变量、概率函数、随机数 §2.2 均匀的连续分布随机数及其生成 §2.3 各种离散分布随机数的产生 §2.4 非均匀的连续分布随机数及其产生
随机变量、概率函数、随机数 确定性活动与随机活动 确定性活动:是可以事先预言的,即在准确地重复一定的条件下,其变化的结果总是确定的,或者根据其过去的状态,相同的条件下可以预言将来的发展变化,我们把这一类活动称为确定性活动。确定性活动的主要特征是活动的运动可以用一个确定的数学形式来描述:f(t),或是数学函数,或是数学图表等。 随机性活动:其变化的结果是事先不可预言的,即在相同的条件下进行重复实验,每次结果未必相同,或者是知道其过去的状况,在相同的条件、未来的发展事先都不能确定,这一类活动我们称为随机性活动。随机性活动的主要特征是这类活动的描述可以通过数学统计的方法描述。 对于随机性活动进行研究所利用的数学工具是概率论及数理统计对于实际系统中随机活动进行研究时,往往由于众多的随机因素使得数学描述和分析变得十分困难,这时我们往往求助于计算机仿真。仿真为这类复杂的随机系统的研究提供了一个方便有效的手段。
随机变量、概率函数、随机数 离散型随机变量 定义:对于随机活动的不同结果我们可以用不同的数值与其对应。这样,就可以用一个变量来描述随机活动,变量按一定的概率取某个值对应于随机活动按一定的概率取某个结果。这类变量称为随机变量。 离散型随机变量:若随机变量只取有限个数值或可列无穷多个数值,则称此类随机变量为离散型随机变量。 连续型随机变量:若随机变量可以取值于某个区间中的任一数,我们称为连续型随机变量。
随机变量、概率函数、随机数 离散型随机变量 概率分布函数 离散型随机变量 概率分布函数 离散型随机变量X的累积分布函数定义,当X小于或等于某个给定值x的概率函数,记为P(X≤x) = F(x)。 设随机变量X可能取值x1,x2,…,xn,…,则X的累积分布函数为 其中 为X 取值 的概率。 由定义可见 当x<y时,F(x)≤F(y),即F(x)是个单调增加的函数。
随机变量、概率函数、随机数 连续型随机变量 定义:若存在非负函数 f (x),使得随机变量X取值于任一区间(a,b)的概率为 P(a<x≤b)= , 则称X为连续型随机变量,f(x)称为X的密度函数。 对于密度函数 f (x)有
随机变量、概率函数、随机数 连续型随机变量 概率密度函数 连续型随机变量的累积分布函数定义为随机变量小于或等于x的概率。它用F(x)表示,即 连续型随机变量 概率密度函数 连续型随机变量的累积分布函数定义为随机变量小于或等于x的概率。它用F(x)表示,即 由累积分布函数定义可知, 当 时, 。 累积分布函数是单调递增函数。
随机变量、概率函数、随机数 概率密度函数/累积分布函数 随机变量X落入区间(a,b)内的概率是 。图中给出了一个连续随机变量的密度函数曲线和累积分布函数曲线。密度函数f(x)的值不能为负,要注意的是f(x)的值可以大于1,但是在任意区间(a,b)上由 f (x)曲线围出的面积(图中阴影部分)必然<1。从图中也可以看到累积分布函数F(x)的值随 x 值的增加而增加,而且它最终趋向极限值1。
随机变量、概率函数、随机数 随机变量的数字特征 定义:随机变量的数字特征是与它的分布有关的某些数值,例如平均值、最大可能值等,它们反映了随机变量某些方面的特征。 分类:根据随机变量的种类:分别介绍离散型随机变量的数字特征、连续型随机变量的数字特征
随机变量、概率函数、随机数 离散型随机变量的数字特征 数学方差反映了各个随机变量的采样值偏离平均值的平均程度 平均值:设X为离散随机变量,其概率函数由下表给出: 其中 记 ,称为X 的平均值。 数学方差 X x0 x1 x2 … xn P{X=Xi} P0 P1 P2 Pn 数学方差反映了各个随机变量的采样值偏离平均值的平均程度 变化系数:标准差与平均值的比值,反映了随机数偏离平均值的变化程度。变化系数=
随机变量、概率函数、随机数 连续型随机变量的数字特征 平均值:设X为随机变量,其概率密度函数为 f (x),则该随机变量的平均值m为: 平均值又称为数学期望。 数学方差 数学方差反映了各个随机变量的采样值偏离平均值的平均程度 变化系数:标准差与平均值的比值,反映了随机数偏离平均值的变化程度。变化系数=
随机变量、概率函数、随机数 随机变量的其它数字特征 模值定义为随机变量的概率密度函数在某处取峰值时的x 值。当有多个峰值时,取最大峰值作为模值。 中间值:如果有一点Xm,随机变量有一半值将落在这一点以下,那么由此点所定义的值Xm称为中间值b中间值可以从累积分布函数曲线上求得,因为它是F(x)=0.5处的那个点。 在x=1处时 f(x) 均达到峰值,则x=1就是随机变量的模值。中间值:Xm=1.6783469
随机变量、概率函数、随机数 数理统计中的基本运算规则 ,X一随机变量,则 E(αX)= αE(X) X,Y为两个相互独立的随机变量,则 E( X+Y )= E(X)+ E(Y) ,X一随机变量,则 D(αX)= α2D(X) ,X一随机变量,则 D(X +α)= D(X) X,Y为两个相互独立的随机变量,则 D( X+Y )= D(X)+ D(Y)
随机变量、概率函数、随机数 常见随机变量的期望和方差 设随机变量X。 X服从(0—1)分布,则E(X)=p D(X)=p(1-p) X服从泊松分布,即X~ π(λ),则 E(X)= λ,D(X)= λ X服从均匀分布,即X~U(a,b),则E(X)=(a+b)/2, D(X)=(b-a)^2/12 X服从指数分布,即X~e(λ), E(X)= λ^(-1),D(X)= λ^(-2) X服从二项分布,即X~B(n,p),则E(x)=np, D(X)=np(1-p) X 服从正态分布,即X~N(μ,σ^2), 则E(X)=μ, D(X)=σ^2 X 服从标准正态分布,即X~N(0,1), 则E(X)=0, D(X)=1
随机变量、概率函数、随机数 (0,1)均匀分布随机数 随机数:所谓随机数就是随机变量的样本取样值。 均匀分布的随机数:随机变量x在其可能值范围中的任一区间出现的概率正比于此区间的大小与可能值范围的比值。 (0,1)均匀分布随机数:在各种分布的随机数中,最常用和最重要的是在(0,1)区间上的均匀分布随机数。 其他许多分布的随机数都可以由(0,1)均匀分布随机数经过变 换和计算来产生。
随机变量、概率函数、随机数 (0,1)均匀分布随机数的定义 (0,1)均匀分布随机变量x的概率密度函数为 累积分布函数
随机变量、概率函数、随机数 (0,1)均匀分布随机数的说明 随机变量x落入区间(X1,X2)中的概率等于图中阴影区的面积,其值为(X2-X1),正比于区间(X1,X2)的大小。 需要说明的是在计算机上表示连续变量只能是近似的,因为计算机中的数字只能是有限的位数。如果变量变化的最小步长可以达到计算机表示的最小值,并且在实际需要的精度之内变量可以达到任意值,就可以把这个变量看成是连续的。
随机变量、概率函数、随机数 (0,1)均匀分布随机数的产生方法 物理过程:常用的物理装置有放射粒子计数器、电子管随机数产生器。利用电子噪声或放射源去激励一个周期为0~9的计数器,对计数器定时选行采样就可以得到所需的随机数的一位数。多次重复此过程或者利用几个计数器同时运行,就可以得到任意位数的随机数。
随机变量、概率函数、随机数 (0,1)均匀分布随机数的产生方法 随机数表:利用物理过程可以得到大量随机数,并将这些数制成表。在使用随机数时就可以依一定的顺序从表中取出随机数。为了适应实际需要的位数,对取出的随机数可以进行截断或拼接处理。
随机变量、概率函数、随机数 (0,1)均匀分布随机数的产生方法 随机数产生程序:按照一定的算法计算出具有类似于均匀分布随机变量的独立取样值性质的数。因为这些数是按照定性的算法计算出来的,会有一定的周期性,因而被称为伪随机数。由于我们的目的是利用随机数来对随机活动的统计分析,只要伪随机数的数理统计性质能够满足实际需要就可以了。这些数理统计性质包括均匀性、独立性等。 一般计算机上,产生随机数的函数为(0,1)均匀分布的随机数。
随机变量、概率函数、随机数 计算机产生随机数的算法 用计算机程序通过计算产生的随机数都是伪随机数,它具有一定的周期性。 计算机产生随机数的特点:实用性强、简单易操作、产生速度快、计算机存储空间的要求低。 计算机上用数字方法产生的随机数的一般要求有: 1. 产生的数值序列要具有分布的均匀性、抽样的随机性、试验的独立性以及前后的一致性。 2. 产生的随机数要有足够长的周期,以满足你真的实际需要。 3. 产生随机数的速度要快,占用的内存空间要小。
随机变量、概率函数、随机数 计算机产生随机数的算法 计算机产生随机数的通常方法是利用一个递推公式: 给定了k个初始值 ,就可以利用这个递推公式推算出第k+1个数Xk+1: 递推公式有多种形式,其中最常见的有两种: -平方取中法 -同余法
随机变量、概率函数、随机数 平方取中法 这是最早产生随机数的一种方法,一个二进制n位数X,自乘后一般得到一个2n位数X2。设 平方后得到: 取X0中间的n位数(设n为偶数) 作出如下的二进制n位数: 重复上述过程,可得二进制n为数序列 , , … 。令, 则 , , …就是所需要的(0,1)均匀分布随机数序列。
随机变量、概率函数、随机数 平方取中法 ——步骤
随机变量、概率函数、随机数 平方取中法 例子 任取一正整数:45 表示为偶数位的二进制数:101101,共6位 平方取中法 例子 任取一正整数:45 表示为偶数位的二进制数:101101,共6位 该数的平方为:011111101001,共6×2=12位 取中间的六位,得:111101,该数的十进制表达式为 61 …… 最终可以产生的随机数: 45,61,17,36,34,16,32,0,…… 问题: 应用平方取中法时,可能遇到“退化”的危险,即出现中间所取得值都为0,或形成重复循环序列的现象。 ——平方取中法的限制
随机变量、概率函数、随机数 同 余 法 同余法是将一组数据通过一系列特定的数字运算,最后利用一个数字的整除求余,所得的数值就是一个伪随机数。因为这个计算过程,则称该求随机数的方法为同余法。 同余法的有三种:加同余法、乘同余法和混合同余法。其中以混合同余法产生的随机数统计性质较好,因而获得了最为广泛的应用。 同余法具有计算简便的优点。 产生随机数的递推公式是: 其中a称为乘法因子,c称为加法因子,M为模数(为随机数的周期)。 当a=1时, 加同余法; 当c=0时, 乘同余法; 当a≠1、c≠0时,混合同余法。
随机变量、概率函数、随机数 (0,1)均匀分布随机数的产生 当给定了一个初始值X0之后,就可以利用上式计算出序列X1, X2,…,Xn,…,再取 于是y1,y2,…,yn就是所需要的(0,1)均匀分布得随机序列。
随机变量、概率函数、随机数 同余法产生(0,1)均匀分布的随机数 例 题 设a=5,c=3,M=8,取X0=1,则循环叠代式: 同余法产生(0,1)均匀分布的随机数 例 题 设a=5,c=3,M=8,取X0=1,则循环叠代式: 利用上述叠代式,可以计算得到: X1=0,X2=3,X3=2,X4=5,X5=4,X6=7,X7=6,X8=1,X9=0,… y1=0.000,y2=0.375,y3=0.250,y4=0.625,y5=0.500,y6=0.875,y7=0.750,y8=0.125,X9=0.000,… 我们可以看到此例中,这个随机数序列的周期长度为8,即Xn+8= Xn。很明显:利用同余法产生随机数序列的周期不可能超过所取的模数M值、适当的a、c和X0的值,就可以使随机数序列的周期充分地长、以满足实际的需要。若利用组合的同余法产生随机数序列,则可获得大于模数的周期。
同余法产生(0,1)均匀分布的随机数 产生的基本条件 随机变量、概率函数、随机数 同余法产生(0,1)均匀分布的随机数 产生的基本条件 c和M互质,即没有大于1的公因子。 M的每个质数因子也是a-1的因子。 若4是M的因子,则4也是a-1的因子。 上述基本条件满足后,混合同余法所产生的随机数序列的周期达到最大值M 。
随机变量、概率函数、随机数 各种离散分布随机数的产生 在生产系统离散仿真时,我们常常使用离散分布的随机变量来描述实际系统中的某些量。例如在企业原材料管理系统中,在一定时间内,到达仓库的物料数就是一个离散随机变量。该随机变量的到达时间是一个随机数,此随机数满足一定的概率分布。我们可以利用(0,1)均匀分布随机数来产生各种离散分布的随机数。 离散分布的随机数可以分为:均匀分布的离散随机数、非均匀分布的离散随机数
随机变量、概率函数、随机数 均匀离散分布的随机数的产生 给定N个连续整数x1,x2,…,xN,我们以相等的概率从中选出一个数,这样重复下去,所产生的数列就是一个离散均匀分布的随机数序列。 每次取样值 , 式中yk是 (0,1)均匀分布的随机数。 选定产生均匀分布随机数的范围: x1 、xN 产生(0,1) 均匀分布的随机数
随机变量、概率函数、随机数 非均匀离散分布的随机数的产生 给定N个x1,x2,…,xN,我们以相对应的概率P1,P2,…,PN,满足 ,从中选出一个数作为输出,这样重复下去,所产生的数列就是一个离散非均匀分布的随机数序列。
若随机数yi值∈[Fk-1,Fk),取xk 随机变量、概率函数、随机数 非均匀离散分布的随机数的产生方法 设所求非均匀离散分布随机数的累积概率分布函数为F(x),其中:F(0)=F0=0,Fk= (k=1,2,…,N)。 设yi是一个(0,1)均匀分布随机数。考察yi,如果 , 则把相应的xk选出作为此次取样的输出值。 若随机数yi值∈[Fk-1,Fk),取xk 生成n个(0,1) 均匀分布的随机数 数xk 服从特定分布
随机变量、概率函数、随机数 例1 贝努利概率模型二项分布的产生 例1 贝努利概率模型二项分布的产生 贝努利(Bernouli)概率模型是概率统计中一种最简单而又常用的概率模型,它由一系列试验组成。其中每次试验只有两种结果。我们用事件A和A’来表示这两种实验结果。若A产生的概率为P(A)=P,(0<P<1)。事件A’发生的概率P(A)=Q=1-P。而且各次试验是相互独立的。我们可以利用(0,1)均匀分布随机数序列产生贝努利概率模型的二项分布。任取(0,1)均匀分布随机数xn,若xn≤P,就认为事件A发生,反之,若向xn>P,则认为A’事件发生。
统计n个随机数中数值大于某一个概率值P的个数m 随机变量、概率函数、随机数 例2 二项分布 在由n次独立试验组成的贝努利概率模型中,事件A发生的次数η是一个随机变量。它取值k(k=1,2,…,n)的概率是 当P较大而计算精度又要求较高时,我们可以在计算机上用n次贝努利试验产生二项分布的随机数。 统计n个随机数中数值大于某一个概率值P的个数m 生成n个(0,1) 均匀分布的随机数 数m服从 贝努利分布
随机变量、概率函数、随机数 泊松分布 若进行n次独立试验,在每次试验中事件A发生的概率等于Pn,则在n次试验中事件A发生k次的概率(n→∞,Pn→0,nPn=λ)趋于P(k,λ): 称为泊松(Poisson)分布。 在泊松分布的试验中,试验的次数n越大,则越接近泊松分布的值。
随机变量、概率函数、随机数 非均匀的连续分布随机数及其产生 对于非均匀的连续分布的随机数,我们同样借助于(0,1)均匀分布随机数进行变换或计算来产生。 一般采用的变化方法为 1 反函数法(逆变法) 2 函数变换法 3 卷积法
随机变量、概率函数、随机数 反函数法(逆变法) 反函数法也称为概率积分变换法,这种方法所基于的原理是概率积分变换定理,可以简述如下: 给定(0,1)均匀分布随机数yn(n=1,2,...),如果F-1(yn)是随机变量X的反累积分布函数,则由公式 xn= F-1(yn) 所计算的随机数就是随机变量X的取样值。
随机变量、概率函数、随机数 反函数法(逆变法)的步骤 求出y= F(x)的反函数: x= F-1(y)。 利用(0,1)均匀分布随机数产生程序取得yn。 利用x= F-1(y)可得到需要的随机数xn。
随机变量、概率函数、随机数 指数分布 指数分布的概率密度函数是 累积分布函数为 生成随机数的逆函数为 图中取λ =0.5
随机变量、概率函数、随机数 设某分布的累积分布函数由下式给出 且产生的均匀分布随机数为0.1201, 0.2162和0.7621,现将它们转换为上述分布下的随机变量。分布函数如下图所示。
随机变量、概率函数、随机数 求出F(x)的逆函数: 于是有: 即为由F(x)其确定的分布下的随机变量。
随机变量、概率函数、随机数 离散随机变量 设离散随机变量x分别以概率p(x1),p(x2),…,p(xn)取值x1,x2,…,xn,其中0<p<(xi)<1,i=1,2,…,n,则分布函数可以写作: x1 F(x) p(x3) x x2 x3 o xn-1 p(x2) p(x1) xn p(xn-1) 离散分布的反函数法 为了使均匀分布的独立随机数u能够确定其对应的随机变量,将[0,1]区间按p(x1),p(x2),…,p(xn)分为n个区间,根据u值落入的区间,所对应的xi即为所需要的随机变量。
随机变量、概率函数、随机数 离散随机变量反变换法步骤为: (1)按xi的递增顺序排列p(xi); (2)产生(0,1)区间均匀分布的随机数u; (3)求非负整数k,使得下式成立: (4)令x=xi,即为所求的随机变量。
随机变量、概率函数、随机数 函数变换法 在很多情况下,F(x)无法直接求得反函数表达式,为了获得F(x)确定的分布下的随机变量,有时需要谋求某种变通方式。函数变换法就是利用函数中的变量替换,设法获得一种能够求出反函数的函数形式,求出随机变量后再将变量替换回来。
随机变量、概率函数、随机数
随机变量、概率函数、随机数 正态分布 正态分布的概率密度函数为 对于此式要直接求F-1(y)是很困难的,可利用坐标变换等方法。令x=σx1+μ就可以将上式化成标准正态分布N(0,1)。设u1和u2是两个独立的(0,1)均匀分布随机数,利用坐标变换及积分变换可得 均值:2;方差:0.3。
随机变量、概率函数、随机数 随机数的统计检验 用任何一种方法产生的随机数序列在把它用到实际问题中去之前都必须进行一些统计检验,看它是否能够令人满意地作为随机变量的独立取样值(显著性检验),是否有较好的独立性和均匀性。从理论上说,统计检验并不能得出完全肯定的结论,但是却可以使我们有较大的把握获得具有较好统计性质的随机数序列。
随机变量、概率函数、随机数 数字特征检验 数字特征检验是采样平均值、方差与理论平均值、方差差异的显著性检验。 在(0,1)区间上均匀分布的随机变量X和X2的平均值及方差分别为
随机变量、概率函数、随机数 数字特征检验 如果N个随机数x1,x2,…,xN是X的N个独立观测值,令 则它们的平均值和方差为
随机变量、概率函数、随机数 数字特征检验 根据中心极限定理: 渐近地服从正态N(0,1) 当N足够大。 故当给定显著性水平后,即可根据正态分布表确定临界值,据此判断与X的平均值E(X)和与的平均值E(X2)之差异是否显著,从而决定能否把x1,x2,…,xN看作是(0,1)均匀分布随机变量X的N个独立取样值。
随机变量、概率函数、随机数 分布均匀性检验 分布均匀性检验又称频率检验,是对经验频率和理论频率之间的差异进行检验。 把(0,1)区间划分成k等分,以 ( i=1,2,…,k)表示第i个小区间。如果xs是区间(0,1)上均匀分布的随机变量X的一个取样值,则xs值落在任一小区间的概率Pi均应等于这些小区间的长度1/k,故xsN个值落在任何一个小区间的平均数 。设实际上x1,x2,…,xN中属于第i个小区间的数目为ni,则统计量 渐近地服从自由度为K-1的 分布。 由 的值可以衡量实际频率与理论频率的差异,也就是可以度量实际随机数分布的均匀程度,当两者完全符合时, =0。
随机变量、概率函数、随机数 课堂思考题 的值处在多大范围内可以认为的随机数抽样值是符合均匀性要求呢? 首先确定一个判定标准α(称为显著度),并且根据参数γ的值(γ称为自由度,γ=k-1),从 表中查得 的值。如果计算所得到的 值小于 ,就认为符合均匀性假设。因为它符合下式 如果α=0.05,则上式表示的概率为0.95,也就是说,对给定显著度α而言,可以认为这一随机数样本是均匀的。通常可取α=0.05~0.1。
随机变量、概率函数、随机数 独立性检验 一个随机数序列可以是均匀分布,但却不一定是独立的,也就是说有可能是互相关联的。两个随机变量得相关系数反映了它们之间的线性相关程度。如果它们相互独立,那么它们的相关系数应为0(反之不一定)。所以其值大小可以衡量相关程度。这里对独立性检验主要是对随机数序列中相隔一定间隔的数之间的相关系数进行检验。
随机变量、概率函数、随机数 独立性检验 设给定N个随机数x1,x2,…,xN,我们计算前后距离为K的样本相关系数rK: , k=1,2,… 式中 为随机数的方差, 为随机数的平均值, 。
随机变量、概率函数、随机数 独立性检验 如果各xi相互独立,则相关系数rK应为0。在原假设rK=0之下,当N充分大(例如N-K>50)时,统计量 渐近地服从正态分布N(0,1)。同时选定α=0.05,则根据概率统计理论,当|U|>196时(称为差异显著),拒绝假设 rK=0;反之,则接受。
. . 随机变量、概率函数、随机数 非均匀分布随机数的生成 在实际应用中,有很多随机变量并不具有标准分布特征。假如通过抽样统计,得到某随机变 量的取值和其发生的累积频率的分布;可以根据此分布,将一个0-1间隔均匀分布的随机数 转换为符合这种分布的随机数。 对于离散型随机变量,可以采用“逐段查值”的方法实现这种转换。对于连续型随机变量则可采用“逐段查值+线性插值”的方法来获得转换后的随机数值。 例如:由1号随机数发生器产生一随机数为0.523664,由以下两图分别获得转换后的随机数的值为 8 和 7.083968。 离散型非标准分布随机变量分布曲线 0.15 0.35 0.60 0.82 1.0 2 5 8 9 12 p . 累积频率 随机变量值 连续型非标准分布随机变量分布曲线 p 0.15 0.35 0.60 0.82 1.0 2 5 8 9 12 .