第八章 常用统计分布
第一节 超几何分布 适用:小群体的两分变量。假定总体为 K个成功类、(N-K)个为失败类 1.超几何分布为离散型随机变量的概率 第一节 超几何分布 适用:小群体的两分变量。假定总体为 K个成功类、(N-K)个为失败类 1.超几何分布为离散型随机变量的概率 分布,它的数学形式是 2019/4/4
2.超几何分布的数学期望值和方差 如果用 ,则有 2019/4/4
[解] 由题意可知:N=8.K=3,N―K=5.n=5,代入(8.1)式,故概率分布如下: [例] 以随机方式自5男3女的小群体中选出5人组成一个委员会,求该委员会中女性委员人数的概率分布、期望值与变异数。 [解] 由题意可知:N=8.K=3,N―K=5.n=5,代入(8.1)式,故概率分布如下: X 0 1 2 3 合计 P=(X=x) 1/56 15/56 30/56 10/56 56/56 由 , ,代入(8.4)式、(8.5)式得 (1) (2) 2019/4/4
3.关于超几何分布的近似 设某校有l000名大学生,其中有外国留学生10、名,现从该校学生中任抽2人,求抽到外国留学生的概率分布。 [解] 抽到外国留学生人数X服从N=1000、K=10、n=2的超几何分布,根据(8.1)式得 2019/4/4
由于 =0.002<0.1,用二项分布近似 计算有 ,由(8.6)式得 由于 =0.002<0.1,用二项分布近似 计算有 ,由(8.6)式得 两种方法计算结果比较一下,仅在小数点后第5位上才出现误差。当然在>0.1时,如此计算误差会比较大。另外,二项分布的计算量仍不算小,有时还可以将二项分布近似为泊松分布,这一点我们将在下一节讨论。 2019/4/4
第二节 泊松分布 适用:稀有事件的研究。一个事件的平均发生次数 是大量实验的结果,在这些试验中,此事件可能发生,但 是发生的概率非常小。 第二节 泊松分布 适用:稀有事件的研究。一个事件的平均发生次数 是大量实验的结果,在这些试验中,此事件可能发生,但 是发生的概率非常小。 泊松分布亦为离散型随机变量的概率分布,随机变量 X为样本内成功事件的次数。若λ为成功次数的期望值, 假定它为已知。而且在某一时空中成功的次数很少,超过 5次的成功概率可忽不计,那么X的某一具体取值x(即稀 有事件出现的次数)的概率分布为 2019/4/4
泊松分布的性质:x的取值为零和一切正整数;图 形是非对称的,但随着的λ增加,图形变得对称;泊松 分布的数学期望和方差均为λ。 2019/4/4
[解] 由资料知 [例] 某城市50天交通事故的频数分布如 表所示,试求泊松 ≥ 理论分布。 一天交通事故数 1 2 3 合计 天数f 23 1 2 3 合计 天数f 23 17 7 50 [解] 由资料知 查泊松分布表,得理论分布 将实测频数与理论频数比较,可知题中所述稀有事件是 满足泊松分布的。 X 1 2 3 4 合计 P 0.4493 0.3595 0.1438 0.0383 0.0091 1.0000 理论频(50хPi ) 22.4 18.0 7.2 1.9 0.5 50.0 ≥ 2019/4/4
第三节 卡方分布 卡方分布是一种连续型随机变量的概率分布,主要用于列联表 检验。 1.数学形式 第三节 卡方分布 卡方分布是一种连续型随机变量的概率分布,主要用于列联表 检验。 1.数学形式 设随机变量X1,X2,…Xk,相互独立,且都服从同一的正态 分布N (μ,σ2)。那么,我们可以先把它们变为标准正态变量 Z1,Z2,…Zk,k个独立标准正态变量的平方和被定义为卡方分布 ( 分布)的随机变量 ( 读作卡方),且 我们把随机变量 的概率分布称为 分布,其概率密度记 作 。其中k为卡方分布的自由度,它表示定义式中独立变量的个数。 2019/4/4
关于卡方分布的分布函数,附表7对不同的自由度k及不同的临 界概率α(0<α<1),给出了满足下面概率式的 的值(参见 图)。 注意 写法的含义:它 表示自由度为k的卡方分布,当 其分布函数 时,其随机变量 的临界值(参见图)。具体来说,在假设检验中,它表示在显著性水平α上卡方分布随机变量 的临界值。 2019/4/4
[解] 查卡方分布表,在表中自由度为5的横行中找到 与15最接近的数值是15.086,得到α的近似值为0.01。 由此可知 ≈0.01. [例] 试求下列各值: [解] 查卡方分布表(附表7)得 [例] 已知k=5, =15,求临界概率α。 [解] 查卡方分布表,在表中自由度为5的横行中找到 与15最接近的数值是15.086,得到α的近似值为0.01。 由此可知 ≈0.01. 2019/4/4
2. 卡方分布的性质 (1) 恒为正值 。 (2)卡方分布的期望值 是自由度k,方差 为2k。 (1) 恒为正值 。 (2)卡方分布的期望值 是自由度k,方差 为2k。 卡方分布取决于自由度k,每一个可能的自由度对应一个具体 的卡方分布。卡方分布只与自由度有关,这就给卡方分布的实际应 用带来很大方便。分布由正态分布导出,但它之所以与正态分布的 参数μ和σ无关,是因为标准正态变量Z与原来的参数无关。 (3)卡方分布具有可加性 (4)利用卡方分布可以推出样本方差 S2 的分布 式中:σ2代表总体方差,自由度为n―l。 2019/4/4
所以,样本方差S 2落在3.3和8.7之间的概率约为90%。 3. 样本方差的抽样分布 [例] 由一正态总体抽出容量为25的一随机样本,已知σ2=6,求 样本方差S 2在3.3到8.7之间的概率。 [解] 已知n=25,σ2=6,由 得 所以,样本方差S 2落在3.3和8.7之间的概率约为90%。 2019/4/4
第四节 F 分布 F 分布是连续性随机变量的另一种重要的小样本分布,可用来检验两个总体的方差是否相等,多个总体的均值是否相等。还是方差分析和正交设计的理论基础。 1.数学形式 设 和 相互独立,那么随机变量 服从自由度为(k1,k2)的F分布。其中,分子上的自由 度k1叫做第一自由度,分母上的自由度k2叫做第二自由度。 2019/4/4
k2)的值(参见图)。 我们把随机变量F的概率分 布称为F分布,其概率密度记 作 。本书附 表8,对不同自由度(k1,k2)及 作 。本书附 表8,对不同自由度(k1,k2)及 不同的临界概率α(0<α<1), 给出满足下列概率式的Fα(k1, k2)的值(参见图)。 注意 写法的含义:它表示自由度为 (k1,k2)的F 分布,当其分布函数 时,其随机变量 F 的临界值(参 见图)。具体来说,在假设检验中,它表示在显著性水平α上F 分布 随机变量 F 的临界值。 2019/4/4
[例] 试求下列各值: [解]查F分布表(附表8)得 如果 和 是两个独立随 机样本的方差,样本来源于具有相同 如果 和 是两个独立随 机样本的方差,样本来源于具有相同 方差σ2的两个正态总体,样本容量 分别为n1和n2,那么根据(8.22)式, 随机变量F 服从于自由度为(n1―1和 n2―1)的F分布。 2019/4/4
2. F分布性质 (3) F分布的期望值与变异数(方差) F分布也是一个连续的非对 称分布。 反对称性。 (1)随机变量F恒为正值, (2)分布具有一定程度的 反对称性。 (3) F分布的期望值与变异数(方差) 2019/4/4