第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布 1 关于分布的几个概念 2 由正态分布导出的几个重要分布 3 样本均值的分布与中心极限定理 4 样本比例的抽样分布 5 两个样本平均值之差的分布 6 关于样本方差的分布 7
6.1 统计量 6.1.1统计量的概念 设 是从某总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数 ,不依赖任何未知参数,则称函数 是一个统计量 如:
6.1.2 常用统计量
6.1.3 次序统计量 将样本观测值由小到大进行排序,第i个值就是次序统计量X(i)的观测值,而X(1),X(2)…X(n)称为次序统计量 6.1.4 充分统计量 统计量加工过程中一点信息都不损失的统计量称为充分统计量 思考:从100个零件中随机抽取三个。 1、抽检100个产品中有3个是次品; 2、抽检的100个产品中前3个是次品. 你得到的信息有什么不同?
6.2 关于分布的几个概念 6.2.1 抽样分布 从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。
【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。 总体的均值、方差及分布如下
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表
计算出各样本的均值,如下表。并给出样本均值的抽样分布
样本均值的分布与总体分布的比较 = 2.5 σ2 =1.25 总体分布 抽样分布 1 4 2 3 .1 .2 .3 P ( x ) 1.0 .1 .2 .3 1.5 3.0 4.0 3.5 2.0 2.5 x 1 4 2 3 .1 .2 .3 = 2.5 σ2 =1.25
6. 2. 2 渐近分布 当样本量n无限增大时,统计量的极限分布,作为抽样分布的近似。 6. 2
6.3 有正态分布导出的几个和总要分布 6.3.1 卡方分布 设 相互独立, 都服从标准正态分布N(0,1), 则称随机变量 服从自由度为 n 的 分布 若有K个服从 分布且相互独立的随机变量,则
卡方分布的性质 1、卡方分布曲线下方的面积为1. 2、卡方值都是正值. 3、卡方分布是一个正偏态分布. 4、不同的自由度决定不同的卡方分布,N越小,卡方分布曲线就越陡。
例题
卡方分布表
6.3.2 t分布 设X1服从标准正态分布N(0,1),X2服从自由度为n的 分布,且X1、X2相互独立,则称变量 所服从的分布为自由度为n的t分布,记为
如果 , , , 则 如果X,Y是两个相互独立的总体,
6.3.3 F分布 设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F分布, 上式F服从第一自由度为m,第二自由度为n的F分布
6.4 样本均值的分布与中心极限定理 当总体分布为正态分布 时,可以得到下面的结果: 的抽样分布仍为正态分布, 数学期望为 ,方差为 ,则 当用样本均值估计总体均值时,平均来说没有偏差(无偏性);当n越来越大时, 的分散程度越来越小,估计越来越准确。
中心极限定理: 设从均值为 ,方差为 (有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值 的抽样分布近似服从均值为 、方差为 的正态分布。 一个任意分布的总体 X
例. 设从一个均值为10,标准差为0. 6的总体中随机选取容量为36的样本。假设该总体不是很偏,要求: (1)计算样本均值小于9 例.设从一个均值为10,标准差为0.6的总体中随机选取容量为36的样本。假设该总体不是很偏,要求: (1)计算样本均值小于9.9的近似概率 (2)计算样本均值超过9.9的近似概率 (3)计算样本均值在总体均值附近0.1范围内的近似概率
根据中心极限定理,不论总体分布是什么形状,当n充分大时,样本均值的分布近似服从正态分布
例6.5 某电瓶商声称其生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。现假设质监部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命检验。 1)假设厂商声称是正确的,试描述50个电瓶的平均寿命的抽样分布 2)假设厂商声称是正确的,则50个样品组成的样本的平均寿命不超过57个月的概率?
6.5 样本比例的抽样分布
假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0 假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025-0.070之间的概率有多大?
设600份报表中国至少有一处错误的报表所占比例为 ,则有
6.6 两个样本平均值之差的分布
甲乙两所高校录取新生时,甲校平均分为655,且服从正态分布,标准差为20,乙的平均分为625,标准差为25,也是正态分布。现从两校各随机抽取8名新生,计算平均分数,出现甲比已的平均分低的概率有多大?
8个新生平均分应服从正态分布,
一项调查表明,甲城市的消费者中有15%的人喝过某品牌矿泉水,乙城市消费者中只有8%的人喝过该矿泉水。如果从甲城市抽取120人,从乙城市抽取140人,组成两个独立随机样本,样本比例 不低于0.08的概率有多大?
的抽样分布可以认为近似服从正态分布,
6.7 关于样本方差的分布