统计学 第7章 参数估计 教师:张文利
主要内容 抽样推断的基本概念 参数估计的一般问题 一个总体参数的区间估计
一、抽样推断的基本概念 1.样本与样本容量 2.抽样的组织方式 3.抽样方法 4.参数和统计量 5.抽样误差及其测度
1.样本与样本容量 样本:从总体中抽取出来那部分单位所组成的集合体。样本是总体的一个缩影。 样本容量:抽样总体的单位数,用n表示。
2.抽样的组织方式 抽样调查一般分为概率抽样与非概率抽样,通常意义的抽样指概率抽样,可分为: 简单随机抽样 类型(分层)抽样 等距抽样 整群抽样 多阶段抽样
3.抽样方法 重复抽样:又称有放回的抽样或重置抽样。 不重复抽样:无放回抽样或不重置抽样。
4.参数和统计量 参数:描述总体特征的指标。 统计量:描述样本特征的指标。 主要统计特征数及符号 特 征 数 及 符 号 总体参数 需特写 主要统计特征数及符号 特 征 数 及 符 号 总体参数 样本统计量 总体单位数 N 样本(单位数)容量 n 总体平均数 样本平均数 总体成数P或 样本成数 p 总体标准差 样本标准差 S 总体方差 样本方差
5.抽样误差及其测度 抽样误差:指样本指标和总体指标之间数量上的差异。 例如:样本平均数与总体平均数之差,样本比例与总体比例之差。 抽样误差越小,说明样本的代表性越强;反之,样本的代表性越弱。
影响抽样误差大小的因素 (1)抽样单位数n的多少—反方向变化关系。 (2)总体各单位标志值的差异程度—正方向变化关系。 (3)抽样方法。 (4)抽样的组织形式。 需特写
抽样误差的三种度量方法
抽样平均误差的计算 (1)样本平均数的平均误差 重复抽样: 需特写 不重复抽样:
例: 有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少? 解:根据题意可得: 需特写 总体标准差
抽样平均误差的计算 (2)样本成数的平均误差 重复抽样: 需特写 不重复抽样:
例:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。 解:根据题意,在重复抽样条件下,合格率的抽样平均误差为: 在不重复抽样条件下,合格率的抽样平均误差为: 需特写
抽样极限误差 抽样极限误差:又称抽样允许误差范围,记作Δ。 设 分别表示样本平均数的抽样极限误差和样本成数的抽样极限误差,则有:
二、参数估计的一般问题 1.点估计与区间估计 2.置信度 3.置信区间 4.概率度 5.估计量的优良标准
1.点估计与区间估计 点估计:也称定值估计,就是以样本估计量直接代替总体参数的一种推断方法。 区间估计:依据一定的概率保证程度,用样本估计值估计总体参数取值范围的方法。
2.置信度 3.置信区间 置信度:总体参数落在某一区间内的概率保证程度,也称置信水平或置信概率,用1-α或 表示,α为显著性水平。 置信度:总体参数落在某一区间内的概率保证程度,也称置信水平或置信概率,用1-α或 表示,α为显著性水平。 3.置信区间 置信区间:总体参数落在某一下限到某一上限的一个区间范围。
4.概率度 概率度:抽样极限误差除以抽样平均误差所得的数值,用t表示,也可表示为 ,称为正态分布的临界值。 需特写 计算公式为: 由此可得:
应用标准正态分布概率表,可以得出抽样指标落在置信区间内的置信度。 需特写
5.估计量的优良标准 无偏性 一致性 有效性
三、一个总体参数的区间估计 1.总体均值的区间估计 2.总体比例的区间估计
1.总体均值的区间估计 (1)正态总体且方差已知 在重复抽样条件下,置信区间为: 需特写 在不重复抽样条件下,置信区间为:
(2)非正态总体、方差未知、大样本 在重复抽样条件下,置信区间为: (2)非正态总体、方差未知、大样本 在重复抽样条件下,置信区间为: 需特写 在不重复抽样条件下,置信区间为:
例题:某灯具厂生产一种灯泡,假设其寿命X服从正态分布N(μ,1296)。现在从该厂生产的灯泡中按重复抽样的方法随机抽取了27件产品,测得它们的平均寿命为1478小时。试计算该厂灯泡平均寿命的置信区间(置信水平为95%)。 需特写
2.总体比例的区间估计 在重复抽样条件下,置信区间为: 在不重复抽样条件下,置信区间为: 需特写
例题:某高校要估计全校学生中女生所占的比例,采用重复抽样的方法随机抽取了100名学生,其中女生65人。试以95%的置信水平估计该高校学生中女生所占比例的置信区间。 需特写
THANKS THANKS 感谢收看 延时符