第8章 抽样推断与参数估计
第一节 抽样误差 第二节 抽样单位数目的确定 第三节 参数估计
第一节 抽样误差 2.1、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 第一节 抽样误差 2.1、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 (三)影响抽样平均误差的因素 2.2、抽样极限误差 2.3、抽样极限误差与抽样平均误差的关系 返回
一、抽样平均误差 (一)抽样平均误差的概念 实际误差 平均误差 抽样平均误差:样本指标与总体指标间平均的离差
二、抽样平均误差计算 1、简单随机抽样平均误差的计算公式 ①平均数的抽样平均误差 ②成数的抽样平均误差
练习 1、某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。 2、该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。
3、据电视观众抽样调查资料显示:电视观众平均收视时间为95分钟,标准差为70,如果采用重复抽样的方法随机抽取10000人或40000人,分别计算抽样平均误差。 4、据CNNIC “中国互联网络发展状况统计报告”显示:截止到 2009年1月中国宽带网民占网民总体的90.6%,如果采用重复随机抽取方法在网民中抽取100人和400人,分别计算抽样平均误差。
5. 从总体300个单位中随机重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( ) (1)2 (2)1 (3) 3 (4) 4 6.从总体300个单位中随机不重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( ) 7.在随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加到: ( ) (1) 1 倍 (2) 2 倍 (3) 3 倍 (4) 4 倍
(1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。 2、类型抽样 (1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。 (2)样本单位数在各类型组中的分配方式 ①等额分配:在各类型组中分配同等单位数。 ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即: ③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。
(3)抽样平均误差的计算公式 ①平均数的抽样平均误差 重复 不重复且等比例 ②成数的抽样平均误差
②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块 例 题 ①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为:300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为:420 420 450 460 490 520。抽查4块,测定12块地的平均亩产量,计算其抽样误差。 ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块 计算各组方差 平均组内方差 抽样误差
平原 丘陵 亩产量 300 1600 330 100 340 370 900 合计 3600 亩产量 420 1600 450 100 460 490 900 520 3600 合计 7800
② 地块数 高产田数 高产田比重% 丘陵 6 2 33.3 66.67 22.2 平原 100
3、等距抽样 (1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。 (2)排对的方法 ①无关标志排队 ②有关标志排队 (3)抽取样本单位的方法 ①按相等的距离取样 ②对称等距取样 (4)抽取第一个样本单位的方法 ①随机抽取 ②居中抽取
4、整群抽样 (3)例题 (1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 (2)抽样平均误差的计算公式 某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,样本资料如下: 计算抽样平均误差 (3)例题
一昼夜有1440分钟,即把总体分为1440群,R=1440 每隔144分钟抽取1分钟的水泥(10袋),r= 10
(三)影响抽样平均误差的因素 1、总体标准差的大小 2、样本单位数的多少 3、抽样方法的不同 4、抽样组织方式的差别
2.2 抽样极限误差 样本指标围绕总体指标左右两侧波动形成的一定范围。 抽样极限误差:样本指标与总体指标最大可能的误差范围
2.3、抽样极限误差与抽样平均误差的关系 (二)关系 (一)抽样分布 据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。 (二)关系
第三节 抽样单位数目的确定 3.1、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样 3.2、影响抽样单位数目的因素
3.1 抽样单位数目的计算 (一)简单随机抽样单位数目的确定 1、计算公式 (1)平均数 (2)成数
(2)根据以往资料的估计,该类产品的一等品率为 2.例题 (1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超过0.9千克,需要抽多少样本单位? 按题意 (2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本单位?
(二)类型抽样 1、计算公式 重复抽样 不重复抽样 平均数
2、例题 某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均方差为0.549克,合格率的类型平均方差为0.02787,要求可靠程度为何95%,平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位? 据题意
(三)等距抽样 计算公式 (1)按有关标志排队 同类型重复抽样 (2)按无关标志排队 同简单随机不重复抽样
3.2、影响抽样单位数目的因素 总体各单位的变异程度 抽样推断的准确程度△ 抽样推断的可靠程度Z 抽样的组织形式 抽样的方法
4、两个总体比例之差的估计 4.1 估计量的优良标准:无偏性、有效性、一致性 4.2 抽样估计的方法 第四节 抽样估计 4.1 估计量的优良标准:无偏性、有效性、一致性 4.2 抽样估计的方法 (一)点估计:直接用样本指标代替总体指标 不能准确的告诉我们估计的把握程度 (二)区间估计 :不仅仅告诉我们一个范围,告诉我们估计的把握程度 1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计 4、两个总体比例之差的估计
(1)样本取自总体方差已知的正态分布(大、小样本) 二、抽样估计的方法 返回 (一)点估计 (二)区间估计 特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范围,同时对参数落在某一范围内给定相应概率的保证程度。z-概率度 1、平均数的区间估计 (1)样本取自总体方差已知的正态分布(大、小样本)
例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差是3公斤,现给定抽样误差极限为6公斤,求总体平均亩产落在估计区间的概率? 已知: u=3公斤 Δ=6公斤 则估计区间(600-6,600+6)=(594,606) 查正态概率表得,落在估计区间的概率为: F(z)=F(2)=95.45%
②根据给定的置信度F(z)=90%,查概率表z=1.64 ③计算: 例:麦当劳餐馆在7星期内抽查49名顾客的消费额如下,在概率90%的保证下,顾客平均消费额的估计区间. 15 24 38 26 30 42 18 30 25 34 44 20 35 46 28 47….. 解:①计算样本的平均数和标准差: ②根据给定的置信度F(z)=90%,查概率表z=1.64 ③计算: 消费额下限= 消费额上限= 点估计:麦当劳餐馆顾客平均消费额为32元 区间估计:以90%的概率保证,麦当劳餐馆顾客消费额在29.8-34.2之间
某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。 5500包原材料的平均重量在63.14~66.86之间。
总体平均数估计 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算估计区间的上下限。 根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下: ①抽取样本,并根据样本的标志值求出样本平均数 和标准差S,在大样本的情况下用S代替 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算估计区间的上下限。
例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96 例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96.76%(z=2.14)的条件下建立广告平均费用的置信区间。 电视台一分钟广告的平均费用在8894~11106之间。
②根据给定的极限抽样误差,估计总体平均数上下限。 ③根据 概率度z, 查正态分布概率表,求得置信度F(z)。 (二)根据极限抽样误差 ,求概率保证度F(z) 。 具体步骤如下: ①抽取样本,并根据样本的标志值求出样本平均数 作为总体平均数的估计值,并计算标准差S以推算平均误差 ②根据给定的极限抽样误差,估计总体平均数上下限。 ③根据 概率度z, 查正态分布概率表,求得置信度F(z)。
在一项新广告的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试求会记起广告语占总体比率的95%置信度的估计区间。 根据样本资料计算: P=n1/n2=240/400=60% 根据给定的置信度要求F(Z)= 95%,查表Z=1.96 根据 以概率95%的保证程度,会计会记起广告语的人数占总体比率的55.2-64.8之间
总体成数的估计 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算总体成数的上下限。 (一)根据置信度的要求,估计极限误差可能的范围,并指出估计区间范围,具体步骤如下: ①抽取样本,计算样本的成数 p和标准差S,并由此推算出抽样的平均误差u ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算总体成数的上下限。
该企业由于工资低离开的职工比例为63.6% 与76.4%之间 成数的区间估计 例1:某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了200人访问,有140人离开的原因是工资太低。以95%的置信水平对总体这种原因离开的人员比例进行区间估计。 该企业由于工资低离开的职工比例为63.6% 与76.4%之间
Thank You !