Download presentation
Presentation is loading. Please wait.
1
第8章 抽样推断与参数估计
2
第一节 抽样误差 第二节 抽样单位数目的确定 第三节 参数估计
3
第一节 抽样误差 2.1、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样
第一节 抽样误差 2.1、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 (三)影响抽样平均误差的因素 2.2、抽样极限误差 2.3、抽样极限误差与抽样平均误差的关系 返回
4
一、抽样平均误差 (一)抽样平均误差的概念 实际误差 平均误差 抽样平均误差:样本指标与总体指标间平均的离差
5
二、抽样平均误差计算 1、简单随机抽样平均误差的计算公式 ①平均数的抽样平均误差 ②成数的抽样平均误差
6
练习 1、某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。
2、该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。
7
3、据电视观众抽样调查资料显示:电视观众平均收视时间为95分钟,标准差为70,如果采用重复抽样的方法随机抽取10000人或40000人,分别计算抽样平均误差。
4、据CNNIC “中国互联网络发展状况统计报告”显示:截止到 2009年1月中国宽带网民占网民总体的90.6%,如果采用重复随机抽取方法在网民中抽取100人和400人,分别计算抽样平均误差。
8
5. 从总体300个单位中随机重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( )
(1)2 (2)1 (3) (4) 4 6.从总体300个单位中随机不重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( ) 7.在随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加到: ( ) (1) 1 倍 (2) 2 倍 (3) 3 倍 (4) 4 倍
9
(1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。
2、类型抽样 (1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。 (2)样本单位数在各类型组中的分配方式 ①等额分配:在各类型组中分配同等单位数。 ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即: ③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。
10
(3)抽样平均误差的计算公式 ①平均数的抽样平均误差 重复 不重复且等比例 ②成数的抽样平均误差
11
②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块
例 题 ①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为: 。 6块处于平原地带,亩产量(斤)分别为: 。抽查4块,测定12块地的平均亩产量,计算其抽样误差。 ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块 计算各组方差 平均组内方差 抽样误差
12
平原 丘陵 亩产量 300 1600 330 100 340 370 900 合计 3600 亩产量 420 1600 450 100 460 490 900 520 3600 合计 7800
13
② 地块数 高产田数 高产田比重% 丘陵 6 2 33.3 66.67 22.2 平原 100
14
3、等距抽样 (1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。 (2)排对的方法
①无关标志排队 ②有关标志排队 (3)抽取样本单位的方法 ①按相等的距离取样 ②对称等距取样 (4)抽取第一个样本单位的方法 ①随机抽取 ②居中抽取
15
4、整群抽样 (3)例题 (1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 (2)抽样平均误差的计算公式
某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,样本资料如下: 计算抽样平均误差 (3)例题
16
一昼夜有1440分钟,即把总体分为1440群,R=1440 每隔144分钟抽取1分钟的水泥(10袋),r= 10
17
(三)影响抽样平均误差的因素 1、总体标准差的大小 2、样本单位数的多少 3、抽样方法的不同 4、抽样组织方式的差别
18
2.2 抽样极限误差 样本指标围绕总体指标左右两侧波动形成的一定范围。 抽样极限误差:样本指标与总体指标最大可能的误差范围
19
2.3、抽样极限误差与抽样平均误差的关系 (二)关系 (一)抽样分布
据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。 (二)关系
20
第三节 抽样单位数目的确定 3.1、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样 3.2、影响抽样单位数目的因素
21
3.1 抽样单位数目的计算 (一)简单随机抽样单位数目的确定 1、计算公式 (1)平均数 (2)成数
22
(2)根据以往资料的估计,该类产品的一等品率为
2.例题 (1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超过0.9千克,需要抽多少样本单位? 按题意 (2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本单位?
23
(二)类型抽样 1、计算公式 重复抽样 不重复抽样 平均数
24
2、例题 某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均方差为0.549克,合格率的类型平均方差为 ,要求可靠程度为何95%,平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位? 据题意
25
(三)等距抽样 计算公式 (1)按有关标志排队 同类型重复抽样 (2)按无关标志排队 同简单随机不重复抽样
26
3.2、影响抽样单位数目的因素 总体各单位的变异程度 抽样推断的准确程度△ 抽样推断的可靠程度Z 抽样的组织形式 抽样的方法
27
4、两个总体比例之差的估计 4.1 估计量的优良标准:无偏性、有效性、一致性 4.2 抽样估计的方法
第四节 抽样估计 4.1 估计量的优良标准:无偏性、有效性、一致性 4.2 抽样估计的方法 (一)点估计:直接用样本指标代替总体指标 不能准确的告诉我们估计的把握程度 (二)区间估计 :不仅仅告诉我们一个范围,告诉我们估计的把握程度 1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计 4、两个总体比例之差的估计
28
(1)样本取自总体方差已知的正态分布(大、小样本)
二、抽样估计的方法 返回 (一)点估计 (二)区间估计 特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范围,同时对参数落在某一范围内给定相应概率的保证程度。z-概率度 1、平均数的区间估计 (1)样本取自总体方差已知的正态分布(大、小样本)
29
例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差是3公斤,现给定抽样误差极限为6公斤,求总体平均亩产落在估计区间的概率?
已知: u=3公斤 Δ=6公斤 则估计区间(600-6,600+6)=(594,606) 查正态概率表得,落在估计区间的概率为: F(z)=F(2)=95.45%
31
②根据给定的置信度F(z)=90%,查概率表z=1.64 ③计算:
例:麦当劳餐馆在7星期内抽查49名顾客的消费额如下,在概率90%的保证下,顾客平均消费额的估计区间. ….. 解:①计算样本的平均数和标准差: ②根据给定的置信度F(z)=90%,查概率表z=1.64 ③计算: 消费额下限= 消费额上限= 点估计:麦当劳餐馆顾客平均消费额为32元 区间估计:以90%的概率保证,麦当劳餐馆顾客消费额在 之间
32
某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。
5500包原材料的平均重量在63.14~66.86之间。
33
总体平均数估计 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算估计区间的上下限。
根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下: ①抽取样本,并根据样本的标志值求出样本平均数 和标准差S,在大样本的情况下用S代替 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算估计区间的上下限。
34
例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96
例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96.76%(z=2.14)的条件下建立广告平均费用的置信区间。 电视台一分钟广告的平均费用在8894~11106之间。
35
②根据给定的极限抽样误差,估计总体平均数上下限。 ③根据 概率度z, 查正态分布概率表,求得置信度F(z)。
(二)根据极限抽样误差 ,求概率保证度F(z) 。 具体步骤如下: ①抽取样本,并根据样本的标志值求出样本平均数 作为总体平均数的估计值,并计算标准差S以推算平均误差 ②根据给定的极限抽样误差,估计总体平均数上下限。 ③根据 概率度z, 查正态分布概率表,求得置信度F(z)。
36
在一项新广告的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试求会记起广告语占总体比率的95%置信度的估计区间。
根据样本资料计算: P=n1/n2=240/400=60% 根据给定的置信度要求F(Z)= 95%,查表Z=1.96 根据 以概率95%的保证程度,会计会记起广告语的人数占总体比率的 之间
37
总体成数的估计 ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算总体成数的上下限。
(一)根据置信度的要求,估计极限误差可能的范围,并指出估计区间范围,具体步骤如下: ①抽取样本,计算样本的成数 p和标准差S,并由此推算出抽样的平均误差u ②根据给定的置信度F(z),查正态分布概率表得到z ③根据 计算总体成数的上下限。
38
该企业由于工资低离开的职工比例为63.6% 与76.4%之间
成数的区间估计 例1:某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了200人访问,有140人离开的原因是工资太低。以95%的置信水平对总体这种原因离开的人员比例进行区间估计。 该企业由于工资低离开的职工比例为63.6% 与76.4%之间
39
Thank You !
Similar presentations