Download presentation
Presentation is loading. Please wait.
1
第四章 抽样设计 本章主要内容: 抽样调查概述 随机抽样技术 非随机抽样技术 抽样误差与样本量
2
第一节 抽样调查概述 一、抽样调查的概念和特点
第一节 抽样调查概述 一、抽样调查的概念和特点 抽样调查是市场调查中使用程度较高的一种调查方式,它是按照一定程序,从所研究对象的全体(总体)中抽取一部分(样本)进行调查或观察,并在一定的条件下,运用数理统计的原理和方法,对总体的数量特征进行估计和推断。
3
第一节 抽样调查概述 抽样调查的特点 经济性:样本量减少,节省人力、物力、财力 高效性:只对总体少量单位进行调查 准确性:登记性调查误差较小
4
第一节 抽样调查概述 二、抽样调查的作用 对一些不可能或不必要进行全面调查的社会经济现象,可用抽样调查方式解决。
第一节 抽样调查概述 二、抽样调查的作用 对一些不可能或不必要进行全面调查的社会经济现象,可用抽样调查方式解决。 在经费、人力、物力和时间有限的情况下,采用抽样调查方式,可节省开支,争取时效,用比较少的人力、物力和实践,达到满意的调查效果。 抽样调查客队同一现象在不同时间进行连续不断的调查,可随时了解现象发展变化状况。 运用抽样调查对全面调查进行验证。 抽样调查还可运用于企业管理,尤其是产品质量管理,能更好地使企业为生产和市场服务。
5
第一节 抽样调查概述 三、抽样调查的基本概念 总体指标:
第一节 抽样调查概述 三、抽样调查的基本概念 总体指标: 总体指标是根据总体各单位标志值计算,常用的总体指标有:总体平均数、总体比例、总体方差。 样本指标: 样本指标是根据样本各单位标志值计算。常用的样本指标有样本平均数、样本比例、样本方差。
6
总体指标和样本指标 统计指标 总体 样本 单位数 N n 平均数 抽样比例 定量指标方差 定性指标方差
7
第一节 抽样调查概述 重复抽样: 重复抽样又称有放回抽样,是一种在总体中允许重复抽取样本单位的抽选方法,即从总体中随机抽出一个样本单位后,将他在放回去,使它仍有被选取的机会,在抽样过程中总体单位数始终相同。 不重复抽样: 不重复抽样又称无放回抽样,即先被抽选的单位不再放回到总体中去,即任何单位一经抽出,就不会再有第二次被抽取的可能性。
8
第一节 抽样调查概述 抽样框: 抽样框是指供抽样所用的所有调查单位的详细名单。应该注意的是,在利用现有名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏情况的发生,以提高样本框对总体的代表性。 抽样单元: 为了便于抽样,通常把总体划分为有限个互不重叠又穷尽的部分,每个部分称为一个抽样单元。抽样单元可大可小。
9
第一节 抽样调查概述 四、抽样方案设计 所谓抽样方案设计,就是从一定总体抽取样本资料以前,预先确定抽样程序和方案,在保证所抽选的样本对总体有充分代表性的前提下,力求取得最经济最有效的结果。
10
第一节 抽样调查概述 抽样方案设计的基本内容主要包括 : (一)确定抽样调查的目的、任务和要求;
第一节 抽样调查概述 抽样方案设计的基本内容主要包括 : (一)确定抽样调查的目的、任务和要求; (二)确定调查对象(总体)的范围和抽样单位; (三)确定抽取样本方法; (四)确定必要的样本量; (五)对主要抽样指标的精度提出要求; (六)确定总体目标量的估算方法; (七)制订实施总体方案的办法和步骤。
11
抽 样 方 案 设 计 流 程 定义总体及抽样单位 确定所采用的抽样框 选 择 抽 样 技 术 确 定 样 本 量 确定总体指标估计方法
选 择 抽 样 技 术 确 定 样 本 量 确定总体指标估计方法 定义总体及抽样单位 实 施 抽 样 抽 样 方 案 设 计 流 程
12
第二节 随机抽样 一、简单随机抽样 简单随机抽样又称纯随机抽样,考虑一个包含N个单位的总体,从中抽取n个单位作为样本。如果抽样是不放回的,即同一个单位不能在样本中重复出现,那么总共有 种不同的取法,也就说共有 个不同的随机样本。如果每个样本被抽中的概率都相等,则称这种抽样方法为简单随机抽样。
13
第二节 随机抽样技术 抽签法: 抽签法就是给总体的每个单位编号,并做成号码签,把号码签混合之后,抽取所需单位数,然后,按照抽中的号码,查对调查单位,加以登记。 随机数表法: 随机数表是将0—9十个数字用完全随机的顺序排列编制而得的表。
14
第二节 随机抽样技术 随机数表(部分) 随机数表法: 随机数表是将0—9十个数字用完全随机的顺序排列编制而得的表。
15
第二节 随机抽样技术 二、等距抽样 等距抽样又称系统抽样,就是先将总体各单位按一定顺序排列起来,然后按一定间隔来抽取样本单位。
第二节 随机抽样技术 二、等距抽样 等距抽样又称系统抽样,就是先将总体各单位按一定顺序排列起来,然后按一定间隔来抽取样本单位。 等距抽样与简单随机抽样比较,可使中选单位比较均匀地分布在总体中,尤其当被研究现象的标志变异程度较大,而在实际工作中又不可能抽选更多的样本单位时,这种方式更为有效,因此,等距抽样是商务调查中应用最广的一种抽样方式。
16
第二节 随机抽样技术 三、分层抽样 分层抽样又称类型抽样,它是先将总体所有单位按某些重要标志进行分类(层),然后在各类(层)中采用简单随机抽样或等距抽样方式抽取样本单位的一种抽样方式。 分层抽样的方式,一般有等比例抽样与非等比例抽样。
17
第二节 随机抽样技术 四、整群抽样 如果若干小的抽样单位可组合成一个较大的抽样单位,抽样按大的抽样单位抽取,一旦某个大的抽样单位被抽取,则调查其中每个小的抽样单位,这种抽样称为整群抽样。
18
第二节 随机抽样技术 五、多阶段抽样 在许多情况下,特别在复杂的、大规模的商务调查中,调查单位一般不是一次性直接地抽取到的,而是采用两阶段或多阶段抽取的办法,即先抽大的调查单元,在大单元中抽小单元,再在小单元中抽更小的单元,这种抽样组织方式称为多阶段抽样。
19
案例4-1 多阶段抽样调查的抽样设计 某市有24000名教师,他们分布在全市10个区的200所学校中,现在要求抽取一个有1200名教师组成的样本,进行外语应用能力的测试。如果按照三阶段抽样的方法,我们得到了下列各种不同的抽样方法: 方案 第一阶段 第二阶段 第三阶段 方案1 方案2 方案3 方案4 方案5 方案6 方案7 方案8 方案9 抽取10个区 抽取2个区 抽取8个区 抽取5个区 抽取4个区 抽取3个区 抽取1个区 抽4所学校 抽20所学校 抽15所学校 抽12所学校 抽10所学校 每所学校抽30名教师 每所学校抽6名教师 每所学校抽10名教师 每所学校抽20名教师 每所学校抽40名教师 每所学校抽60名教师 每所学校抽100名教师
20
案例4-1 多阶段抽样调查的抽样设计 究竟该选择哪一个方案呢?也就是说,如何确定每一个阶段的抽样数目呢?我们主要考虑以下两个方面的因素:
案例4-1 多阶段抽样调查的抽样设计 究竟该选择哪一个方案呢?也就是说,如何确定每一个阶段的抽样数目呢?我们主要考虑以下两个方面的因素: 一是各个抽样阶段的子总体的同质性程度。同质性程度高的子总体,所抽取的规模就相应地小一点,反之则应大一点。比如,该市的10个区中,属于不同区的学校相互之间的差异很大,则应该加大第一阶段的抽样规模,即选择方案1。 二是考虑调查者所拥有的人力、物力和经费。一般说来,方案覆盖的样本区域越大,样本的代表性越大,即方案1最好,方案9最差。但是,从实践的角度考虑,抽的区越多,抽取的学校越多,调查人员奔波的范围越广,所需时间、经费越多。因此,方案9最好,方案3最差。 请同学们分析,如果在你所在的城市进行上述调研,选择哪种抽样方案更好一些?
21
第三节 非随机抽样技术 一、方便抽样 方便抽样又称偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。如采取“街头拦截法”,即在街上或路口任意找某个行人,将他(她)作为被访者,进行调查。
22
第三节 非随机抽样技术 二、判断抽样 判断抽样又称目的抽样,它是凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性样本作为调查对象的一种抽样方法。
23
第三节 非随机抽样技术 三、配额抽样 配额抽样是非随机抽样中最流行的一种,配额抽样类似随机抽样中的分层抽样,它也是首先将总体中的所有单位按一定的标志分为若干类(组),然后在每个类(组)中用方便抽样或判断抽样方法选取样本单位。
24
第三节 非随机抽样技术 独立控制配额抽样 独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。 交叉控制配额抽样 交叉控制配额抽样是对调查对象的各个特性的样本数额交叉分配。
25
案例4-2 独立控制配额的抽样方法 某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。 月收入 人数
案例4-2 独立控制配额的抽样方法 某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。 月收入 人数 年龄 性别 1500元以下 20 30岁以下 40 男 100 元 50 30-40岁 60 女 元 70 40-50岁 4500元以上 50岁以上 30 合计 200 从表中可以看出,对收入、年龄、性别三个分类标准,分别规定了样本数额,而没有规定三者之间的关系。因此,在调查员具体抽样时,抽选不同收入段消费者,并不需要顾及年龄和性别标准。同样,在抽选不同年龄或性别的消费者时,也不必顾及其他两个分类标准。这种方法的优点是简单易行,调查员选择余地较大;缺点是调查员可能图一时方便,选择样本过于偏向某一组别,如过多地抽选低收入的女性消费者,从而影响样本的代表性。
26
案例4-2 交叉控制配额的抽样方法 1500元以下 1500-3000元 3000-4500元 4500元以上 合计 男 女 30岁以下 2
案例4-2 交叉控制配额的抽样方法 1500元以下 元 元 4500元以上 合计 男 女 30岁以下 2 5 7 6 40 30-40岁 3 20 10 16 1 60 40-50岁 4 12 30 70 50岁以上 8 37 33 13 39 200 月 收 入 性 别 年 龄
27
第三节 非随机抽样技术 三、滚雪球抽样 滚雪球抽样,顾名思义就是以“滚雪球”的方式抽取样本。即通过少量样本单位以获取更多样本单位的信息。
28
第四节 抽样误差与样本量 一、抽样误差的概念与种类 非抽样误差 非抽样误差是基于抽样之外的许多其它原因而产生的误差。 抽样误差
第四节 抽样误差与样本量 一、抽样误差的概念与种类 非抽样误差 非抽样误差是基于抽样之外的许多其它原因而产生的误差。 抽样误差 抽样误差是由于抽样造成的误差,即用样本估计总体而产生的误差。
29
非抽样误差产生的原因
30
第四节 抽样误差与样本量 影响抽样误差的因素 1、被研究总体各单位标志值的变异程度。 2、抽取的样本量。 3、抽样调查的组织方式
31
第四节 抽样误差与样本量 二、样本量的确定 抽样调查的样本量取决于以下几个因素: 1、被调查对象标志的差异程度 2、允许误差
第四节 抽样误差与样本量 二、样本量的确定 抽样调查的样本量取决于以下几个因素: 1、被调查对象标志的差异程度 2、允许误差 3、调查结果的可靠程度 4、抽样的方法 5、抽样的组织形式
32
第四节 抽样误差与样本量 二、样本量的确定 平均数的样本量确定公式: 重复抽样 不重复抽样 比例的样本量确定公式:
33
案例4-3 样本量的确定 某市进行居民家计调查,按照简单随机不重复抽样方式,已知N=100000,。SE=5元(SE为抽样标准误差),置信度为95%,求所需的样本量。 本题中,当置信度为95%时,t≈2,则=t(SE)=2×5=10(元),则 即需要抽398户。 当t=3时,如果极限抽样误差不变,仍为10,这就意味着抽样标准误差SE缩小为3.3元,在此情况下样本量为: 即需要抽892户。 可见,在允许误差和其他条件不变的情况下,置信度由95. 45%(t= 2)提高到99.73%(t=3)需要增加的样本量为1.24倍。
35
End!
Similar presentations