第四章 抽样设计 本章主要内容: 抽样调查概述 随机抽样技术 非随机抽样技术 抽样误差与样本量.

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements


一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
冀教版四年级数学上册 本节课我们主要来学习 2 、 3 、 5 的倍数特征,同学们要注意观察 和总结规律,掌握 2 、 3 、 5 的倍 数分别有什么特点,并且能够按 要求找出符合条件的数。
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
能力单元三:抽样方案的制作.
关于汇率计算.
第二章 统计数据的搜集 学习目的和要求 学习重点 学习难点 教学方法 授课时数 基本内容.
统计 (1)随机抽样 ①理解随机抽样的必要性和重要性. ②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计 ①了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
网页设计师的职业成长规律 主讲:刘万辉 淮安信息职业技术学院.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
抽样概述 含义:指的是从组成某个社会事物总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法
《高等数学》(理学) 常数项级数的概念 袁安锋
第二章 统计调查 学习目标 本章结构 教学内容 统计术语 案例分析 课后练习.
第七章 固定资产 本章结构 固定资产的性质与分类 固定资产的增加 固定资产的折旧 固定资产的修理 固定资产的减少
常用逻辑用语复习课 李娟.
糖尿病流行病学.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
[引入课题].
统计学原理(第五讲) 罗洪群.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第三节 参数估计 参数估计就是用样本统计量来推算总体参数,有点估计和区间估计两种方法。 一、参数估计的理论基础
SPSS 12.0软件的使用 之二 南昌大学公共卫生学院 郑辉烈.
第四章 抽样技术基础知识 抽样技术的完整概念包括对样本的调查和对总体参数的估计两个方面。首先介绍抽样调查,然后介绍总体参数估计方法。
第五章练习: 一、判断题 1、抽样推断是利用样本资料对总体的数量特 征进行估计的一种统计分析方法,因此不可避
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
1.5.3 近 似 数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
化学品清单 类型.
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
C语言程序设计 主讲教师:陆幼利.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
微机原理与接口技术 微机原理与接口技术 朱华贵 2015年11月13日.
用计算器开方.
实体描述呈现方法的研究 实验评估 2019/5/1.
6.4 你有信心吗?.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
小数的大小比较 仙岩镇第二小学 陈曼丽.
第二章 调查方案设计 第一节 调查方案设计原则及流程 第二节 调查方案的基本内容.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
数据集的抽取式摘要 程龚, 徐丹云.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第五章 数理统计的基本知识 §5.1 总体与样本.
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
我们能够了解数学在现实生活中的用途非常广泛
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第十七讲 密码执行(1).
位似.
Sssss.
第8章 抽样推断与参数估计.
Presentation transcript:

第四章 抽样设计 本章主要内容: 抽样调查概述 随机抽样技术 非随机抽样技术 抽样误差与样本量

第一节 抽样调查概述 一、抽样调查的概念和特点 第一节 抽样调查概述 一、抽样调查的概念和特点 抽样调查是市场调查中使用程度较高的一种调查方式,它是按照一定程序,从所研究对象的全体(总体)中抽取一部分(样本)进行调查或观察,并在一定的条件下,运用数理统计的原理和方法,对总体的数量特征进行估计和推断。

第一节 抽样调查概述 抽样调查的特点 经济性:样本量减少,节省人力、物力、财力 高效性:只对总体少量单位进行调查 准确性:登记性调查误差较小

第一节 抽样调查概述 二、抽样调查的作用 对一些不可能或不必要进行全面调查的社会经济现象,可用抽样调查方式解决。 第一节 抽样调查概述 二、抽样调查的作用 对一些不可能或不必要进行全面调查的社会经济现象,可用抽样调查方式解决。 在经费、人力、物力和时间有限的情况下,采用抽样调查方式,可节省开支,争取时效,用比较少的人力、物力和实践,达到满意的调查效果。 抽样调查客队同一现象在不同时间进行连续不断的调查,可随时了解现象发展变化状况。 运用抽样调查对全面调查进行验证。 抽样调查还可运用于企业管理,尤其是产品质量管理,能更好地使企业为生产和市场服务。

第一节 抽样调查概述 三、抽样调查的基本概念 总体指标: 第一节 抽样调查概述 三、抽样调查的基本概念 总体指标: 总体指标是根据总体各单位标志值计算,常用的总体指标有:总体平均数、总体比例、总体方差。 样本指标: 样本指标是根据样本各单位标志值计算。常用的样本指标有样本平均数、样本比例、样本方差。

总体指标和样本指标 统计指标 总体 样本 单位数 N n 平均数 抽样比例 定量指标方差 定性指标方差

第一节 抽样调查概述 重复抽样: 重复抽样又称有放回抽样,是一种在总体中允许重复抽取样本单位的抽选方法,即从总体中随机抽出一个样本单位后,将他在放回去,使它仍有被选取的机会,在抽样过程中总体单位数始终相同。 不重复抽样: 不重复抽样又称无放回抽样,即先被抽选的单位不再放回到总体中去,即任何单位一经抽出,就不会再有第二次被抽取的可能性。

第一节 抽样调查概述 抽样框: 抽样框是指供抽样所用的所有调查单位的详细名单。应该注意的是,在利用现有名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏情况的发生,以提高样本框对总体的代表性。 抽样单元: 为了便于抽样,通常把总体划分为有限个互不重叠又穷尽的部分,每个部分称为一个抽样单元。抽样单元可大可小。

第一节 抽样调查概述 四、抽样方案设计 所谓抽样方案设计,就是从一定总体抽取样本资料以前,预先确定抽样程序和方案,在保证所抽选的样本对总体有充分代表性的前提下,力求取得最经济最有效的结果。

第一节 抽样调查概述 抽样方案设计的基本内容主要包括 : (一)确定抽样调查的目的、任务和要求; 第一节 抽样调查概述 抽样方案设计的基本内容主要包括 : (一)确定抽样调查的目的、任务和要求; (二)确定调查对象(总体)的范围和抽样单位; (三)确定抽取样本方法; (四)确定必要的样本量; (五)对主要抽样指标的精度提出要求; (六)确定总体目标量的估算方法; (七)制订实施总体方案的办法和步骤。

抽 样 方 案 设 计 流 程 定义总体及抽样单位 确定所采用的抽样框 选 择 抽 样 技 术 确 定 样 本 量 确定总体指标估计方法 选 择 抽 样 技 术 确 定 样 本 量 确定总体指标估计方法 定义总体及抽样单位 实 施 抽 样 抽 样 方 案 设 计 流 程

第二节 随机抽样 一、简单随机抽样 简单随机抽样又称纯随机抽样,考虑一个包含N个单位的总体,从中抽取n个单位作为样本。如果抽样是不放回的,即同一个单位不能在样本中重复出现,那么总共有 种不同的取法,也就说共有 个不同的随机样本。如果每个样本被抽中的概率都相等,则称这种抽样方法为简单随机抽样。

第二节 随机抽样技术 抽签法: 抽签法就是给总体的每个单位编号,并做成号码签,把号码签混合之后,抽取所需单位数,然后,按照抽中的号码,查对调查单位,加以登记。 随机数表法: 随机数表是将0—9十个数字用完全随机的顺序排列编制而得的表。

第二节 随机抽样技术 随机数表(部分) 随机数表法: 随机数表是将0—9十个数字用完全随机的顺序排列编制而得的表。 28 46 53 35 74 92 13 45 20 67 42 15 20 57 80 90 04 36 28 19 26 64 37 15 55 01 26 64 98 56 71 49 72 58 43 57 89 64 27 54

第二节 随机抽样技术 二、等距抽样 等距抽样又称系统抽样,就是先将总体各单位按一定顺序排列起来,然后按一定间隔来抽取样本单位。 第二节 随机抽样技术 二、等距抽样 等距抽样又称系统抽样,就是先将总体各单位按一定顺序排列起来,然后按一定间隔来抽取样本单位。 等距抽样与简单随机抽样比较,可使中选单位比较均匀地分布在总体中,尤其当被研究现象的标志变异程度较大,而在实际工作中又不可能抽选更多的样本单位时,这种方式更为有效,因此,等距抽样是商务调查中应用最广的一种抽样方式。

第二节 随机抽样技术 三、分层抽样 分层抽样又称类型抽样,它是先将总体所有单位按某些重要标志进行分类(层),然后在各类(层)中采用简单随机抽样或等距抽样方式抽取样本单位的一种抽样方式。 分层抽样的方式,一般有等比例抽样与非等比例抽样。

第二节 随机抽样技术 四、整群抽样 如果若干小的抽样单位可组合成一个较大的抽样单位,抽样按大的抽样单位抽取,一旦某个大的抽样单位被抽取,则调查其中每个小的抽样单位,这种抽样称为整群抽样。

第二节 随机抽样技术 五、多阶段抽样 在许多情况下,特别在复杂的、大规模的商务调查中,调查单位一般不是一次性直接地抽取到的,而是采用两阶段或多阶段抽取的办法,即先抽大的调查单元,在大单元中抽小单元,再在小单元中抽更小的单元,这种抽样组织方式称为多阶段抽样。

案例4-1 多阶段抽样调查的抽样设计 某市有24000名教师,他们分布在全市10个区的200所学校中,现在要求抽取一个有1200名教师组成的样本,进行外语应用能力的测试。如果按照三阶段抽样的方法,我们得到了下列各种不同的抽样方法: 方案 第一阶段 第二阶段 第三阶段 方案1 方案2 方案3 方案4 方案5 方案6 方案7 方案8 方案9 抽取10个区 抽取2个区 抽取8个区 抽取5个区 抽取4个区 抽取3个区 抽取1个区 抽4所学校 抽20所学校 抽15所学校 抽12所学校 抽10所学校 每所学校抽30名教师 每所学校抽6名教师 每所学校抽10名教师 每所学校抽20名教师 每所学校抽40名教师 每所学校抽60名教师 每所学校抽100名教师

案例4-1 多阶段抽样调查的抽样设计 究竟该选择哪一个方案呢?也就是说,如何确定每一个阶段的抽样数目呢?我们主要考虑以下两个方面的因素: 案例4-1 多阶段抽样调查的抽样设计 究竟该选择哪一个方案呢?也就是说,如何确定每一个阶段的抽样数目呢?我们主要考虑以下两个方面的因素: 一是各个抽样阶段的子总体的同质性程度。同质性程度高的子总体,所抽取的规模就相应地小一点,反之则应大一点。比如,该市的10个区中,属于不同区的学校相互之间的差异很大,则应该加大第一阶段的抽样规模,即选择方案1。 二是考虑调查者所拥有的人力、物力和经费。一般说来,方案覆盖的样本区域越大,样本的代表性越大,即方案1最好,方案9最差。但是,从实践的角度考虑,抽的区越多,抽取的学校越多,调查人员奔波的范围越广,所需时间、经费越多。因此,方案9最好,方案3最差。 请同学们分析,如果在你所在的城市进行上述调研,选择哪种抽样方案更好一些?

第三节 非随机抽样技术 一、方便抽样 方便抽样又称偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。如采取“街头拦截法”,即在街上或路口任意找某个行人,将他(她)作为被访者,进行调查。

第三节 非随机抽样技术 二、判断抽样 判断抽样又称目的抽样,它是凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性样本作为调查对象的一种抽样方法。

第三节 非随机抽样技术 三、配额抽样 配额抽样是非随机抽样中最流行的一种,配额抽样类似随机抽样中的分层抽样,它也是首先将总体中的所有单位按一定的标志分为若干类(组),然后在每个类(组)中用方便抽样或判断抽样方法选取样本单位。

第三节 非随机抽样技术 独立控制配额抽样 独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。 交叉控制配额抽样 交叉控制配额抽样是对调查对象的各个特性的样本数额交叉分配。

案例4-2 独立控制配额的抽样方法 某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。 月收入 人数 案例4-2 独立控制配额的抽样方法 某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。 月收入 人数 年龄 性别 1500元以下 20 30岁以下 40 男 100 1500-3000元 50 30-40岁 60 女 3000-4500元 70 40-50岁   4500元以上 50岁以上 30 合计 200 从表中可以看出,对收入、年龄、性别三个分类标准,分别规定了样本数额,而没有规定三者之间的关系。因此,在调查员具体抽样时,抽选不同收入段消费者,并不需要顾及年龄和性别标准。同样,在抽选不同年龄或性别的消费者时,也不必顾及其他两个分类标准。这种方法的优点是简单易行,调查员选择余地较大;缺点是调查员可能图一时方便,选择样本过于偏向某一组别,如过多地抽选低收入的女性消费者,从而影响样本的代表性。

案例4-2 交叉控制配额的抽样方法 1500元以下 1500-3000元 3000-4500元 4500元以上 合计 男 女 30岁以下 2 案例4-2 交叉控制配额的抽样方法 1500元以下 1500-3000元 3000-4500元 4500元以上 合计 男 女 30岁以下 2 5 7 6 40 30-40岁 3 20 10 16 1 60 40-50岁 4 12 30 70 50岁以上 8 37 33 13 39 200 月 收 入 性 别 年 龄

第三节 非随机抽样技术 三、滚雪球抽样 滚雪球抽样,顾名思义就是以“滚雪球”的方式抽取样本。即通过少量样本单位以获取更多样本单位的信息。

第四节 抽样误差与样本量 一、抽样误差的概念与种类 非抽样误差 非抽样误差是基于抽样之外的许多其它原因而产生的误差。 抽样误差 第四节 抽样误差与样本量 一、抽样误差的概念与种类 非抽样误差 非抽样误差是基于抽样之外的许多其它原因而产生的误差。 抽样误差 抽样误差是由于抽样造成的误差,即用样本估计总体而产生的误差。

非抽样误差产生的原因

第四节 抽样误差与样本量 影响抽样误差的因素 1、被研究总体各单位标志值的变异程度。 2、抽取的样本量。 3、抽样调查的组织方式

第四节 抽样误差与样本量 二、样本量的确定 抽样调查的样本量取决于以下几个因素: 1、被调查对象标志的差异程度 2、允许误差 第四节 抽样误差与样本量 二、样本量的确定 抽样调查的样本量取决于以下几个因素: 1、被调查对象标志的差异程度 2、允许误差 3、调查结果的可靠程度 4、抽样的方法 5、抽样的组织形式

第四节 抽样误差与样本量 二、样本量的确定 平均数的样本量确定公式: 重复抽样 不重复抽样 比例的样本量确定公式:

案例4-3 样本量的确定 某市进行居民家计调查,按照简单随机不重复抽样方式,已知N=100000,。SE=5元(SE为抽样标准误差),置信度为95%,求所需的样本量。 本题中,当置信度为95%时,t≈2,则=t(SE)=2×5=10(元),则 即需要抽398户。 当t=3时,如果极限抽样误差不变,仍为10,这就意味着抽样标准误差SE缩小为3.3元,在此情况下样本量为: 即需要抽892户。 可见,在允许误差和其他条件不变的情况下,置信度由95. 45%(t= 2)提高到99.73%(t=3)需要增加的样本量为1.24倍。

End!