2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应

Slides:



Advertisements
Similar presentations
渡黑水溝 郁永河. 2 戎克船:是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史,我們到底了解多少呢?不妨試著說出 就我們所知有關台灣開發史的故事、小說、電影、音樂與大 家分享。 ∗ 2. 什麼是黑水溝?黑水溝為什麼會成為大陸移民渡海來臺時最 大的威脅? ∗ 3. 有聽過「六死三留一回頭」、「有唐山公,無唐山嬤」這兩.
Advertisements

2 、 5 倍数的特征 学习目标 1. 掌握 2 、 5 倍数的特征,能判 断一个数是否是 2 、 5 的倍数。 2. 理解奇数和偶数的意义,正 确判断一个数是奇数还是偶数。
中外领导力 的 跨文化 比较分析 主讲人:. 壹 领导力理论 中国古代 “ 修身、齐家、治国、平天下 ” —— 孔子(儒家思想 ) 庄子(道家学派) 老子(道家学派)
頭皮的健康與診斷 頭皮保養的目的 乾性頭皮的產生原因及處理 油性頭皮的產生原因及處理 植物精油芳香療法的認識與應用 第 3 章 頭皮部位的處理 ………………………………………………………………………….…
窮人與富人的決定性差異 書名: 窮人與富人的距離 0.05mm 作者:張禮文出版社:海鴿. 窮人與富人的決定性差異 窮人和富人的關鍵差異不在口袋金錢的多寡,而 在腦袋。這本書將全面解開窮人之所以貧窮,而 富人之所以富裕的所有奧秘。 窮人和富人的關鍵差異不在口袋金錢的多寡,而 在腦袋。這本書將全面解開窮人之所以貧窮,而.
一、研究背景 植物组培育细胞培养源于 19 世纪后半 叶,当时植物细胞全能性的概念还没有 完全确定。人们便对此进行研究。 目前,植物组培已经变成了一种常规 的技术,广泛应用于植物的脱毒,快繁 ,基因工程,一串研究,次生代谢物质 生产,工厂化育苗等多方面。
有教無類 因材施教 適性揚才 多元進路 優質銜接
大学生入党积极分子培训教材 主编:蔡中华 曹培强.
水痘.
29.2 三视图.
第二章營建規劃施工與管理 營建工程過程不外乎規劃、設計、施工、管理等。
國立金門高級農工職業學校 水產養殖科 游育霖
程啸 (法学博士、清华大学法学院副教授、硕士生导师、洪堡学者)
九寨沟 领略人间仙境.
机关公文基础知识 黄晓璐.
鞍钢冷轧钢板(莆田)有限公司 毕业生招聘宣讲会
《数学》( 新人教版.七年级 上册 ) 第一章 有理数 授课人:三元中学 苏鼎明.
第二單元 校園的昆蟲 1. 校園的小動物 2. 昆蟲一族 3. 昆蟲變變變 4. 我的昆蟲寶貝 5. 昆蟲博覽會 吳端敏 製.
机械工业发展史.
第十章 暑 温 辽宁中医药大学 温病学教研室.
桥城中学创建广东省现代教育技术实验学校自查报告
熱帶雨林對人類的 局限和可能性.
第二課 鬼 頭 刀 廖鴻基.
6-3 玻璃製品 一、平版玻璃 將熔融的玻璃漿由滾筒間流過,可不斷製造較 大連續之玻璃,可分為 (一)透明玻璃:表面光滑清透。
钢筋混凝土楼梯模板施工 学习目标 主要内容.
2014年国家义务教育质量监测 体育现场测试说明 浙江省教育质量监测中心 2014年11月.
長榮中學高中部104年甄選入學 作業相關事項說明會
指導老師:曾憲正 老師 組員:公廣2A 4980M089鄭欽鴻 M039鄭仁凱 2B M060呂明耿
义乌梦娜袜业 广告策划书 组员:徐琴娜 金春晓 陈晓静 陈菁菁 毛振华 王勤 指导老师:张益丹 完成时间:2006年12月.
昆蟲總動員 三年級教學群.
风 温 主讲人 王洪京.
东方底特律—— 大美十堰.

春 温 主讲人 王洪京.
美学概论 主讲教师 孙建章 沈阳电大文法系.
市场营销原理与实训 市场营销策略模块 项目五 产品策略.
乳房护理 主编:卢荣华.
第四章 室内设计与人体工程学 第一节 人体工程学与室内设计 人体工程学也叫人机工程学、人类工效学、人类工程学、工程心理学、宜人学等。
重庆市渝州工程勘察设计技术服务中心---刘刚 2013年3月29日
4个故事 在很久很久以前….
前列腺结石 山西医科大学第一医院 王靖宇.
全日制义务教育物理课程标准 ——“运动与相互作用”主题解读及实施建议
第十一章 结构施工图 11-1 概述 一、结构施工图(结施):P308
第九章 居住区规划 §1、居住区规划的任务与编制.
人教版七年级下册第七章第四节 人教版8年级下册第五章第二节 北方地区和南方地区 制作:克拉玛依市独山子第一中学地理组.
汽车维修基础 锉削的操作方法 制作人:庹鉴.
4 家具与室内陈设设计 本章提要 本章主要介绍人体工学、家具与室内陈设设计的基本知识及其内涵。其中包括人体工学概述,家具的类型,家具在室内空间环境中的作用,家具的选用与布置,室内陈设的意义、作用和分类,室内陈设的选择与布置,以及常见空间陈设品的应用等内容。
2010高考中国地理 复习系列课件 福建省长泰一中 姚秀元
昆虫 昆虫的认识 制作昆虫标本方法与过程 1 2.
2014年下学期C1403 第21周家校互联.
“仙居恩施”市情讲座 恩施市委党校 陈 平.
第3章 建筑剖面设计.
统计图的选用(二).
第3章.建筑剖面设计 学习要求与学习重点 1. 学习要求:熟悉建筑各部分高度、层数、层高的确定;掌握建筑空间的组合和利用;能够根据建筑的使用要求合理地确定建筑的剖面形状和尺寸。 2.学习重点:掌握建筑各部分高度的确定及层数、净高、层高的概念;掌握室内外高差确定的依据;掌握建筑空间的利用的方法。
趣味硬币.
引自中山大学研究生,40余项国家专利获得者,著名低视力弱视治疗专家及发明家刘东光教授的观点
静脉剥脱器介绍 北京普益盛济科技有限公司.
人教版八年级地理上册 第三章第三节(第2课时) 水资源.
楼层与地层 水平分隔建筑空间的构件,楼层分隔上下空间,地层分隔底层空间并与土壤直接相连。 楼层的结构层为楼板,地层的结构层为垫层。
絲 綢 之 路 育 英 國 中 陳 昱 伶.
学习单元3 其它焊接方法.
公文写作与常见病例分析.
焊接结构的不足之处大多反映在焊接接头上的问题,主要有以下几方面:
名片礼仪 授课人:三原职教中心 安小艳.
机械制图 识图基础知识讲解 编制:王应.
年 和 電 鍍 原理製程教育訓練.
臺北市政府教育局96學年度第1學期 學生校外會 學生交通安全校園巡迴宣講題目: 交通(機車)事故預防與 處理 台北市汽車駕駛訓練中心 製作.
高山草原生態系 分布於臺灣3000公尺以上高山,如中央山脈.玉山山脈.雪山山脈 分為玉山箭竹草原,高山芒草原及兩者混生林三種
訓練法 年度計畫表 橄欖球專長 報告者: 競四四B 羅仕俊.
板料冲压 利用装在冲床上的设备(冲模)使板料产生分离或变形的一种塑性成形方法。它主要用于加工板料(10mm以下,包括金属及非金属板料)类零件,故称为板料冲压。 冲压加工要求被加工材料具有较高的塑性和韧性,较低的屈强比和时效敏感性,一般要求碳素钢伸长率δ≥16%、屈强比σs/σb≤70%,低合金高强度钢δ≥14%、
Presentation transcript:

2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应 第2章 简单随机抽样(SRS) 2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应

2.1定义与抽选方法 一、定义与符号 简单随机抽样也称为纯随机抽样。 从含有 N 个单元的总体中抽取 n 个单元组成样本,如果抽样是不放回的,则所有可能的样本有 个,若每个样本被抽中的概率相同,都为 ,这种抽样方法就是简单随机抽样。 具体抽样时,通常是逐个抽取样本单元,直到抽满n个单元为止。 有限

(1)放回简单随机抽样(SRS with replacement) 放回简单随机抽样 不放回简单随机抽样 (1)放回简单随机抽样(SRS with replacement) 当从总体N个抽样单元中抽取n个抽样单元时,如果依次抽取单元时,不管以前是否被抽中过,每次都从N个抽样单元中随机抽取,这时,所有可能的样本为 ? 个(考虑样本单元的顺序), 每个样本被抽中的概率为? 放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是相互独立进行的,这一点是它与不放回简单随机抽样的主要不同之处。 放回简单随机抽样的样本量不受总体大小的限制,可以是任意的。

简单随机抽样的抽取原则: (1)按随机原则取样; (2)每个抽样单元被抽中的概率都是已知的或事先确定的; (3)每个抽样单元被抽中的概率都是相等的。 所有可能样本每个样本被抽中的概率相同 所有可能样本每个样本被抽中的概率相同

【例2.1】 设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序): 1,1 2,1 3,1 4,1 5,1 1,2 2,2 3,2 4,2 5,2 1,3 2,3 3,3 4,3 5,3 1,4 2,4 3,4 4,4 5,4 1,5 2,5 3,5 4,5 5,5

(2)不放回简单随机抽样 (SRS without replacement) 当从总体N个抽样单元中依次抽取n个抽样单元时,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样。 不放回简单随机抽样的样本量要受总体大小的限制。 在实际工作中,更多的采用不放回简单随机抽样。

【例2.2】 设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个: 1,2 2,3 3,4 4,5 1,3 2,4 3,5   1,4 2,5 1,5

符号 大写符号表示总体的标志值, 用小写符号表示样本的标志值 总 体 样 本

总体指标值上面带符号“^”的表示由样本得到的总体指标的估计。 称 为抽样比,记为f 。 估计量的方差用大写的V表示,对 的样本估计,不用 而用 表示。

二、抽选方法 1.抽签法 2.随机数法——随机数表、随机数骰子、摇奖机、计算机产生的伪随机数 随机数表法: N=327 n=5 讨论: (1) 总体编号为1~35,在00~99中产生随机数,若=00或>35,则抛弃重抽。 (2) 总体编号为1~35,在00~99中产生随机数,以除以35,余数作为被抽中的数,如果余数为0,则被抽中的数为35。

三、地位与作用 优点 缺点 很少单独使用,一般结合其他方法使用 没有其他信息时使用 多变量复杂数据分析 简单直观 理论基础 N很大时难以获得抽样框 样本分散不易实施,调查费用高 很少单独使用,一般结合其他方法使用 没有其他信息时使用 多变量复杂数据分析

2.2 总体均值、总量、比例的估计 判断下面要估计的总体目标量分别属于什么类型? 调查城市居民家庭平均用电量。 估计湖中鱼的数量。 2.2 总体均值、总量、比例的估计 判断下面要估计的总体目标量分别属于什么类型? 调查城市居民家庭平均用电量。 估计湖中鱼的数量。 测试日光灯的寿命。 估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重。 估计婴儿出生性别比。 检测食盐中碘含量。 

一、对总体均值的估计 以样本均值作为总体均值的估计 性质1:对于简单随机抽样, 是 的无偏估计。

例设总体为{0,1,3,5,6},计算总体均值 =3、总体方差 =5.2和 =6.5;给出全部 的样本,并验证 及 。 例设总体为{0,1,3,5,6},计算总体均值 =3、总体方差 =5.2和 =6.5;给出全部 的样本,并验证 及 。 样本编号 单元1 单元2 样本均值 - 样本方差 1 0.5 -2.5 2 3 1.5 -1.5 4.5 5 2.5 -0.5 12.5 4 6 18 -1 8 7 3.5 9 10 平均 5.5   6.5 方差1.95

证明 性质1 对于固定的有限总体,估计量的期望是对所有可能样本求平均得到的,因此 总体中每个特定的单元 在不同的样本中出现的次数。

证明 性质1(对称性论证法) 由于每个单元出现在总体所有可能样本中的次数相同,因此 一定是 的倍数,且这个倍数就是 ,

性质2: 对于有限总体的方差定义 : 性质2:对于简单随机抽样, 的方差 式中: 为抽样比, 为有限总体校正系数。

证明性质2(对称论证法): 中的求和是对 项的, 中的求和是对 项的

利用无限总体理论 每个特定单位被选入样本的概率: =P(i)= 故其定义为: * 不放回抽样 * 每个样本被抽中的概率为 * 每个单位被选入样本的概率

Mean = 随机变量

证明性质2

简单随机抽样下,简单估计量估计精度影响因素: 估计量的方差 是衡量估计量精度的度量。影响估计量方差的因素主要是样本量n,总体大小N和总体方差 。 通常N很大,当f<0.05时,可将 近似取为1。 总体方差是我们无法改变的; 因此,在简单随机抽样的条件下,只有通过加大样本量来提高估计量的精度。

性质3: 的样本无偏估计为: 证明 :

大样本下,抽样调查估计量渐进正态

【例2.3】 我们从某个=100的总体中抽出一个大小为=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。 序号 1 2 4 5 6 7 8 9 10 15

由置信度95%对应的 ,因此,可以以95%的把握说总体平均水平大约在 之间,即2.4295和7.5705之间。

有放回简单随机抽样

二、对总体总量的估计

【例2.4】续例2.3。估计总体总量,并给出在置信度95%的条件下,估计的极限相对误差。 在置信度95%下, 的极限相对误差为:

三、对总体比例的估计 某一类特征的单元占总体单元数中的比例P. 将总体单元按是否具有这种特征划分为两类,设总体中有个单元具有A这个特征,如果对每个单元都定义指标值

总体方差:

估计量 性质5:对于简单随机抽样, 是 P 的无偏估计。 的方差为:

证明

【例2.5】 某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的近似置信区间、极限绝对误差。假定这时的抽样比可以忽略。

95%近似置信区间为〔 58.37%,71.63% 〕

2.3 样本量的确定 费用 总费用 固定费用 可变费用 设计费 分析费 办公费 管理费 场租费 等 访问员费 交通费 礼品费 电话费 等

STEPS 所需要的精度 找出样本量与精度之间的关系 估计所需的数值,求解 n 如超出预算,调整精度值重新计算

精度margin of error 对精度的要求通常以允许最大绝对误差(绝对误差限)或允许最大相对误差( 相对误差限)来表示。

样本量足够大时,可用正态分布近似 变异系数

Sample Size n0为重复抽样条件下的样本量 当N很大时, 0, n n0,wr与wor几乎没有区别。

总体参数为P的情形

f<0.05

总体参数的预估计 根据预调查数据或以前文献资料,对有些连续性调查 根据数据的分布粗略估算S,例如全距/4,全距/ 6 试点调查,或采用两步抽样,调查可以分为两步,首先确定一个可以承受的样本量,调查后对估计精度进行计算,如果精度达到要求,则不再进行下一步,否则,计算为达到精度要求所需的样本量,再调查补充样本

通过定性分析 ,最好是对总体变异系数进行分析并估计,因为变异系数通常变化不大. 对于总体比例估计,如果P在0.5附近(0.2-0.8),可根据PQ在P=0.5时达到极大值来对样本量进行计算

样本量设计中的误区 1. 估计精度越高越好吗? 简单随机抽样估计比例P的样本量与误差(当P=0.5时) 样本量 误差d 50 0.14 50 0.14 100 0.10 500 0.045 1000 0.032 10000 0.0098 对精度要求的判断十分重要。为得到最小误差而选择最 大样本量不是好的选择。

2. 样本量与总体规模N有关吗?按照总体比例确定样本量合适吗? 例:简单随机抽样估计P,置信度95%,允许误差5%,在P=0.5条件下 总体规模(N) 所需样本量(n) 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400

抽样调查中的样本量 由此可知,在精度要求相同条件下,在北 京市进行一项调查和在全国进行一项调查,样 本量的差别并不大。 总体规模越大,进行抽样调查的效率越高。 若分类、分区、分层分别进行估计,如何处理? 对于多项目,如何处理?

其他影响因素 1. 所研究问题目标量的个数 2. 调查表的回收率 例如回收率估计为80%,则应接触的样本量为计算出所需样本量的1.25倍; 3.非抽样误差 4.资源限制 5.有效样本

2.4 逆抽样与设计效果 设计效果(Design effect, Deff) Deff Var( )为复杂样本估计量的方差。 定义:简单随机抽样的样本估计量的方差与复杂抽样的样本估 计 量的方差的比率。 Deff Var( )为复杂样本估计量的方差。

某个抽样设计在同样样本量条件下估计量的方差。 设计效果 基什(L. Kish)提出 比较不同抽样方法的效率. 不放回简单随机抽样单估计量的方差

(1)评价抽样设计的一个依据, (2)计算样本量 如多阶段抽样的 Deff大约在2~2.5之间。 n= n’(deff) 则抽样设计比简单随机抽样的效率高; 如果deff>1, 则抽样设计比简单随机抽样的效率低。 (2)计算样本量   如多阶段抽样的 Deff大约在2~2.5之间。 n= n’(deff) n’为简单随机抽样所需样本量。

放回简单随机抽样的deff为: 常用于复杂抽样样本量的确定;在一定精度条件下,简单随机抽样所需的样本量比较容易得到,复杂抽样的样本量为,

逆抽样 对于稀有事件,所需的样本量会很大,例如: 稀有事件的抽样问题:如果估计的是非常稀有事件的比例,这时总体比例很小,用极限相对误差比极限绝对误差更好些。 对于稀有事件,所需的样本量会很大,例如:

逆抽样 针对稀有事件并无法给出确切范围, 霍丹(Haldane)提出的逆抽样方法: 对总体比例事先不同的假定,所导致的样本量差异非常大。 霍丹(Haldane)提出的逆抽样方法: 即事先确定一个整数m(m>1),进行逐个抽样,直到抽到m个所考虑特征的单元为止.

设n是实际的样本量,则总体比例P的一个无偏估计为 很接近于1

规定了 或r、 t后,就可以确定m。如规定 =20%,则m=27。 可以证明,这时所需样本量n的均值为

作业: 2.为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出 元, 试根据此估计: 2.为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出 元, 试根据此估计: (1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。 (2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少? End !