2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应

Slides:

Advertisements

Similar presentations

渡黑水溝郁永河. 2 戎克船：是明末清初時期往返兩岸的主要交通工具 ∗ 1. 關於台灣的開發歷史，我們到底了解多少呢？不妨試著說出就我們所知有關台灣開發史的故事、小說、電影、音樂與大家分享。 ∗ 2. 什麼是黑水溝？黑水溝為什麼會成為大陸移民渡海來臺時最大的威脅？ ∗ 3. 有聽過「六死三留一回頭」、「有唐山公，無唐山嬤」這兩.

Advertisements

2 、 5 倍数的特征学习目标 1. 掌握 2 、 5 倍数的特征，能判断一个数是否是 2 、 5 的倍数。 2. 理解奇数和偶数的意义，正确判断一个数是奇数还是偶数。

中外领导力的跨文化比较分析主讲人：. 壹领导力理论中国古代 “ 修身、齐家、治国、平天下 ” —— 孔子（儒家思想）庄子（道家学派）老子（道家学派）

頭皮的健康與診斷頭皮保養的目的乾性頭皮的產生原因及處理油性頭皮的產生原因及處理植物精油芳香療法的認識與應用第 3 章頭皮部位的處理 ………………………………………………………………………….…

窮人與富人的決定性差異書名：窮人與富人的距離 0.05mm 作者：張禮文出版社：海鴿. 窮人與富人的決定性差異窮人和富人的關鍵差異不在口袋金錢的多寡，而在腦袋。這本書將全面解開窮人之所以貧窮，而富人之所以富裕的所有奧秘。窮人和富人的關鍵差異不在口袋金錢的多寡，而在腦袋。這本書將全面解開窮人之所以貧窮，而.

一、研究背景植物组培育细胞培养源于 19 世纪后半叶，当时植物细胞全能性的概念还没有完全确定。人们便对此进行研究。目前，植物组培已经变成了一种常规的技术，广泛应用于植物的脱毒，快繁，基因工程，一串研究，次生代谢物质生产，工厂化育苗等多方面。

有教無類因材施教適性揚才多元進路優質銜接

大学生入党积极分子培训教材主编：蔡中华曹培强.

29.2 三视图.

第二章營建規劃施工與管理營建工程過程不外乎規劃、設計、施工、管理等。

國立金門高級農工職業學校水產養殖科游育霖

程啸（法学博士、清华大学法学院副教授、硕士生导师、洪堡学者）

九寨沟领略人间仙境.

机关公文基础知识黄晓璐.

鞍钢冷轧钢板（莆田）有限公司毕业生招聘宣讲会

《数学》( 新人教版.七年级上册 ) 第一章有理数授课人:三元中学苏鼎明.

第二單元校園的昆蟲 1. 校園的小動物 2. 昆蟲一族 3. 昆蟲變變變 4. 我的昆蟲寶貝 5. 昆蟲博覽會吳端敏製.

机械工业发展史.

第十章暑温辽宁中医药大学温病学教研室.

桥城中学创建广东省现代教育技术实验学校自查报告

熱帶雨林對人類的局限和可能性.

第二課鬼頭刀廖鴻基.

6-3 玻璃製品一、平版玻璃將熔融的玻璃漿由滾筒間流過，可不斷製造較大連續之玻璃，可分為（一）透明玻璃：表面光滑清透。

钢筋混凝土楼梯模板施工学习目标主要内容.

2014年国家义务教育质量监测体育现场测试说明浙江省教育质量监测中心 2014年11月.

長榮中學高中部104年甄選入學作業相關事項說明會

指導老師：曾憲正老師組員：公廣2A 4980M089鄭欽鴻 M039鄭仁凱 2B M060呂明耿

义乌梦娜袜业广告策划书组员：徐琴娜金春晓陈晓静陈菁菁毛振华王勤指导老师：张益丹完成时间：2006年12月.

昆蟲總動員三年級教學群.

风温主讲人王洪京.

东方底特律—— 大美十堰.

春温主讲人王洪京.

美学概论主讲教师孙建章沈阳电大文法系.

市场营销原理与实训市场营销策略模块项目五产品策略.

乳房护理主编：卢荣华.

第四章室内设计与人体工程学第一节人体工程学与室内设计人体工程学也叫人机工程学、人类工效学、人类工程学、工程心理学、宜人学等。

重庆市渝州工程勘察设计技术服务中心---刘刚 2013年3月29日

4个故事在很久很久以前….

前列腺结石山西医科大学第一医院王靖宇.

全日制义务教育物理课程标准 ——“运动与相互作用”主题解读及实施建议

第十一章结构施工图 11-1 概述一、结构施工图（结施）：P308

第九章居住区规划 §1、居住区规划的任务与编制.

人教版七年级下册第七章第四节人教版8年级下册第五章第二节北方地区和南方地区制作：克拉玛依市独山子第一中学地理组.

汽车维修基础锉削的操作方法制作人：庹鉴.

4 家具与室内陈设设计本章提要本章主要介绍人体工学、家具与室内陈设设计的基本知识及其内涵。其中包括人体工学概述，家具的类型，家具在室内空间环境中的作用，家具的选用与布置，室内陈设的意义、作用和分类，室内陈设的选择与布置，以及常见空间陈设品的应用等内容。

2010高考中国地理复习系列课件福建省长泰一中姚秀元

昆虫昆虫的认识制作昆虫标本方法与过程 1 2.

2014年下学期C1403 第21周家校互联.

“仙居恩施”市情讲座恩施市委党校陈平.

第3章建筑剖面设计.

统计图的选用（二）.

第3章.建筑剖面设计学习要求与学习重点 1. 学习要求：熟悉建筑各部分高度、层数、层高的确定；掌握建筑空间的组合和利用；能够根据建筑的使用要求合理地确定建筑的剖面形状和尺寸。 2.学习重点：掌握建筑各部分高度的确定及层数、净高、层高的概念；掌握室内外高差确定的依据；掌握建筑空间的利用的方法。

引自中山大学研究生,40余项国家专利获得者,著名低视力弱视治疗专家及发明家刘东光教授的观点

静脉剥脱器介绍北京普益盛济科技有限公司.

人教版八年级地理上册第三章第三节（第2课时）水资源.

楼层与地层水平分隔建筑空间的构件，楼层分隔上下空间，地层分隔底层空间并与土壤直接相连。楼层的结构层为楼板，地层的结构层为垫层。

絲綢之路育英國中陳昱伶.

学习单元3 其它焊接方法.

公文写作与常见病例分析.

焊接结构的不足之处大多反映在焊接接头上的问题，主要有以下几方面：

名片礼仪授课人：三原职教中心安小艳.

机械制图识图基础知识讲解编制：王应.

年和電鍍原理製程教育訓練.

臺北市政府教育局96學年度第1學期學生校外會學生交通安全校園巡迴宣講題目：交通(機車)事故預防與處理台北市汽車駕駛訓練中心製作.

高山草原生態系分布於臺灣3000公尺以上高山,如中央山脈.玉山山脈.雪山山脈分為玉山箭竹草原,高山芒草原及兩者混生林三種

訓練法年度計畫表橄欖球專長報告者: 競四四B 羅仕俊.

板料冲压利用装在冲床上的设备(冲模)使板料产生分离或变形的一种塑性成形方法。它主要用于加工板料(10mm以下，包括金属及非金属板料)类零件,故称为板料冲压。冲压加工要求被加工材料具有较高的塑性和韧性，较低的屈强比和时效敏感性，一般要求碳素钢伸长率δ≥16%、屈强比σs/σb≤70%，低合金高强度钢δ≥14%、

Presentation transcript:

2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应第2章简单随机抽样（SRS） 2.1 定义及其抽选方法 2.2 总体均值、总量、比例的估计 2.3 样本量的确定 2.4 逆抽样与设计效应

2.1定义与抽选方法一、定义与符号简单随机抽样也称为纯随机抽样。从含有 N 个单元的总体中抽取 n 个单元组成样本，如果抽样是不放回的，则所有可能的样本有个，若每个样本被抽中的概率相同，都为，这种抽样方法就是简单随机抽样。具体抽样时，通常是逐个抽取样本单元，直到抽满n个单元为止。有限

(1)放回简单随机抽样(SRS with replacement) 放回简单随机抽样不放回简单随机抽样 (1)放回简单随机抽样(SRS with replacement) 当从总体N个抽样单元中抽取n个抽样单元时，如果依次抽取单元时，不管以前是否被抽中过，每次都从N个抽样单元中随机抽取，这时，所有可能的样本为 ? 个(考虑样本单元的顺序), 每个样本被抽中的概率为? 放回简单随机抽样在每次抽取样本单元时，都将前一次抽取的样本单元放回总体，因此，总体的结构不变，抽样是相互独立进行的，这一点是它与不放回简单随机抽样的主要不同之处。放回简单随机抽样的样本量不受总体大小的限制，可以是任意的。

简单随机抽样的抽取原则：（1）按随机原则取样；（2）每个抽样单元被抽中的概率都是已知的或事先确定的；（3）每个抽样单元被抽中的概率都是相等的。所有可能样本每个样本被抽中的概率相同所有可能样本每个样本被抽中的概率相同

【例2.1】设总体有5个单元（1、2、3、4、5），按放回简单随机抽样的方式抽取2个单元，则所有可能的样本为25个（考虑样本单元的顺序）： 1，1 2，1 3，1 4，1 5，1 1，2 2，2 3，2 4，2 5，2 1，3 2，3 3，3 4，3 5，3 1，4 2，4 3，4 4，4 5，4 1，5 2，5 3，5 4，5 5，5

(2)不放回简单随机抽样 (SRS without replacement) 当从总体N个抽样单元中依次抽取n个抽样单元时，每个被抽中的单元不再放回总体，而是从总体剩下的单元中进行抽样。不放回简单随机抽样的样本量要受总体大小的限制。在实际工作中，更多的采用不放回简单随机抽样。

【例2.2】设总体有5个单元（1、2、3、4、5），按不放回简单随机抽样的方式抽取2个单元，则所有可能的样本为个： 1，2 2，3 3，4 4，5 1，3 2，4 3，5 1，4 2，5 1，5

符号大写符号表示总体的标志值，用小写符号表示样本的标志值总体样本

总体指标值上面带符号“^”的表示由样本得到的总体指标的估计。称为抽样比，记为f 。估计量的方差用大写的V表示,对的样本估计，不用而用表示。

二、抽选方法 1．抽签法 2．随机数法——随机数表、随机数骰子、摇奖机、计算机产生的伪随机数随机数表法： N=327 n＝5 讨论： (1) 总体编号为1～35，在00～99中产生随机数，若=00或>35，则抛弃重抽。 (2) 总体编号为1～35，在00～99中产生随机数，以除以35，余数作为被抽中的数，如果余数为0，则被抽中的数为35。

三、地位与作用优点缺点很少单独使用，一般结合其他方法使用没有其他信息时使用多变量复杂数据分析简单直观理论基础 N很大时难以获得抽样框样本分散不易实施，调查费用高很少单独使用，一般结合其他方法使用没有其他信息时使用多变量复杂数据分析

2.2 总体均值、总量、比例的估计判断下面要估计的总体目标量分别属于什么类型？调查城市居民家庭平均用电量。估计湖中鱼的数量。 2.2 总体均值、总量、比例的估计判断下面要估计的总体目标量分别属于什么类型？调查城市居民家庭平均用电量。估计湖中鱼的数量。测试日光灯的寿命。估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重。估计婴儿出生性别比。检测食盐中碘含量。

一、对总体均值的估计以样本均值作为总体均值的估计性质1：对于简单随机抽样，是的无偏估计。

例设总体为{0，1，3，5，6}，计算总体均值 =3、总体方差 =5.2和 =6.5；给出全部的样本，并验证及。例设总体为{0，1，3，5，6}，计算总体均值 =3、总体方差 =5.2和 =6.5；给出全部的样本，并验证及。样本编号单元1 单元2 样本均值 - 样本方差 1 0.5 -2.5 2 3 1.5 -1.5 4.5 5 2.5 -0.5 12.5 4 6 18 -1 8 7 3.5 9 10 平均 5.5 6.5 方差1.95

证明性质1 对于固定的有限总体，估计量的期望是对所有可能样本求平均得到的，因此总体中每个特定的单元在不同的样本中出现的次数。

证明性质1（对称性论证法）由于每个单元出现在总体所有可能样本中的次数相同，因此一定是的倍数，且这个倍数就是，

性质2：对于有限总体的方差定义：性质2：对于简单随机抽样，的方差式中：为抽样比，为有限总体校正系数。

证明性质2（对称论证法）：中的求和是对项的，中的求和是对项的

利用无限总体理论每个特定单位被选入样本的概率： =P（i）= 故其定义为： * 不放回抽样 * 每个样本被抽中的概率为 * 每个单位被选入样本的概率

Mean = 随机变量

证明性质2

简单随机抽样下，简单估计量估计精度影响因素：估计量的方差是衡量估计量精度的度量。影响估计量方差的因素主要是样本量n，总体大小N和总体方差。通常N很大，当f<0.05时，可将近似取为1。总体方差是我们无法改变的；因此，在简单随机抽样的条件下，只有通过加大样本量来提高估计量的精度。

性质3：的样本无偏估计为：证明 :

大样本下，抽样调查估计量渐进正态

【例2.3】我们从某个=100的总体中抽出一个大小为=10的简单随机样本，要估计总体平均水平并给出置信度为95%的区间估计。序号 1 2 4 5 6 7 8 9 10 15

由置信度95%对应的，因此，可以以95%的把握说总体平均水平大约在之间，即2.4295和7.5705之间。

有放回简单随机抽样

二、对总体总量的估计

【例2.4】续例2.3。估计总体总量，并给出在置信度95%的条件下，估计的极限相对误差。在置信度95%下，的极限相对误差为：

三、对总体比例的估计某一类特征的单元占总体单元数中的比例P. 将总体单元按是否具有这种特征划分为两类，设总体中有个单元具有A这个特征，如果对每个单元都定义指标值

总体方差：

估计量性质5：对于简单随机抽样，是 P 的无偏估计。的方差为：

证明

【例2.5】某超市新开张一段时间之后，为改进销售服务环境，欲调查附近几个小区居民到该超市购物的满意度，该超市与附近几个小区的居委会取得联系，在总体中按简单随机抽样抽取了一个大小为=200人的样本，调查发现对该超市购物环境表示满意或基本满意的居民有130位，要估计对该超市购物环境持肯定态度居民的比例，并在置信度95%下，给出估计的近似置信区间、极限绝对误差。假定这时的抽样比可以忽略。

95%近似置信区间为〔 58.37%，71.63% 〕

2.3 样本量的确定费用总费用固定费用可变费用设计费分析费办公费管理费场租费等访问员费交通费礼品费电话费等

STEPS 所需要的精度找出样本量与精度之间的关系估计所需的数值，求解 n 如超出预算，调整精度值重新计算

精度margin of error 对精度的要求通常以允许最大绝对误差（绝对误差限）或允许最大相对误差（相对误差限）来表示。

样本量足够大时，可用正态分布近似变异系数

Sample Size n0为重复抽样条件下的样本量当N很大时， 0， n n0，wr与wor几乎没有区别。

总体参数为P的情形

f<0.05

总体参数的预估计根据预调查数据或以前文献资料，对有些连续性调查根据数据的分布粗略估算S,例如全距/4，全距/ 6 试点调查，或采用两步抽样，调查可以分为两步，首先确定一个可以承受的样本量，调查后对估计精度进行计算，如果精度达到要求，则不再进行下一步，否则，计算为达到精度要求所需的样本量，再调查补充样本

通过定性分析 ,最好是对总体变异系数进行分析并估计，因为变异系数通常变化不大. 对于总体比例估计，如果P在0.5附近（０．２－０．８），可根据PQ在P=0.5时达到极大值来对样本量进行计算

样本量设计中的误区 1. 估计精度越高越好吗？简单随机抽样估计比例P的样本量与误差（当P=0.5时）样本量误差d 50 0.14 50 0.14 100 0.10 500 0.045 1000 0.032 10000 0.0098 对精度要求的判断十分重要。为得到最小误差而选择最大样本量不是好的选择。

2. 样本量与总体规模N有关吗？按照总体比例确定样本量合适吗？例：简单随机抽样估计P，置信度95%，允许误差5%，在P=0.5条件下总体规模（N）所需样本量（n） 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400

抽样调查中的样本量由此可知，在精度要求相同条件下，在北京市进行一项调查和在全国进行一项调查，样本量的差别并不大。总体规模越大，进行抽样调查的效率越高。若分类、分区、分层分别进行估计，如何处理？对于多项目，如何处理？

其他影响因素 1. 所研究问题目标量的个数 2. 调查表的回收率例如回收率估计为80%，则应接触的样本量为计算出所需样本量的1.25倍； 3.非抽样误差 4.资源限制 5.有效样本

2.4 逆抽样与设计效果设计效果(Design effect, Deff) Deff Var（）为复杂样本估计量的方差。定义：简单随机抽样的样本估计量的方差与复杂抽样的样本估计量的方差的比率。 Deff Var（）为复杂样本估计量的方差。

某个抽样设计在同样样本量条件下估计量的方差。设计效果基什（L. Kish）提出比较不同抽样方法的效率. 不放回简单随机抽样单估计量的方差

（1）评价抽样设计的一个依据, （2）计算样本量如多阶段抽样的 Deff大约在2~2.5之间。 n= n’(deff) 则抽样设计比简单随机抽样的效率高；如果deff>1，则抽样设计比简单随机抽样的效率低。（2）计算样本量　　如多阶段抽样的 Deff大约在2~2.5之间。 n= n’(deff) n’为简单随机抽样所需样本量。

放回简单随机抽样的deff为：常用于复杂抽样样本量的确定；在一定精度条件下，简单随机抽样所需的样本量比较容易得到，复杂抽样的样本量为，

逆抽样对于稀有事件，所需的样本量会很大，例如：稀有事件的抽样问题：如果估计的是非常稀有事件的比例，这时总体比例很小，用极限相对误差比极限绝对误差更好些。对于稀有事件，所需的样本量会很大，例如：

逆抽样针对稀有事件并无法给出确切范围，霍丹（Haldane）提出的逆抽样方法: 对总体比例事先不同的假定，所导致的样本量差异非常大。霍丹（Haldane）提出的逆抽样方法: 即事先确定一个整数m（m>1），进行逐个抽样，直到抽到m个所考虑特征的单元为止.

设n是实际的样本量，则总体比例P的一个无偏估计为很接近于1

规定了或r、 t后，就可以确定m。如规定 =20%，则m=27。可以证明，这时所需样本量n的均值为

作业： 2.为调查某5443户城镇居民服装消费情况，采用简单随机不重复抽样调查了36户进行调查，得到平均消费支出元，试根据此估计： 2.为调查某5443户城镇居民服装消费情况，采用简单随机不重复抽样调查了36户进行调查，得到平均消费支出元，试根据此估计：（1）该地区居民服装消费支出总额，并给出置信水平为95%的置信区间。（2）如果希望服装平均消费支出的相对误差限不超过5%，则样本量至少应为多少？ End ！