?--------非概率,等概率,不等概 第五章 不等概抽样 每个单元入样的概率 ?--------非概率,等概率,不等概
不等概率抽样的概念和特点 放回不等概率抽样(重点) 不放回不等概率抽样
不等概率抽样的概念和特点 前面讨论的简单随机抽样和分层随机抽样都是等概率抽样,即,每个总体单元都具有相同的入样概率。等概率抽样容易设计和解释,但实际中有时并非可行的,当总体单元之间差异不大时,简单随机抽样简单、有效。但是当总体单元之间(或抽样单元规模)差异非常大时,常采用不等概率抽样,即,每个单元入样的概率不相等。 通常的做法:牺牲“简单”来提高抽样效率。 (1)将总体单元按规模分层,对较大单元的层抽样比高一些,特大层的抽样比甚至可以100%,而较小单元的层抽样比低一些。 (2)采用不等概抽样来减少抽样方差,即赋予每个单元与其规模成比例的入样概率,然后在估计中采用不同的权数来进行弥补。
分层抽样:抽样选择概率小的单位会有较高的权数。 采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。 抽样的关键是每个样本的选择概率是已知的。
不等概率的适用情形 第一,抽样单元在总体中所占的地位不一致。 第二,调查的总体单元与抽样总体的单元不一致 第三,改善估计量。 注:不等概率抽样的优点主要是大大提高了估计精度,减少抽样误差,但使用它也由条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元入样的概率,这在抽样设计及估计时都是必须得。
不等概率抽样的分类 放回不等概抽样 代码法 拉希里法 不放回不等概抽样 逐个抽取 重抽法 全样本抽取;样本量随机 系统抽样法
放回不等概率抽样: 每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元放回总体,然后进行下一次抽样,这样,每次抽样过程都是从同一个总体独立进行的,这种不等概率抽样称为(有)放回不等概率抽样 放回不等概率抽样中,最常用的是按照总体单元的规模大小来确定单元在每次入样的概率,典型的是PPS抽样。 PPS抽样的实施主要有两种方法:代码法与拉希里法。
(Probability Proportional to Size) 也称PPS
1代码法案例 一种多项抽样 累计 代码 1 0.6 6 1~6 2 14.5 145 151 7~151 3 1.5 15 166 152~166 4 13.7 137 303 167~303 5 7.8 78 381 304~381 150 531 382~531 7 10 100 631 532~631 8 3.6 36 667 632~667 9 60 727 668~727 1.1 11 738 728~738 =738
2拉希里方法 不需要累计,两次随机数决定抽中的单位。 第一次:1-N之间的随机数i 第二次: 1-maxM之间的随机数m 如果Mi> m,第i个单位被抽中
估计量 对于放回不等概抽样,对总体总量的估计是汉森-赫维茨(Hansen-hurwitz)估计 例如:估计超市销售额, m:员工人数 解释公式意义
可以证明
例5.2 某部门要了解所属8500家生产企业当月完成的利润,该部门手头已有一份去年各企业完成产量的报告,将其汇总得到所属企业去年完成的产量为3676万吨。考虑到时间紧,准备采用抽样调查来推算当月完成的利润。根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异比较大,通常大企业的管理水平较高些,因此采用以与去年产量成比例的PPS抽样,从所属企业中抽出一个样本量为30的样本,
1* 38.23 10926 10 6.50 1900 19 1.50 2 13.70 1024 11 15.00 864 20 8.00 80 3 0.75 13 12 7.00 17 21 28.42 13672 4 2.85 30 16.00 1045 22* 9.01 3845 5 2.00 1102 14 12.30 220 23 480 6 5.00 600 15 3.86 4600 24 6.00 311 7 10.80 290 16 15.80 2370 25 28.43 9284 8 430 9.00 940 26 9.97 842 9 8.81 992 18* 21.00 640 27 6.20 510
765404(百元) =30434161880 174454 相对误差 =45% 相对误差达到20%时所需样本量?
不放回的与单元大小成比例的概率抽样为πPS抽样 n固定条件下的包含概率 第i单位入样概率 第i,j单位都入样概率
i=1 j>i
其他公式在某种程度上可用这两个公式表现。 如:在srs中 在srs等概抽样条件下,每个单元包含概率是 (等概抽样) 则
又如,对于霍维茨——汤普森估计量 在入选概率与规模成比例条件下, 的性质为 则
πPS抽样的实施 n=2条件下严格的πPS抽样 n >2条件下严格的πPS抽样 n>2条件下非严格的πPS抽样 布鲁尔方法 德宾方法 n >2条件下严格的πPS抽样 水野方法 n>2条件下非严格的πPS抽样 莫蒂方法
布鲁尔方法 条件:所有Zi<0.5 逐个抽取: 第一个与 成比例的概率抽取 第二个与 成比例的概率在N-1个单元内抽取
德宾方法 条件:所有Zi<0.5 逐个抽取: 第一个 与Zi成比例的概率抽取 第二个与 成比例的概率抽取
水野方法 总体差异不要太大 逐个抽取: 关键:第一个单元与 成比例的概率抽取 剩余的n-1个单位不放回等概抽取
莫蒂方法 逐个抽取: 估计量: 第一个 单元按照Zj 的概率抽取,记为Z1 第二个 单元按照Zj /(1 - Z1 )的概率抽取,记为Z2 依次递推,直至第n个单位 估计量:
End !