第九章 算法初步、统计与统计案例、概率 第三节 抽样方法
考 纲 要 求 1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.
课 前 自 修 知识梳理 一、常用的抽样方法 1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.实现简单随机抽样,常用抽签法和随机数表法.
(1)抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法称为抽签法. (2)随机数表法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样的方法,叫做随机数表法. 2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样的步骤:①采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等;②为将整个的编号分段(即分成几个部分),要确定分段的间隔k.当 (N为总体中的个体的个数,n为样本容量)是整数时,k= ;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N′能被n整除,这时k= ;③在第一段用简单随机抽样确定起始的个体编号l;④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本).
3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样.所分成的部分叫做层(由定义知分层抽样实际上就是按比例抽样). 分层抽样的操作步骤:总体分层 ,按照比例,独立抽取,组成样本. 总体分层:按某种特征将总体分成若干部分. 按照比例:按比例确定每层抽取个体的个数. 独立抽取:各层分别按简单随机抽样的方法抽取. 综合每层抽样,组成样本.
二、常用的抽样方法及它们之间的联系和区别 类别 共同点 各自特点 简单随机抽样 抽样过程中每个个体被抽取的概率是相同的 从总体中逐个抽取 系统抽样 将总体均匀分成几个部分,按照事先确定的规则在各部分抽取 分层抽样 将总体分成几层,分层进行抽取
类别 相互联系 适用范围 简单随机抽样 总体中的个数比较少 系统抽样 在起始部分抽样时采用简单随机抽样 总体中的个数比较多 分层抽样 各层抽样时采用简单抽样或者系统抽样 总体由差异明显的几部分组成
不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样.
基础自测 1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析.在这个问题中,下列说法正确的是( ) A.总体指的是该市参加升学考试的全体学生 B.个体指的是1 000名学生中的每一名学生 C.样本容量指的是1 000名学生 D.样本是指1 000名学生的数学升学考试成绩 解析:因为是了解学生的数学成绩的情况,因此样本是指1 000名学生的数学成绩,而不是学生.故选D. 答案:D
2.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,需从他们中抽取一个容量为36的样本,适合抽取样本的方法是( ) A.抽签法 B.系统抽样 C.随机数表法 D.分层抽样 解析:总体是由差异明显的几部分组成的. 答案:D
3.(2012·湖北卷)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.
4.(2012·泰州中学调研)我校高三(18)班共有56人,学生编号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知编号为6,34,48的同学在样本中,那么还有一位同学的编号应为____________. 解析:系统抽样也是等距抽样,因为第三、第四两段中抽取的编号之差为14,所以第二段中抽取的编号与第一段中抽取的编号6之差也为14,所以还有一位同学的编号应为20. 答案:20
考 点 探 究 随机抽样中的有关概念 考点一 【例1】 某次考试有70 000名学生参加,为了了解这70 000名考生的数学成绩,从中抽取1 000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法: ①1 000名考生是总体的一个样本;②可用1 000名考生数学成绩的平均数去估计总体平均数;③70 000名考生的数学成绩是总体;④样本容量是1 000.
其中正确的说法有( ) A.1种 B.2种 C.3种 D.4种 解析:根据有关概念知,说法②③④是正确的.故选C. 答案:C
变式探究 1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( ) A.简单随机抽样法 B.抽签法 C.随机数表法 D.分层抽样法 解析:本小题主要考查抽样方法.若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样.故选D. 答案:D
考点二 系统抽样 【例2】 一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是________. 思路点拨:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.
解析:∵m=6,k=7,m+k=13, ∴在第7小组中抽取的号码是63. 答案:63 点评:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.
变式探究 2.(2012·威海市摸拟)老师在班级50名学生中,依次抽取学号为5,10, 15,20,25,30,35, 40,45,50的学生进行作业检查,这种抽样方法是( ) A.随机抽样 B.分层抽样 C.系统抽样 D.以上都不是 解析:因为所抽取学生的学号成等差数列,即为等距离抽样,属于系统抽样.故选C. 答案:C
考点三 分层抽样 【例3】 (1)某班有男生36人,女生24人,从全班抽取一个容量为10的样本,分析某种身体素质指标,已知这种身体素质指标与性别有关.问应采取什么样的抽样方法?并写出抽样过程. (2)(2011·合肥市模拟)某校共有学生2 000名,各年级男,女生人数如下表. 一年级 二年级 三年级 女生/名 373 x y 男生/名 377 370 z
已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( ) A.24名 B.18名 C.16名 D.12名 解析:(1)因为这种身体素质指标与性别有关,所以男生,女生身体素质指标差异明显,因而采用分层抽样的方法.具体过程如下:
①将60人分为2层,其中男生、女生各为一层. ②按照样本容量的比例随机抽取各层应抽取的样本,即 男生:36× =6(人),女生:24× =4(人). 因此男、女生各抽取人数分别为6人和4人. ③利用简单随机抽样方法分别在36名男生中抽取6人,24名女生中抽取4人. ④将这10人组到一起,即得到一个样本.
(2)注意到分层抽样的实质就是按比例抽样,故只要求出三年级人数即可.设二年级女生人数为x,则由 =0 (2)注意到分层抽样的实质就是按比例抽样,故只要求出三年级人数即可.设二年级女生人数为x,则由 =0.19,得x=380,即二年级的女生有380名,那么三年级学生的人数应该是2 000-373-377-380-370=500名,即总体中各个年级的人数比例为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64× =16名.故选C. 答案:C
变式探究 3.(2012·江西八所重点中学联考)某市有A,B,C三所学校共有高三理科学生1 500人,且A,B,C三所学校的高三理科学生人数成等差数列.在三月进行全市联考后,准备用分层抽样的方法从所有高三理科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取__________人.
4.(2012·广东高州三中模拟)某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为____________h.
抽样方法的恰当选择 考点四 【例4】 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法依次是( ) A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
思路点拨:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样. 解析:依据题意,第①项调查应采用分层抽样法,第②项调查应采用简单随机抽样法.故选B. 答案:B 点评:采用什么样的抽样方法要依据研究的总体中的个体情况来定.
变式探究 5.(2011·福州市质检)某学校为了调查高三年级的200名文科学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行调查;第二种由教务处对该年级的文科学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查. 则这两种抽样的方法依次为( ) A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样 C.分层抽样,系统抽样 D.简单随机抽样,系统抽样
解析:根据抽样的概念知,前者为简单随机抽样,后者为系统抽样.故选D.
考点五 各种抽样方法中各个体被抽到的概率问题 【例5】 某批零件共320个,其中一级品96个,二级品128个,三级品64个,等外品32个.从中抽取一个容量为40的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被抽到的概率是否相同? 思路点拨:要说明每个个体被抽到的概率是否相同,只需计算出用三种抽样方法抽取个体时,每个个体被抽到的概率是否相同即可.
解析:(1)简单随机抽样法:可采取抽签法,将320个零件按1~320编号,相应地制作1~320号的320个签,从中随机抽40个.显然每个个体被抽到的概率为 (2)系统抽样法:将320个零件从1~320编上号,按编号顺序分成40组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1≤k≤8),则在其余组中分别抽取第k+8n(n=1,2,3,…,39)号,此时每个个体被抽到的概率为 .
点评:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.
变式探究 6.老师为研究男女同学数学学习的差异情况,对某班50名同学(其中男同学30名,女同学20名)采取分层抽样的方法,抽取一个样本容量为10的样本进行研究,某女同学甲被抽到的概率为( ) 解析:在分层抽样中,任何个体被抽取的概率均相等,所以某女同学甲被抽到的概率P= .故选C. 答案:C
课时升华 1.对于简单随机抽样: (1)用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为 ;在整个抽样过程中各个个体被抽到的概率为 . (2)简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等. (3)简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
(4)简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样. 2.对于系统抽样: (1)①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样. (2)与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
(3)总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样. 3.简单随机抽样、系统抽样和分层抽样是三种常用的抽样方法,三种方法的共同特点是在抽样过程中每一个个体被抽取的概率相等,体现这些抽样方法的客观性和公平性.若样本容量为n,总体的个数为N,则用这三种方法抽样时,每一个个体被抽到的概率都是 .
感 悟 高 考 品味高考 1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A.6 B.8 C.10 D.12
2.(2012·天津卷)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校.
高考预测 1.(2012·陕西三模)某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6.根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的户数约为( ) 城市/户 农村/户 有冰箱 356 440 无冰箱 44 160
A.1.6万户 B.4.4万户 C.1.76万户 D.0.24万户
2.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本. ①采用简单随机抽样法:抽签取出20个样本. ②采用系统抽样法:将零件编号为00,01,…,99,然后平均分组抽取20个样本. ③采用分层抽样法:从一级品,二级品,三级品中共抽取20个样本.
下列说法中正确的是( ) A.无论采用哪种方法,这100个零件中每一个被抽到的概率都相等 B.①②两种抽样方法,这100个零件中每一个被抽到的概率都相等;③并非如此 C.①③两种抽样方法,这100个零件中每一个被抽到的概率都相等;②并非如此 D.采用不同的抽样方法,这100个零件中每一个零件被抽到的概率是各不相同的