Download presentation
Presentation is loading. Please wait.
1
第2课时 用样本估计总体
2
第2课时 用样本估计总体 双基研习·面对高考 考点探究·挑战高考 考向瞭望·把脉高考
3
(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距和组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.
双基研习·面对高考 基础梳理 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距和组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.
4
思考感悟 频率分布直方图中纵轴的含义是频率吗? 提示:不是.表示的是频率/组距.
5
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的_______,就得到频率分布折线图. (2)总体密度曲线:随着___________的增加,作图时______________增加,_______减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 中点 样本容量 所分的组数 组距
6
3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种____________.
平均距离
7
(2)标准差与方差的计算公式
8
5.利用频率分布直方图估计样本的数字特征 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积______________,由此可以估计中位数的值.
应该相等
9
(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的__________. (3)众数:在频率分布直方图中,众数是最高的矩形的中点的___________.
横坐标之和 横坐标
10
课前热身 1.已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是( ) A.0.14,0.15 B.0.15,0.14 C.0.15,0.15 D.0.15,0.145 答案:D
11
2.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3. 2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1
2.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为( ) ①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏 A.1 B.2 C.3 D.4 答案:D
12
答案:B 4.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为______. 答案:20
13
5.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如右:则平均分数较高的是__________,成绩较为稳定的是__________. 答案:甲 甲
14
考点探究·挑战高考 考点突破 频率分布直方图 频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,来表示数据的分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据落在各个小组的频率的大小.
15
(2010年高考安徽卷)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. 例1
16
(1)完成频率分布表; (2)作出频率分布直方图; (3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
17
【解】 (1)频率分布表:
19
(2)频率分布直方图如图所示:
23
茎叶图 一般制作茎叶图的方法是:将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出,共茎的叶按从大到小(或从小到大)的顺序同行列出.
24
美国NBA篮球赛中甲、乙两篮球运动员上赛季某些场次比赛的得分如下: 甲:12,15,24,25,31,31,36,36,37,39,44,49,50. 乙:8,13,14,16,21,23,24,26,28,33,38,39,51. (1)画出两组数据的茎叶图; (2)试比较这两位运动员的得分水平. 例2
25
【思路分析】 (1)将十位数字作为茎,个位数字作为叶,逐一统计,样本中有一位数,有两位数,把一位数的十位数字看为0
【思路分析】 (1)将十位数字作为茎,个位数字作为叶,逐一统计,样本中有一位数,有两位数,把一位数的十位数字看为0. (2)根据茎叶图分析两组数据,得到结论.
26
【解】 (1)为便于对比分析,可将茎放在中间共用,叶分列左、右两侧.如图:
27
(2)从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分及中位数都是30多分.乙运动员的得分除一个51分外,也大致对称,平均得分及中位数都是20多分.因此甲运动员发挥比较稳定,总体得分情况比乙好.
28
【规律小结】 当样本数据较少时,用茎叶图表示数据的效果较好.但当样本数据较多时,就不太方便了.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.同时,茎叶图还可以帮助我们分析样本数据的一些数字特征.
29
用样本的数字特征估计总体的分布 平均数、众数、中位数描述一组数据的集中趋势,方差和标准差描述其波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.方差的单位是原数据的单位的平方,标准差的单位与原单位相同.
30
甲乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图:
例3
31
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价.
32
【解】 (1)由图可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.
35
【规律小结】 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,要学会通过这些数据分析其含义,从而为正确决策提供依据. 当两组数据的平均数相同或相近时,用方差或标准差比较它们的波动大小,样本方差或标准差越大,样本数据的波动越大,稳定性越差;反之,样本数据波动就越小,稳定性越好.
36
方法感悟 方法技巧 1.几种表示频率分布方法的优、劣 (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便. (2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.
37
(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数 据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
38
2.用样本的数字特征估计总体的分布 (1)平均数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度. (2)一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.
40
失误防范 在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.
41
预测2012年高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,同时应注意和概率、平均数等知识的结合.
考向瞭望·把脉高考 考情分析 从近几年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力. 预测2012年高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,同时应注意和概率、平均数等知识的结合.
42
规范解答 (本题满分12分)(2010年高考湖北卷)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示). 例
44
(1)在下面表格中填写相应的频率; 分组 频率 [1.00,1.05) [1.05,1.10) [1.10,1.15) [1.15,1.20) [1.20,1.25) [1.25,1.30)
45
(2)估计数据落在[1.15,1.30)中的概率为多少; (3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.
46
【解】 (1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表: 8分
分组 频率 [1.00,1.05) 0.05 [1.05,1.10) 0.20 [1.10,1.15) 0.28 [1.15,1.20) 0.30 [1.20,1.25) 0.15 [1.25,1.30) 0.02
48
【名师点评】 本题考查了频率分布直方图,试题难度较小,绝大多数考生都能得全分,但仍有些考生对频率等于组距乘以(频率/组距)不理解.
49
名师预测 1.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( ) A.5 B.6 C.7 D.8 解析:选D.由题意可知,3+4-7-4+(x-7)+1+2=0,解得x=8.
50
2.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是( ) A.3 B.4 C.5 D.6 解析:选C.x2-5x+4=0的两根是1,4. 当a=1时,a,3,5,7的平均数是4. 当a=4时,a,3,5,7的平均数不是1. ∴a=1,b=4.则方差s2= ×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.
51
3.某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n名同学进行调查.下表是这n名同学的日睡眠时间的频率分布表.
序号(i) 分组(睡眠时间) 频数(人数) 频率 1 [4,5) 6 0.12 2 [5,6) 0.20 3 [6,7) a 4 [7,8) b 5 [8,9) 0.08
52
(1)求n的值;若a=20,将表中数据补全,并画出频率分布直方图; (2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.
53
序号(i) 分组(睡眠时间) 频数(人数) 频率 1 [4,5) 6 0.12 2 [5,6) 10 0.20 3 [6,7) 20 0.40 4 [7,8) 5 [8,9) 0.08
54
频率分布直方图如下:
55
(2)由题意
56
本部分内容讲解结束 按ESC键退出全屏播放 点此进入课件目录 谢谢使用
57
第1课时 随机抽样
58
双基研习·面对高考 第1课时 随机抽样 考点探究·挑战高考 考向瞭望·把脉高考
59
双基研习·面对高考 基础梳理 1.简单随机抽样 (1)定义:设一个总体含有N个个体,从中____________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 逐个不放回
60
(2)最常用的简单随机抽样的方法:___________和____________. 2.系统抽样的步骤 假设要从容量为N的总体中抽取容量为n的样本. (1)先将总体的N个个体_______.
抽签法 随机数法 编号 分段间隔k 分段
61
(3)在第1段用_________________确定第一个个体编号l(l≤k). (4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号_____________,再加k得到第3个个体编号_____________,依次进行下去,直到获取整个样本. 简单随机抽样 (l+k) (l+2k)
62
3.分层抽样 (1)定义:在抽样时,将总体__________________的层,然后按照_________________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)分层抽样的应用范围: 当总体是由____________________组成时,往往选用分层抽样. 分成互不交叉 一定的比例 差异明显的几个部分
63
课前热身 1.2011年1月光明中学进行了该学年度期末统一考试,该校为了了解高一年级1000名学生的考试成绩,从中随机抽取了 100名学生的成绩单.那么下面说法正确的是( ) A.1000名学生是总体 B.每个学生是个体 C.1000名学生的成绩是一个个体 D.样本的容量是100 答案:D
64
2.下列抽样问题中最适合用系统抽样方法的是( ) A.从北京某高校一班50名学生中随机抽取10人参加60周年国庆群众游行 B.从海、陆、空三军的20000名官兵中抽取400人在60周年国庆阅兵中组成一个方队 C.从第二炮兵学院的1760名学生中随机抽取352人在60周年国庆阅兵中组成一个方队 D.从北京某单位2000名群众中随机抽取20人参加60周年国庆群众游行 答案:C
65
3.某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工16人,则该样本中的老年职工人数为( ) A.9 B.18 C.27 D.36 答案:A
66
4.为了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________. 答案:40
67
5.防疫站对学生进行身体健康调查,采用分层抽样法抽取.红星中学共有学生1600名,抽取一个容量为200的样本,已知女生比男生少抽了10人,则该校的女生有__________人. 答案:760
68
考点探究·挑战高考 考点突破 简单随机抽样 简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.
69
第十六届亚洲运动会于2010年11月12日在广州举行,广州某大学为了支持亚运会,从报名的60名大三学生中选10人组成志愿小组,请用抽签法和随机数法设计抽样方案.
例1
70
【思路分析】 (1)总体的个体数较少,利用抽签法或随机数法可较容易地获取样本; (2)抽签法的操作要点:编号、制签、搅匀、抽取; (3)随机数法的操作要点:编号、选起始数、读数、获取样本.
71
【解】 抽签法. 第一步:将60名志愿者编号,编号为1,2,3,…,60; 第二步:将60个号码分别写在60张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将60个号签放入一个不透明的盒子中,充分搅匀; 第四步:从盒子中逐个抽取10个号签,并记录上面的编号; 第五步:所得号码对应的志愿者,就是志愿小组的成员.
72
随机数表法. 第一步:将60名学生编号,编号为01,02,03,…,60; 第二步:在随机数表中任选一数开始,按某一确定方向读数; 第三步:凡不在01~60中的数或已读过的数,都跳过去不作记录,依次记录下得数; 第四步:找出号码与记录的数相同的学生组成志愿小组.
73
【规律小结】 简单随机抽样中的抽签法的操作过程:编号→制签→抽签.当总体和样本数目较少时,可采用抽签法. 用随机数表法抽样时,编写的号码位数要相同,如100个个体,可用00~99进行编号,在编号结束后,要随意选定读数的起点和方向,对于重码或不在编码内的号码要跳过,确保编码的随机性.
74
互动探究1 若把本例中“60名大三学生”改为“1800名学生”,仍抽取10人,应如何进行抽样? 解:因为总体数较大,若选用抽签法制号签太麻烦,故应选用随机数表法. 第一步:先将1800名学生编号,可以编为0001,0002,0003,…,1800.
75
第二步:在随机数表中任选一个数,例如选出第2行第5列的数2
第二步:在随机数表中任选一个数,例如选出第2行第5列的数2. 第三步:从选定的数开始向右读,依次可得0736,0751,0732,1355,1410,1256,0503,1557,1210,1421为样本的10个号码,这样我们就得到了一个容量为10的样本.
76
系统抽样 (1)当总体容量较大,样本容量也较大时,可用系统抽样法. (2)在利用系统抽样时,经常遇到总体容量不能被样本容量整除,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体能被样本容量整除.然后再按系统抽样法抽样.
77
某校高中三年级有学生295名,秋季开学后,高三数学组的老师们为了解学生学习数学的情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,写出过程.
例2
78
【解】 (1)按照1∶5的比例,应该抽取的样本容量为295÷5=59; (2)把295名同学随机编号为1,2,3,…,295; (3)分组,取间隔k=5,第一组编号为1~5,第二组编号为6~10,依次下去,第59组的编号为291~295;
79
(4)用简单随机抽样法从第一组5名学生中抽出一名学生,不妨设编号为l(1≤l≤5),那么抽取的学生编号为l+5k(k=0,1,2,…,58),对应的59个学生作为样本.如当l=3时的样本编号为3,8,13,…,288,293.
81
互动探究2 本例中若高中三年级有学生298名,其他条件不变,又该如何抽样? 解:(1)因为298÷5=59······3,所以先用随机抽样的方法从总体中剔除3人,比如把298名学生随机编号为001,002,003,…,298,利用随机数表法从中剔除3人. (2)把剩下的295名同学随机编号为1,2,3,…,295. 下面重复例2的解答步骤(3)、(4).
82
分层抽样 分层抽样遵循的原则: (1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则. (2)分层抽样为保证每个个体等可能入样需遵循每层抽样的比相同,即为样本容量与总体数目的比值.
83
【思路分析】 按照分层抽样的比例关系进行计算.
(1)某社区对居民进行上海世博会知晓情况的分层抽样调查.已知该社区的青年人、中年人和老年人分别有800人、1600人、1400人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是__________. (2)某大型超市销售的乳类商品有四种:纯奶、酸奶、婴幼儿奶粉、成人奶粉,且纯奶、酸奶、婴幼儿奶粉、成人奶粉分别有30种、10种、35种、25种不同的品牌.现采用分层抽样的方法从中抽取一个容量为n的样本进行三聚氰胺安全检测,若抽取的婴幼儿奶粉的品牌数是7种,则n=__________. 例3 【思路分析】 按照分层抽样的比例关系进行计算.
85
【答案】 (1)80 (2)20 【规律小结】 分层后,各层的个体数较多时,可采用系统抽样或随机数表法抽取各层中的个体,一定要注意按比例抽取.
86
方法感悟 方法技巧 三种抽样方法的比较 类别 各自特点 相互联系 适用范围 共同点 简单随机抽样 从总体中逐个抽取 最基本的抽样方法 总体中的个体数较少 抽样过程中每个个体被抽到的可能性相等
87
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取
类别 各自特点 相互联系 适用范围 共同点 系统抽样 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的个体数较多 抽样过程中每个个体被抽到的可能性相等 分层抽样 将总体分成几层,按各层个体数之比抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
88
失误防范 进行分层抽样时应注意以下几点 (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠; (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同; (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
89
预测2012年高考,分层抽样仍是考查的重点,同时应加强对系统抽样的复习.
考向瞭望·把脉高考 考情分析 从近几年的广东高考试题来看,分层抽样是高考的热点,题型既有选择题也有填空题,分值占5分左右,属容易题.命题时多以现实生活为背景,主要考查基本概念及简单计算. 预测2012年高考,分层抽样仍是考查的重点,同时应加强对系统抽样的复习.
90
真题透析 (2010年高考安徽卷)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是__________. 例
91
【解析】 ∵990∶99000=1∶100,∴低收入家庭中拥有3套或3套以上住房的大约为50×100=5000(户). 又∵100∶1000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).
92
【答案】 5.7% 【名师点评】 本题考查了分层抽样在实际中的应用,试题难度较小,但仍有考生出错,其原因为误把120户作样本,没有考虑两类家庭的比例.
93
名师预测
95
2.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A.13 B.19 C.20 D.51
97
3.某高中在校学生2000人,高一年级与高二年级人数相同并都比高三年级多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表: 高一年级 高二年级 高三年级 跑步 a b c 登山 x y z
Similar presentations