Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 统 计.

Similar presentations


Presentation on theme: "第二章 统 计."— Presentation transcript:

1 第二章 统 计

2 2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布

3 频率分布 数字特征

4 连接各小长方形上端的 中点 样本容量不断增大频率折线图接近于一条 光滑曲线 大小次序 “叶”

5   1.频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?

6   2.从甲、乙两个班级中各随机选出15名同学进行测试,成绩的茎叶图如图,你能说出甲、乙两班的最高成绩,以及哪个班的平均成绩较高吗?
6 4 8 5 7 9 4 1 2 5 9 8 7 5 4 2 1 2 5 7 8 9 7 4 4 1 4 4 7 9 9 2   提示:甲、乙两班的最高成绩各是96,92,从图中看,乙班的平均成绩较高.

7 考点1 列频率分布表、画频率分布直方图、折线图
考点 列频率分布表、画频率分布直方图、折线图 例1:美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48   (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.

8   [自主解答] (1)以4为组距,列表如下:   (2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小. 分组 频数 频率 [41.5,45.5) 2 [45.5,49.5) 7 [49.5,53.5) 8 [53.5,57.5) 16 [57.5,61.5) 5 [61.5,65.5) 4 [65.5,69.5] 合计 44 1.00

9 根据频率分布表,求美国总统就任时年龄落在区间[61.5,69.5)人数占总人数的比例.
  根据频率分布表,求美国总统就任时年龄落在区间[61.5,69.5)人数占总人数的比例.   解:区间[61.5,69.5)包含了[61.5,65.5),[65.5,69.5),两个组,两小组的频率和为 + = ,故而所占比例为13.64%.

10   1.一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):
  6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0   5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5   5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0   6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0   6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4   6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4   5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8   6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7   6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2   6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7   5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0   5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6   6.3 6.0 5.8 6.3   根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75~6.05 cm之间的麦穗在这批麦穗中所占的百分比.

11

12

13   (5)画频率分布直方图.如图所示.   从表中看到,样本数据落在5.75~6.05之间的频率是0.28,于是可以估计,在这块地里,长度在5.75 ~6.05 cm之间的麦穗约占28%.

14 考点 茎叶图及应用 例2:某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):   甲:52 51 49 48 53 48 49   乙:60 65 40 35 25 65 60   画出茎叶图,并说明哪个车间的产品质量比较稳定.   [自主解答] 茎叶图如图所示(茎为十位 上的数字):     由图可以看出甲车间的产品质量较集中, 而乙车间的产品质量较分散,所以甲车间的 产品质量比较稳定. 2 5 3 9 9 8 8 4  3 2 1   6 0 0 5 5

15   画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.
  绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.

16   2.在某电脑杂志的一篇文章中,每个句子中所含字数如下:10, 28, 31, 17, 23, 27, 18, 15, 26, 24, 20, 19, 36, 27, 14, 25, 15, 22, 11, 21, 24, 27, 17, 29.   在某报纸的一篇文章中,每个句子中所含字数如下:27, 39, 33, 24, 28, 19, 32, 41,33,27,35,12,36,41,27,13,22,23,18,46,32,22,18,32.   (1)分别用茎叶图表示上述两组数据; (2)将这两组数据进行比较分析,你能得到什么结论?   解:(1)茎叶图如图所示:   (2)从茎叶图可看出:电脑杂志的文章中每个句子所含字数集中在10~30之间;报纸的文章中每个句子所含字数集中在20~40之间,且电脑杂志的文章中每个句子所含字的平均个数比报纸的文章中每个句子所含字的平均个数要少,因此电脑杂志的文章较简明. 电脑杂志 报纸 1 2 6 1 3 4 1 1 6

17 考点 频率分布直方图的应用 例3:在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至31日,评委会把同学们上交作品的件数按5天一组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12.   (1)本次活动中一共有多少件作品参评?   (2)上交作品数量最多的一组有多少件?   (3)经过评比,第四组和第六组分别有10件,2件作品获奖,这两组获奖率较高的是第几组?

18

19

20   3.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.   (1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?

21

22   某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是(  )
   A.10   B.2 C.5 D.15   [错解] 0.02×100=2人.选B. [错因] 误认为纵轴表示频率.

23   1.(湖北高考)容量为20的样本数据,分组后的频数如下表:
  则样本数据落在区间[10,40)的频率为(  )   A.0.35   B. C. D.0.65 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数 2 3 4 5

24   2.(福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )   A. B.480  C. D.120   解析:由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为600-(0.005+0.015)×10×600=480.   答案:B

25   3.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm),根据数据估计(  )
  A.甲种玉米比乙种玉米不仅长得高而且长得整齐   B.乙种玉米比甲种玉米不仅长得高而且长得整齐   C.甲种玉米比乙种玉米长得高但长势没有乙整齐   D.乙种玉米比甲种玉米长得高但长势没有甲整齐 6 1 4 5 2 1 2 7 7 5 3 6 8 4 5

26   4.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数如下:(单位元)19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________,若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5]范围内的频数为________.   5.将一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________.

27   6.为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
  (1)求出表中a,m的值; (2)画出频率分布直方图. 分组 [147.5.5) [155.5.5) [163.5.5) [171.5.5] 频数 6 21 27 m 频率 a 0.1

28 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体 的数字特征

29 最多 从小到大 中间

30 样本数据 样本容量 样本平均数

31   1.一组数据的众数可以有几个?那么中位数是否也具有相同的结论?
  提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个. 2.在频率分布直方图中,如何求众数、中位数、平均数?   提示:(1)众数是最高矩形底边的中点.   (2)中位数左边和右边的直方图面积应相等,由此来估计中位数的值.   (3)平均数是频率分布直方图的“重心”,它等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.   3.标准差、方差的意义是什么?   提示:标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程序越小.

32 考点 众数、中位数、平均数的简单运用 例1:某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:   (1)求这15位销售人员该月销售量的平均数、中位数及众数;   (2)假设销售部负责人把月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.

33

34   1.众数、中位数及平均数都是描述一组数据集中趋势的量.
  2.平均数的大小与一组数据里每个数的大小均有关系,任何一组数据的变动都会引起平均数的变动.   3.众数考查各数出现的频率,其大小与这组数据中部分数据有关,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.   4.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中个别数据较大时,用中位数描述这种趋势.

35   1.某工厂人员及工资构成如下:   (1)指出这个问题中的众数、中位数、平均数;   (2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么? 人员 经理 管理人员 高级技工 工人 学徒 合计 周工资(元) 2200 250 220 200 100 2 970 人数 1 6 5 10 23 2 200 1 500 1 100 2 000 6 900   解:(1)由表格可知:众数为200元.   ∵23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为220,   ∴中位数为220元.   平均数为(2 200+1 500+1 100+2 000+100)÷23=6 900÷23=300(元).   (2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.

36 考点2 平均数和方差的运用 例2:在一次歌手大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7
考点 平均数和方差的运用 例2:在一次歌手大奖赛上,七位评委为歌手打出的分数如下:   9.4 8.4 9.4 9.9 9.6 9.4 9.7   去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )   A.9.4,0.484 B.9.4,0.016 C.9.5, D.9.5,0.016

37 1.极差、方差与标准差的区别与联系: 数据的离散程度可以通过极差、方差或标准差来描述. (1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感. (2)方差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离. 2.在实际问题中,仅靠平均数不能完全反映问题还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定

38   2.从甲、乙两种玉米的苗中各抽10株,分别测得它们的株高如下:(单位:cm)
  甲:25 41 40 37 22 14 19 39 21 42   乙:27 16 44 27 44 16 40 40 16 40   问:(1)哪种玉米的苗长得高?   (2)哪种玉米的苗长得齐?

39

40 考点 频率分布与数字特征的综合应用 例3:已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128   (1)填写下面的频率分布表: 分组 频数累计 频数 频率 [120.5,122.5) [122.5,124.5) [124.5,126.5) [126.5,128.5) [128.5,130.5] 合计

41   (2)作出频率分布直方图;   (3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.

42

43 1.利用直方图求数字特征 (1)众数是最高的矩形的底边的中点. (2)中位数左右两边直方图的面积应相等. (3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.   2.利用直方图求众数、中位数、平均数均为近似值,往 往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数。

44   3.某市2011年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.   (1)完成频率分布表;   (2)作出频率分布直方图;   (3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.   请你根据所给数据和上述标准,对该市的空气质量给出一个简短评价.

45

46

47   求下列数据的平均数  184 208 190 192 178 200

48   1.下列各数字特征中,能反映一组数据离散程度的是(  )
  A.众数  B.平均数 C.标准差 D.中位数   答案:C   2.(山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据.则A,B两样本的下列数字特征对应相同的是(  )   A.众数 B.平均数  C.中位数 D.标准差   解析:只有标准差不变,其中众数、平均数和中位数都加2.   答案:D

49   3.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是(  )
  A.因为他们的平均分相等,所以学习水平一样   B.成绩虽然一样,方差较大,说明潜力大,学习态度踏实   C.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定   D.平均分相等,方差不等,说明学习水平不一样,方差较小的同学,学习成绩不稳定,忽高忽低   解析:由表可知乙、丙平均成绩最好,但丙方差比乙方差小,故成绩稳定,∴选丙.  答案:丙

50   5.(湖北高考)某学员在一次射击测试中射靶10次,命中环数如下:
  7,8,7,9,5,4,9,10,7,4   则(1)平均命中环数为________;   (2)命中环数的标准差为________.

51   6.某教师出了一份共3道题的测试卷,每道题1分.全班得3分、2分、1分和0分的学生所占比例分别为30%、50%、10%和10%.
  (1)若全班共10人,则平均分是多少?   (2)若全班共20人,则平均分是多少?


Download ppt "第二章 统 计."

Similar presentations


Ads by Google