复习回顾 … , 1、算术平均数的概念: 一般地,对于n个数 我们把 叫做这n个数的算术平均数,简称平均数. 2、加权平均数的定义 一般说来,如果n个数据中,x1出现f1次,x2出现f2次, … xk出现fk次,且f1 + f2 +… +fk =n则这n个数的平均数可表示为x=(x1f1+x2f2+…xkfk)/n。其中fi/n是xi的权重(i=1,2…k)。其中f1 、 f2 、… 、fk叫做权。 n个数按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 3、中位数的概念: 注意:1.求中位数时必须将这组数据从大到小(或从小到大)顺序排列; 2.当所给数据为奇数时,中位数在数据中;当所给数据为偶数时,中位数不在所给数据中,而是最中间两个数据的平均数; 3.一组数据的中位数是唯一的.
4、众数的概念: 一组数据中出现次数最多的数据叫做这组数据的众数。 注意: 1.众数一定在所给数据中。 2.众数可能不唯一。 1、如何理解“中位数”? 中位数与数据排列有关,且一组数据的中位数是唯一的,它可以是该组数据中的某个数,也可能不是这组数据的数,中位数和平均数一样也反映了一组数据的“平均水平”,不过考虑角度不同。 2、如何理解“众数”? 众数是指一组数据中出现次数最多的那个数据,它的大小只与一组一组数据中的部分数据有关,一组数据的众数可能有一个或几个,也可能没有。 3、如何合理地选用平均数、中位数和众数? 平均数、中位数和众数都是一组数据的代表,分别代表这组数据的“一般水平”、“中等水平”和“多数水平”,平均数涉及所有的数据,中位数和众数只涉及部分数据,它们表示的意义各不相同。 平均数、中位数与众数都有哪些自己的特点? 平均数:充分利用数据所提供的信息,应用最为广泛,但…… 中位数:计算简单,受极端值影响较小,但…… 众数:当一组数据中有些数据多次重复出现时,众数往往是人们尤为关心的一个量
4、总结反思: 在实际问题中,平均数是最常用的指标,但不能一味的使用平均数来确定数据的特征,根据不同的实际需要,确定用平均数、中位数还是众数反映数据的特征。平均数、中位数、和众数各有所长,也各有其短。 1、用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用也最为广泛,特别是在进行统计推断时有最要的作用,但计算时比较繁琐,并且容易受到极端数据的影响。 2、用众数作为一组数据的代表,着眼于对数据出现的频数的考察,其大小只与这组数据中的部分数据有关,可靠性比较差,但众数不受极端数据的影响。当一组数据中有不少数据多次重复出现时,其众数往往是我们关心的一种统计量。 3、用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端数据的影响,当一组数据中的个别数据变动较大时,可用他来描述其集中趋势。 5、什么样的指标可以反映一组数据变化范围的大小? 我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差(range). 极差=最大值-最小值.
S2= [ (x1-x)2+(x2-x)2+ +(xn-x)2 ] 我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况.这个结果通常称为方差。 6.方差:各数据与平均数的差的平方的平均数叫做这批数据的方差. S2= [ (x1-x)2+(x2-x)2+ +(xn-x)2 ] 7.方差用来衡量一批数据的波动大小(即这批数 据偏离平均数的大小). 在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差越小,说明数据的波动越小,越稳定. 注意 : 极差和方差都是表示一组数据离散程度的指标,极差大只能说明这组数据中的最大值与最小值的离散程度大,但不表示其他数据的波动大小。极差不能准确的衡量数据中的波动程度。方差反映一组数据的整体波动大小的指标数,反映的是一组数据偏离平均值的大小。因此极差大的一组数据的方差并不一定大.
极差、方差和标准差的区别与联系: 联系:极差、方差和标准差都是用来衡量(或描述)一组数据偏离平均数的大小(即波动大小)的指标,常用来比较两组数 据的波动情况。 区别:极差是用一组数据中的最大值与最小值的差来反映数据的变化范围,主要反映一组数据中两个极端值之间的差异情况,对其他的数据的波动不敏感。 方差是用“先平均,再求差,然后平方,最后再平均”的方法得到的结果,主要反映整组数据的波动情况,是反映一组数据与其平均值离散程度的一个重要指标,每个数年据的变化都将影响方差的结果,是一个对整组数据波动情况更敏感的指标。在实际使用时,往往计算一组数据的方差,来衡量一组数据的波动大小。 标准差实际是方差的一个变形,只是方差的单位是原数据单位的平方,而标准差的单位与原数据单位相同。 从方差的计算过程,可以看出S 2 的数量单位与原数据的不一致,因此在实际应用时常常将求出的方差再开平方,这就是标准差。 用符号表示为 标准差= ,方差=标准差2
1、扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示数据时常常会用到它。 制作扇形统计图的步骤吗? 第一步 计算各类数据在总数中所占的百分比; 第二步 按百分比计算在扇形统计图中所对应的圆心角的度数; 第三步 绘制扇形统计图.
条形统计图,它能清楚地表示出每个项目的具体数目。能看出大学生3611人、高中生11146人,初中生33961人,小学生357201人,其他15581人。
折线统计图,从上面可看出1964年416人,1982年615人,1990年1422人,2000年3611人,折线统计图能清楚地反映事物的变化情况。
频率:每个对象出现的次数与总次数的比值叫做频率. 频数:每个对象出现的次数叫做频数. 频率:每个对象出现的次数与总次数的比值叫做频率. ①频数÷总数=频率 ②各频数之和=总数 ③各频率之和=1 注意:一般情况 (1)可以由组距来求组数; (2)当数据个数小于40时,组数为6-8组; 当数据个数40—100个时,组数为7-10组; 画频数分布直方图的一般步骤: (1) 计算最大值与最小值的差(极差). 极差: (2) 决定组距与组数: 极差/组距=________ 数据分成_____组. (4)列频数分布表. 数出每一组频数 (5)绘制频数分布直方图. 横轴表示各组数据,纵轴表示频数, 该组内的频数为高,画出一个个矩形。 (3) 决定分点.
根据频数分布表制作直方图的要点:分别以横轴上每组别两边界点为端点的线段为底边, 做高为相应频数的矩形,就得到所求的频数分布直方图。 用来表示频数分布的基本统计图叫做频数分布直方图,简称直方图 绘制频数折线图将直方图中每个小长方形上面一条边的中点顺次连结起来,即可得到频数折线图
30.2 .3.用样本估计总体
一、课前准备 问题:2002年北京的空气质量情况如何?请用简单随机抽样方法选取该年的30天,记录并统计这30天北京的空气污染指数,求出这30天的平均空气污染指数,据此估计北京2002年全年的平均空气污染指数和空气质量状况。请同学们查询中国环境保护网,网址是http://www.zhb.gov.cn。
1.北京在这30天的空气污染指数及质量级别,如下表所示: 二、新课 1.北京在这30天的空气污染指数及质量级别,如下表所示: 用样本估 计总体
这30个空气污染指数的平均数为107,据此估计该城市2002年的平均空气污染指数为107,空气质量状况属于轻微污染。 讨论:同学们之间互相交流,算一算自己选取的样本的污染指数为多少?根据样本的空气污染指数的平均数,估计这个城市的空气质量。
2、体会用样本估计总体的合理性 经比较可以 发现,虽然 从样本获得 的数据与总 体的不完全 一致,但这 样的误差还 是可以接受 的,是一个 较好的估计。
练习:同学们根据自己所抽取的样本绘制统计图,并和2002年全年的相应数据的统计图进行比较,想一想用你所抽取的样本估计总体是否合理? 显然,由于各位同学所抽取的样本的不同,样 本的污染指数不同。但是,正如我们前面已经看到 的,随着样本容量(样本中包含的个体的个数)的 增加,由样本得出的平均数往往会更接近总体的平 均数,数学家已经证明随机抽样方法是科学而可靠 的. 对于估计总体特性这类问题,数学上的一般做 法是给出具有一定可靠程度的一个估计值的范围 . 将来同学们会学习到有关的数学知识。
活动2 香烟浸出 人们常说“吸烟有害”,这一般是指吸烟有害于人类的健康,那么,香烟对其他动植物的生长是否也不得呢?上海市闵行中学的师生们做过一个“香烟浸出液浓度对于种子萌芽的影响”的实验,他们选用常见的绿豆及赤豆各50粒作为种子的代表,观察在三种不同浓度的香烟浸出液中它们每天出芽的数目,获得的实验数据如表30.2.3所示: 据此,你们估计香烟浸出液对绿豆及赤豆的出芽率有怎样的影响? (浓度越大,出芽越慢,出芽率越低。) 如果再重复这个实验,实验数据是否可能与他们获得的不一致? (可能不一致,因为还应考虑影响种子发芽的其他因素,温度等。) 为了一般地研究“香烟浸出液浓度对于种子萌芽的影响”,是否需要选取一些其他的种子做类似的实验? (对此问题,你们可以课后查阅有关生物资料,并亲自动手实验获得更为感性的认识。) 如果有兴趣,请动手做一做,再与同学们一起讨论各自获得的数据和结论。
(香烟浸出液1: 2支香烟浸于200ml水; 香烟浸出液2: 3支香烟浸于200ml水; 香烟浸出液3: 4支香烟浸于200ml水) 表30.2.3 (香烟浸出液1: 2支香烟浸于200ml水; 香烟浸出液2: 3支香烟浸于200ml水; 香烟浸出液3: 4支香烟浸于200ml水)
活动3 假设你们学校在千里这外还有一个友好姐妹学校,那个学校的9年级学生想知道你们学校9年级男、女生的平均身高和体重。请提出若干个了解你们年级男、女学生平均身高和体重情况的方案,并按照解决问题的不同方法,分成几个组,分别尝试一下你们的办法。比一比,评一评,看哪种方法好。(如节省时间、结果误差小等等) 思考: 一个年级有几百个学生,可是计算器一次只能计算几十个数据,怎么办? (1.用计算机求平均数; 2.先统计各个数据出现的频数再作计算; 3.先算出每个班的平均数再计算年级的平均数。)
3、加权平均数的求法 问题1:在计算20个男同学平均身高时, 小华先将所有数据按由小到大的顺序 排列,如下表所示: 然后,他这样计算这20个学生的平均身高: 小华这样计算平均数可以吗?为什么?
问题2:假设你们年级共有四个班级, 各班的男同学人数和平均身高如表所示. 小强这样计算全年级男同学的平均身高: 小强这样计算平均数可以吗?为什么? (小强的计算方法是错误的,因为他没有考虑到各班男生人数是不一样的,应该照小华的方法计算。)
解:不同意上述说法.通常情况下,样本越大,样本的估计越接近总体的实际状况. 例1. 有的同学认为,要了解我们学校500名学生中能够说出父母亲生日的人的比例,可以采取简单的随机抽样的方法进行调查,但是,调查250名学生反而不及调查100名学生好,因为人太多了以后,样本中知道父母亲生日的人的比例反而说不准,你同意吗?为什么? 解:不同意上述说法.通常情况下,样本越大,样本的估计越接近总体的实际状况. 评注:1.数学家已经证明,随机抽样方法是科学而且可靠的。 2.基于不同的样本,可能会对总体作出不同的估计值,但随着样本容量的增加,有样本得出的特性会接近总体的特性。
评注:本题一方面考查了学生由样本估计总体的思想方法和具体做法,另一 方面考察了学生应用数学的能力,这也是中考命题的一个重要方向. 例2.某养鱼专业户为了估计湖里有多少条鱼,先捕上100条做上标记,然后放回到湖里,过一段时间待带标记的鱼完全混合于鱼群后,再捕上200条鱼,发现其中带标记的鱼有20条,湖里大约有多少条鱼? 解: 设湖里大约有x条鱼, 则 100:x=20:200 ∴x=1000. 答:湖里大约有1000条鱼. 评注:本题一方面考查了学生由样本估计总体的思想方法和具体做法,另一 方面考察了学生应用数学的能力,这也是中考命题的一个重要方向.
例3.某地区为筹备召开中学生运动会,指定要从某校初二年级9个班中抽取48名女生组成花束队,要求队员的身高一致,现随机抽取10名初二某班女生体检表(各班女生人数均超过20人),身高如下(单位:厘米):165 162 158 157 162 162 154 160 167 155 (1) 求这10名学生的平均身高; (2) 问该校能否按要求组成花束队,试说明理由. 解:(1) 这10名学生的平均身高: (2) 由于样本的众数为162厘米,从而可估计一个班级至少有6名女同学的身高为162厘米.从而可估计全校身高为162厘米的女生数为:6×9=54>48。所以该校能按要求组成花束队。
练习1: (1)、公交508路总站设在一居民小区附近,为了了解高峰时段从总站乘车出行的人数,随机抽查了10个班次的乘车人数,结果如下: 20 23 26 25 29 28 30 25 21 23 (1)计算这10个班次乘车人数的平均数; (2)如果在高峰时段从总站共发车60个班次,根据上面的计算结果,估计在高峰时段从总站乘车出行的乘客共有多少人?
(2).某饮食店认真统计了一周中各种点心的销售情况,统计结果如下表所示,你认为这样的统计结果对该店的管理人员有用吗?请说明你的理由. 一周中各种点心销售情况统计表 点心种类 牛肉拉面 煎包 肉包 菜包 豆浆 油条 销售数量 745碗 15306个 10200个 8007个 4600碗 7502根
练习2: 为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为: 0.6、3.7、2.2、1.5、2.8、1.7、1.2 、2.1、3.2、1.0 (1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算); (2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同); (3)在(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅. 计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g,所用木材的密度为0.5×103kg/m3; (4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来.
解: 所以,该县1999年消耗一次性筷子为2×600×350=420000(盒) (1) 所以,该县1999年消耗一次性筷子为2×600×350=420000(盒) (2)设平均每年增长的百分率为x,则2(1+X)2=2.42 解得X1=0.1=10%,X2=-2.1(不合题意,舍去) 所以,平均每年增长的百分率为10%. (3)可以生产学生桌椅套数为 (套) (4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.
在一个班的40学生中,14岁的有5人,15岁的有30人,16岁的有4人,17岁的有1人, 练习3: 在一个班的40学生中,14岁的有5人,15岁的有30人,16岁的有4人,17岁的有1人, 求这个班级学生的平均年龄。
我当设计师 练习4: 专家提醒,目前我国儿童青少年的健康存在着五个必须重视的问题:营养不良和肥胖、近视、龋齿、贫血以及心理卫生.你认为这是用普查还是抽样调查得到的结果?设计一份调查卷和一个抽样调查方案,了解我们学校学生是否普遍存在这五个健康问题,是否严重?
三、小结: 知识回顾 一般来说,用样本估计总体时, 样本容量越大,样本对总体的估计 也就越精确,相应地,搜集、整理、 计算数据的工作量也就越大,因此, 在实际工作中,样本容量既要考虑 问题本身的需要,又要考虑实现的 可能性和所付出的代价的大小。
四、作业 P108 习题30.2 、 4题 课时作业设计 一、某班一次语文测验的成绩如下:得100分的7人,90分的14人,80分的17人,70分的8人,60分的2人,50分的2人,计算这次测验全班的平均成绩。 二、由于学习的紧张的电视、电脑的影响,中学生的视力问题越来越严重。请同学们分成几个组,对中学生的视力情况做一调查,以此来估计你所在地区的中学生的视力情况。几组这间进行比赛,看看哪一组所选取的样本更接近于总体的特性。