Presentation is loading. Please wait.

Presentation is loading. Please wait.

数据的收集与整理.

Similar presentations


Presentation on theme: "数据的收集与整理."— Presentation transcript:

1 数据的收集与整理

2 1.总体、样本和个体

3 你每周干家务活大约有多长时间? 你们班同学每周干家务活的平均时间是多少?

4 总体与个体 为了了解全班同学每周参与家务劳动的时间,我们对全部同学进行了调查。这种为了一定的目的而对考察对象进行的全面调查,称为普查。其中所考察对象的全体称为总体, 而组成总体的每一个考察对象称为个体.

5 例如: 为了准确了解全国人口情况,我国每10年进行一次全国人口普查.当考察我国人口年龄构成时,总体就是具有中华人民共和国国籍并在中华人民共和国境内常住的人口的年龄,个体就是符合这一条件的每一个公民的年龄.

6 问题: 1.你们班上有多少男生?全校呢?你准备用什么方式获得这些数据? 2.你愿意采用普查的方式了解一批日光灯管的使用寿命吗?
3.全国所有八年级学生每天干家务活的平均时间是多少?你能用普查的方式得到这个数据吗?你准备如何获得这个数据?

7 抽样与样本 普查可以直接获得总体的情况。但有时总体中个体的数目较多,普查的工作量较大;有时受客观条件的限制,无法对所有个体进行普查;有时调查具有破坏性,不允许普查。这时,往往从总体中抽取部分个体进行调查,这种调查称为抽样调查。其中从总体中抽取部分个体叫做总体的一个样本. 样本中个体的数目叫做样本容量。

8 品尝一勺汤,就可以知道一锅汤的味道, 你知道其中蕴涵的道理吗?

9 2007年某区有15000名学生参加中考,为了考察他们的数学考试情况,评卷人从中抽取了800名考生的数学成绩进行统计,下列哪些说法中正确的是 ( )
(A)每名考生是个体 (B)每名考生的数学成绩是个体 (C)这15000名考生是总体 (D)这15000名考生的数学成绩是总体 (E)800名考生是总体的一个样本 (F)800名考生的数学成绩是总体的一个样本 (G)这是属于普查 (H)这是属于抽样调查

10 下列调查中,应采取哪种调查方式比较合理? (“普查”或“抽样调查”)
1. 调查某型号的电视机的使用寿命; 2.中央电视台要调查某栏目的收视率; 3. 为了解全班同学每天课外体育活动的时间。

11 (1)当调查的对象个数较少,调查容易进行时,我们一般采用普查的方式进行。
(2)当调查的结果对调查对象具有破坏性时,或者会产生一定的危害性时,我们通常采用抽样调查的方式进行调查。 (3)当调查对象的个数较多,调查不易进行时,我们常采用抽样调查的方式进行调查。 (4)当调查的结果有特别要求时,或调查的结果有特殊意义时,如国家的人口普查,我们就仍须采用普查的方式进行。

12 想一想 为了了解你所在地区老年人一年中生病的次数,你准备怎样收集数据?

13 小亮的调查结果:    我调查了10名老年邻居,他们一年中生病的次数如下表所示:

14 小明的调查结果:    我在公园里调查了1000名老年人,他们一年中生病的次数如下图所示:

15 小颖的调查结果    我在医院调查了1000名老年病人,他们一年中生病的次数如下图所示: 1~2次 3~6次 7次及以上

16 小华的调查结果   我利用派出所的户籍网随机调查了该地区10%的老年人,发现他们一年平均生病3次左右. 你认为他的调查方式如何?

17 1.样本的代表性 2.样本的广泛性 抽样调查时应注意的问题:
  抽样调查时应注意的问题: 抽样调查只考虑总体中的一部分个体,因此它的优点是调查范围小,节省时间、人力,物力和财力,但其调查结果往往不如普查得到的结果准确。为了获得较为准确的调查结果,抽样时要注意: 1.样本的代表性 2.样本的广泛性

18   抽样调查: 1.当我们所要考察的总体中包含的个体数较多,且总体有明显差异的几个部分组成时,我们应注意几个部分都要抽取到,且应注意各部分的比例. 抽取过程中注意随机性. 2.总体中的每个个体均有被选的可能,并且我们应注意样本的数量不得太少.

19 小故事、大启示   年,美国《文学文摘》杂志根据1000万户电话用户和从该杂志订户所收回的意见,断言兰登将以370:161的优势在总统选举中击败罗斯福.但结果是,罗斯福当选了,《文学文摘》大丢面子. 原因何在呢?   原来,1936年能装电话或订阅《文学文摘》杂志的人,在经济上都相对富裕,而收入不太高的大多数选民选择了罗斯福. 《文学文摘》的教训表明,抽样调查时,既要关注样本的大小,又要关注样本的代表性.

20 1.下列调查中,取样合适的是( ) A.在运动场调查当代青年业余时间娱乐的    主要方式 B.在大学文学院了解市民对古典名著的理解   程度 C.在北京市调查我国公民的受教育情况 D.调查班级学号是奇数的学生,以了解全   班同学的课外阅读情况

21 2.为了调查全校同学的近视率,小明在校园内调查了4名同学,结果有一名同学近视,由此得出,全校同学的近视率是25%,小明的判断正确吗?     (填“是”或“否”).
原因是

22 3.下列所采用的调查方法比较合理的是( ) A.为了了解某校2000名学生的视力情况,从中抽查1名七年级男生的视力
3.下列所采用的调查方法比较合理的是( ) A.为了了解某校2000名学生的视力情况,从中抽查1名七年级男生的视力 B.为了了解某市中小学女生的体能情况,从该市少年体校优秀女运动员中抽取10名进行体能测试 C.某市3万名九年级学生参加中考,为了了解他们的数学考试情况,命题组人员从中抽取100名考生,对他们身高进行统计分析 D.某班有50名学生,为了了解这50名学生的体重情况,对这50名学生每人进行体重测量

23 4.为了了解我校初二年级640名学生的身高情况,从中抽取50名学生进行测量,下列叙述正确的是( )
A 总体是640名学生 B.所采用的调查方法是抽样调查 C. 所采用的调查方法是普查 D.样本是50名学生 5.下列叙述正确的是( ) A. 大样本一定能保证调查结论正确 B. 抽样调查时,既要关注样本的大小,又要关注样本的代表性 C. 大样本调查一定比小样本调查准确 D. 所有调查都应该采用普查,而不应该采用抽样调查

24 6.为了估计湖里有多少条鱼,我们从湖里捕上100条做上标记,然后放回湖里,经过一段时间待带标记的鱼完全混合于鱼群中后,第二次捕得200条,发现其中带标记的鱼25条,通过这种调查方式,我们可以估计湖里有鱼 ________ 条.

25 7.在下面的问题中为了得到数据采用普查 还是抽样调查? ⑴.某灯泡厂的检查人员要检查本厂的灯泡的使 用寿命. ⑵.市教研室为了了解本市7万名学生参加初中毕 业会考数学成绩. ⑶.某班班主任要了解本班学生的睡眠时间. ⑷.了解中央电视台《开心辞典》节目的收视率. ⑸.某科技小组为了了解一个路口的噪声状况.

26 8.工商部门的执法人员为检查某种品牌的2万袋软包装鲜奶是否符合食品卫生标准,随机抽取了50袋样品进行化验.
(1) 在这次调查中,工商部门的执法人员采取了哪种调查方式? (2) 调查中考察对象的总体、样本和个体分别是什么?

27 9.一电脑生产厂家在某城市三个经销本厂产品的大商场调查,产品的销量占这三个大商场同类产品销量的40%
9.一电脑生产厂家在某城市三个经销本厂产品的大商场调查,产品的销量占这三个大商场同类产品销量的40%.由此在广告中宣传,他们的产品在国内同类产品的销售量占40%.请你根据所学的统计知识判断: 该宣传中的数据是否可靠: , 理由是:

28 10. 为了考察某地区初三6000名学生视力状况,从中随机抽取了200名学生进行分析,结果有100名学生配带眼镜,那么可以预测这个地区的学生约有    名学生配带眼镜.

29 2.频数与频率

30 你喜欢看足球比赛吗?你最喜欢的球星是谁?为了了解全班同学最喜欢的球星是谁,你打算如何展开调查?

31 为此,八年级(1)班的小明对全班50位同学展开了调查,结果如下: A A B C D A B A A C
B A A C B C A A B C A A B A C D A A C D B A C D A A A C D A C B A A C C D A A C 其中: A代表贝克汉姆,B代表菲戈,C代表罗纳尔多,D代表巴乔。 1.根据上面结果,你能很快说出该班同学最喜欢的球星是谁吗? 2. 你认为小明的数据表示方式好不好?你能设计出一个比较好的表示方式吗?

32 小丽根据小明的结果制成了下面的图表: 颜色 颜色 3. 你能从中迅速判断出该班同学最喜欢的球星是谁吗? 右侧的统计图叫频数分布直方图

33 频数和频率 从上表可以看出,A,B,C,D出现的次数有的多,有的少,或者说它们出现的频繁程度不同,我们称每个对象出现的次数为频数,而每个对象出现的次数与总次数的比值为频率。 如:A的频数为23,频率为 。

34 在一次有200名学生参加的数学竞赛中,为了直观地了解测试情况,对选手成绩进行了统计,请根据下表和图3,解答下列问题:
分组 频数 频率 59以下 16 0.08 60-69 32 70-79 40 80-89 64 0.32 90-100 0.24 合计 (1)完成表格和图3.

35 200 1 在一次有200名学生参加的数学竞赛中,为了直观地了解测试情况,对选手成绩进行了统计,请根据下表和图3,解答下列问题: 分组 频数
频率 59以下 16 0.08 60-69 32 70-79 40 80-89 64 0.32 90-100 0.24 合计 0.16 0.2 48 200 1 (2) 对统计的数据进行分析,你能得到哪些信息?

36 200 1 在一次有200名学生参加的数学竞赛中,为了直观地了解测试情况,对选手成绩进行了统计,请根据下表和图3,解答下列问题: 分组 频数
频率 59以下 16 0.08 60-69 32 70-79 40 80-89 64 0.32 90-100 0.24 合计 0.16 0.2 48 200 1 (3) 各频数之间,各频率之间有关系吗?

37 3.数据的波动

38 2001年7月3日,我国加入“WTO”. 为了提高农副产品的国际竞争力,一些行业协会对农副产品的规格进行了划分
2001年7月3日,我国加入“WTO”.为了提高农副产品的国际竞争力,一些行业协会对农副产品的规格进行了划分.某外贸公司要出口一批规格为75g的鸡腿,现有2个厂家提供货源,他们的价格相同,鸡腿品质也相近.

39 质检员分别从甲、乙两厂的产品中抽样调查了20只鸡腿的质量(单位:g)如下:
甲厂: 乙厂: 问题1: 如果只考虑鸡腿的规格,你认为外贸 公司应该购买哪个厂的鸡腿?

40 问题2:你能从图中估计出甲、乙两厂被抽 查鸡腿平均质量吗? 请你写出甲、乙两厂被抽查鸡腿平均质量,并在图中画出表示平均质量的直线.

41 问题3: 观察两幅图表,看看被抽查的鸡腿 质量的分布情况你有什么发现?

42 问题4: 你能求出甲厂抽查的这20只鸡腿质量 的最大值是多少吗?最小值呢?它们差几克?乙厂呢?

43 问题5 : 现在你认为外贸公司应该购买哪个厂 的鸡腿?为什么?
平均质量只能反映总体的集中趋势,并不能反映个体的变化情况.从图中看,甲厂的产品更符合要求. 甲厂鸡腿规格比较稳定,最大值和最小值只相差6克;乙厂鸡腿规格相对不稳定,最大值和最小值相差9克.

44 定义: 极差是指一组数据中最大和最小数据的差.
现实生活中,除了关心数据的“平均水平”外,人们还关注数据的离散程度,即它们相对于平均水平的偏离情况.极差就是刻画数据离散程度的一个统计量. 极差是指一组数据中最大和最小数据的差.

45 从这个问题中我们发现: 1. 平均数对于数据分析只能反映他们的平均值,在实际问题的研究中,还有很大的局限性.
1. 平均数对于数据分析只能反映他们的平均值,在实际问题的研究中,还有很大的局限性. 如上面这个问题中,平均数都是75,事实上甲厂的产品更符合要求. 2.数据的离散程度可以用“极差”这个统计量来刻画. 极差大,偏离平均数越大,产品的质量(性能)越不稳定.

46 如果丙厂也参与了竞争,从该厂也抽查20只鸡腿,
问题6: 丙厂这20只鸡腿质量的平均数和极差 分别是多少?

47 问题7:在甲、丙两厂中,写出每个鸡腿质量与
其相应平均数之间的差距 , 你有什么发现? 丙厂的平均数: 极差:

48 平均数不能刻画数据的离散程度, 极差是刻画数据离散程度的一个统计量. 数学上,数据的离散程度还可以用方差或标准差刻画。

49 方差:是一组数据中各个数据与平均数之差 的平方的平均数.
方差:是一组数据中各个数据与平均数之差 的平方的平均数. 其中, 是 的平均数,s2是方差. 标准差:是方差的算术平方根 (S).

50 前面问题中甲厂和丙厂的方差: 根据计算结果,你认为哪家产品更符合规定?

51 1.甲、乙两支仪仗队队员的身高(单位:cm)如下:
甲队:178 177 179 179   178 178 177 178  177 179 乙队:178 177 179 176  178 180 180 178  176 178 哪支仪仗队更为整齐?你是怎么判断的?

52 解:平均身高都是178cm,极差分别为2cm,4cm,方差分别为0.6,1.8,因此可以认为:甲仪仗队更为整齐。
1.甲、乙两支仪仗队队员的身高(单位:cm)如下: 甲队:178 177 179 179   178 178 177 178  177 179 乙队:178 177 179 176  178 180 180 178  176 178 解:平均身高都是178cm,极差分别为2cm,4cm,方差分别为0.6,1.8,因此可以认为:甲仪仗队更为整齐。

53 2.八年级某班的五个同学每人投掷铅球一次,测得成绩如下(单位:m):5,6,9,7,8,这组数据的方差是_______.
标准差是 ________.

54 2.八年级某班的五个同学每人投掷铅球一次,测得成绩如下(单位:m):5,6,9,7,8,这组数据的方差是_______.
标准差是 ________.

55 3.对甲,乙两个小麦品种各100株小麦的株高进行测量,算出
于是可估计株高较整齐的小麦品种是________.

56 4.据统计,某学校教师中年龄最大的为54岁,年龄最小的 为21岁. 那么学校教师年龄的极差是 .
5.若一组数据的方差为0.16,那么这组数据的标准差为 . 6.已知一个样本1、3、2、3、1,则这个样本的标准差是__________.

57 数据是不是越稳定越好呢?

58 某校要从甲乙两名跳远运动员中挑选一人参加一项校际比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下:
甲: 乙: (1)他们的平均成绩分别是多少?甲:601.6,乙:599.3 (2)甲、乙的方差分别是多少?甲:65.84,乙:284.21 (3)这两名运动员的运动成绩各有什么特点? (4)历届比赛表明,成绩达到5.96m的就很可能夺冠,你认为为了夺冠应选谁参加这项比赛?如果历届比赛表明,成绩达到6.10m的就很可能夺冠,那么你认为为了夺冠应选谁参加这项比赛?

59 1.甲、乙两个样本,甲的样本方差是2.15,乙的样本方差
是2.21,那么样本甲和样本乙的波动大小是( ).  (A)甲、乙的波动大小一样   (B)甲的波动比乙的波动大 (C)乙的波动比甲的波动大    (D)无法比较 2.有甲、乙两种水稻,测得每种水稻各10穴的分孽数后,计 算出样本方差分别为=11,=3.4,由此可以估计( )。  (A)甲比乙种水稻分蘖整齐  (B)乙种水稻分蘖比甲种水稻整齐  (C)分蘖整齐程度相同 (D)甲、乙两种水稻分孽整齐程度不能比

60 3.甲、乙 两名学生中选拔一人参加电脑知识竞赛,在相同条件下对他们的电脑知识进行了10次测验,成绩如下:(单位:分) 甲成绩(分)
 3.甲、乙 两名学生中选拔一人参加电脑知识竞赛,在相同条件下对他们的电脑知识进行了10次测验,成绩如下:(单位:分) 甲成绩(分) 76 84 90 86 81 87 82 85 83 乙成绩(分) 89 79 80 91 74 回答下列问题: (1)甲学生成绩的极差是 (分),    乙学生成绩的极差是 (分); (2)若甲学生成绩的平均数是x,乙学生成绩的平均数是y,则    x与y的大小关系是 ; (3)经计算知:  =13.2,   =26.36,这表明     ;   

61 4. 为了了解全市初三学生身高在某一范围内的学生所占比的大小,需知道样本的( ).
A. 平均数    B. 方差 C. 众数     D. 频数分布

62 5.在样本方差的计算公式  中,数字10和20分别表示样本的( ) . A. 容量、方差  B. 平均数、容量  C. 容量、平均数 D. 标准差、平均数

63 6. 一组数据的标准差是2,将这组数据都扩大为原来的3倍,则所得的一组数据的标准差是( ).
A. 2 B. 6 C. 9 D. 18

64 6. 一组数据的标准差是2,将这组数据都扩大为原来的3倍,则所得的一组数据的标准差是( ).
解:

65 7.某养鱼户养鱼,头一年放养鲢鱼苗20000尾,其成活率为70%,在秋季捕捞时,随意捞出10尾鱼,称得每尾的重量如下(单位:千克)
0.8  0.9  1.2  1.3  0.8  0.9  1.1  1.0  1.2  0.8 在这个问题中: ⑴ 此次调查是普查还是抽样调查? (2) 此次调查中,总体、个体、样本分别是什么? (3) 你能估计这塘鱼的总产量是多少千克吗? (4)如果把这塘鱼卖掉,其市场售价为每千克4元,那么能收入多少元?除去当年的投资成本16000元,第一年纯收入多少元?

66 (2) 总体是这14000尾鱼的重量的全体;个体是每尾鱼的重量;样本是随意捞出的10尾鱼的重量的全体。
7.某养鱼户养鱼,头一年放养鲢鱼苗20000尾,其成活率为70%,在秋季捕捞时,随意捞出10尾鱼,称得每尾的重量如下(单位:千克) 0.8  0.9  1.2  1.3  0.8  0.9  1.1  1.0  1.2  0.8 解: ⑴ 抽样调查。 (2) 总体是这14000尾鱼的重量的全体;个体是每尾鱼的重量;样本是随意捞出的10尾鱼的重量的全体。 (3) 这塘鱼的总产量大约是14000×1=14000(千克)。 (4)如果把这塘鱼卖掉,其市场售价为每千克4元,那么能收入4×14000=56000(元),除去当年的投资成本16000元,第一年纯收入 =40000(元)。

67 8. 一次科技知识竞赛,两组学生成绩统计如下:
 已经算得两个组的人均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩,并说明理由. 分数 50 60 70 80 90 100 甲组 2 5 10 13 14 6 乙组 4 16 12

68 解:两组的极差都是50分,方差分别为: 8. 一次科技知识竞赛,两组学生成绩统计如下:
已经算得两个组的人均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩,并说明理由. 分数 50 60 70 80 90 100 甲组 2 5 10 13 14 6 乙组 4 16 12 解:两组的极差都是50分,方差分别为:

69 作业: 求样本3, -4, 0, -1, 2的方差和标准差.

70 再见 新春愉快!


Download ppt "数据的收集与整理."

Similar presentations


Ads by Google