复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤 三步骤:收集数据、整理数据、统计推断。即通过抽样方法收集数据的目的是从中寻找所包含的信息,用样本去估计总体。 3.随机抽样的三种常用方法 简单随机抽样、系统抽样、分层抽样
探究一 频率分布表
如何根据样本分布的情况对总体分布的情况作出推断 将是我们本节要学习的内容。
如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组? 问题2 分成多少组合适呢? 如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组? 各组数据的取值范围可以如何设定? 可以将数据分为9组.
各组频数之和等于样本容量n,各组频率之和等于1。 分组 频数累计 频数 频率 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计 4 0.04 8 0.08 15 0.15 22 0.22 25 0.25 14 0.14 6 0.06 4 0.04 2 0.02 100 1.00 各组频数之和等于样本容量n,各组频率之和等于1。
(1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1) (3)将数据分组 (4)列频率分布表统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
各小长方形的面积之和(频率之和)等于1,
数据特点 1.月均用水量在[2,2.5)内的居民最多.大部分居民的月均用水量 都集中在[1,3)之间,只有少数居民的月均用水量很多或很少; 2.居民月均用水量的分布是“山峰”状的,而且是“单峰”的; 3.居民月均用水量的分布有一定的对称性等。 从频率分布直方图可以非常直观的看出数据分布的总体趋势。 2.频率分布直方图不能保留原始的数据内容,把数据表示成 直方图后,原有的具体数据信息就被抹掉了。
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以0.1和1为组距重新作出的频率分布直方图。
135 98 102 110 99 121 96 100 103 125 97 117 113 92 109 104 112 124 87 131 123 128 105 111 114 108 129 126 115 106 89 80 120 118 90 107 91 101 116 95 119
分组 频数 频率 频率/组距 [80,85) 1 0.01 0.002 [85,90) 2 0.02 0.004 [90,95) 4 0.04 0.008 [95,100) 14 0.14 0.028 [100,105) 24 0.24 0.048 [105,110) 15 0.15 0.030 [110,115) 12 0.12 0.024 [115,120) 9 0.09 0.018 [120,125) 11 0.11 0.022 [125,130) 6 0.06 0.012 [130,135] 合计 100 0.2
C C
B 0.6 解析:第2组与第3组频率之和为1-0.1-0.3=0.6.
A
60
85
作业布置 1.P71 练习题 1(1)、 题 2 2、同步作业 谢 谢!