用样本估计总体
用样本估计总体 用样本估计总体(两种): 一种是:用样本的频率分布估计总体的分布。 另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。
用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图 频率分布折线图 和总体密度曲线 一 频率分布图和频率分布直方图 频率分布折线图 和总体密度曲线 三 莖叶图(stem-and-leaf display)
2.2.1 用样本的频率分布估计总体分布
探究: 我国是世界上严重缺水的 国家之一,城市缺水问题较为突出。某市政府为了节约用水,计划在 本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的按平价收费,超过 a的按议价收费。如果希望大部分居民的 日常生活不受影响,那么标准a定为多少比较合理?你认为,为了较为合理地确定出这个标准,需要做什么工作? 从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是 0.2 t,最大值是4.3 t.其他在 0.2至4.3之间。很难再发现其他信息。我们很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据进行整理与分析。
根据这些数据你能得出用水量其他信息吗?
表2-1 100位居民的月均用水量 (单位 :t ) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是 0.2 t,最大值是4.3 t.其他在 0.2至4.3之间。很难再发现其他信息。我们很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据进行整理与分析。
画频率分布直方图的步骤 4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。 1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 3、 将数据分组(8.2取整,分为9组) 4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。
表2-2 100位居民月均用水量的 频率分布表 分组 频数累计 频数 频率 [0 , 0.5) 4 0.04 [0.5 , 1) 8 0.08 [1 , 1.5) 15 0.15 [1.5 , 2) 22 0.22 [2 , 2.5) 25 0.25 [2.5 , 3) 14 0.14 [3 , 3.5) 6 0.06 [3.5 , 4) 4 0.04 [4 , 4.5) 2 0.02 合计 100 1.00
频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 小长方形的面积=?
频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 小长方形的面积总和=? 注:小长方形的面积=组距×频率/组距=频率 各长方形的面积总和等于1。
频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量最多的在那个区间?
频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 直方图有那些优点和缺点?
0.5 1 1.5 2 2.5 3 3.5 4 4.5 0.50 0.40 0.30 0.20 0.10 频率/组距 月均用水量 /t 注:小长方形的面积=组距×频率/组距=频率 各长方形的面积总和等于1。
练 习 1.有一个容量为50的样本数据分组的频数如下 [12.5, 15.5) 3 [24.5, 27.5) 10 [15.5, 18.5) 8 [27.5, 30.5) 5 [18.5, 21.5) 9 [30.5, 33.5) 4 [21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少?
解:组距为3 分组 频数 频率 频率/ 组距 0.020 0.053 0.060 0.073 0.067 0.033 0.027 [12.5, 15.5) 3 0.06 0.16 0.18 0.22 0.20 0.10 0.08 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4
频率分布直方图如下: 频率 组距 0.070 0.060 0.050 0.040 0.030 0.020 0.010 12.5 15.5
小结:画频率分布直方图的步骤 4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。 1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 3、 将数据分组(8.2取整,分为9组) 4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
注意 (2)纵坐标为: