Download presentation
Presentation is loading. Please wait.
1
第三章 统计整理 第一节 统计整理概述 第二节 统计分组 第三节 频数分布 第四节 统计表和统计图
2
教学目的 了解统计整理的基本内容;掌握选择分组标志、编制变量数列、制作统计图表的技术和方法。能够运用统计分组理论和频数分布技术,依据客观事物的数据进行基本统计描述和分析。 重点难点 统计分组的方法;变量数列的编制;统计表和统计图的制作。
3
第一节 统计整理概述
4
一、统计整理的意义 对收集得到的初始数据进行审核、分组、汇总,使之条理化、系统化、科学化,变成能反映总体特征的综合数据的工作过程。 统计整理
1.统计整理是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。 2.统计整理是积累历史资料的必要手段。 意义
5
二、统计整理的内容 工 作 内 容 资料审核 分组和汇总 统计图表 资料积累 完整性 准确性 及时性
6
三、统计数据预处理 1.数据的审核与筛选 检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。 完整性
一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。 准确性 一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑. 二是计算检查,检查调查中各项数据在计算方法和计算结果上有无错误,数字的计量单位有没有差错等。
7
2. 数据的订正 对审核过程中发现的迟报、漏报及计算错误,应及时催报、补报、改正,并针对不同的错误作出不同的处理: (1)对于可以肯定的一般错误,应及时代为更正,并向有关单位核对; (2)对于可疑之处或无法代为更正的错误,应通知原报单位复查更正; (3)对于在一个单位发现的有代表性的重大差错,除通知原报单位更正外,还要将差错情况通报尚未报送资料的单位,以防止类似错误的发生; (4)对于严重的错误,应发还重填,并查明发生错误的原因;属于违反法规的,应依法严肃处理。
8
3.数据的排序 数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律,为研究者找到解决问题的线索。此外,排序还有助于对数据的检查纠错,为分组、汇总提供依据。 对于定类数据,可以按字母的顺序或笔画数的多少顺序排序; 对于定距数据和定比数据,可以按递增顺序排列或按递减顺序排列。 排序后的数据称为顺序统计量。
9
四、统计资料汇总 (一)统计资料的汇总技术 1.手工汇总:点线法、凭证法、过录法、折叠法、卡片法 2.电子计算机汇总
(二)统计汇总的组织形式 1.逐级汇总 2.集中汇总 3.综合汇总
10
第二节 统计分组
11
一、统计分组的概念 根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型(组),使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、反映总体特征的资料。 统计分组 统计分组具有分与合的双重功能,是分与合的对立统一。 统计分组的目的是要在同质性的基础上研究总体的内在差异性。 统计分组存在一定的局限性。 统计分组的关键是选择分组标志和划分各组界限。
12
二、统计分组的作用 1. 划分现象的不同类型 例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济 2. 反映总体内部结构和特征 例:上海市按GDP计算的三次产业结构(%) 1980年 1990年 1996年 1997年 GDP 第一产业 第二产业 第三产业
13
3. 研究现象之间的依存关系 如农作物的耕作深度与收成率之间的关系、家庭收入与生活费支出之间的关系、市场商品价格与其需求量之间的关系等等,都可以通过统计分组来研究。 例:研究贫富差别的基本方法:将人口按收入水平等分为 5 组,观察收入差别。 20% 20% % % % 中国2003年:最富的20%家庭拥有全部财富的41%,最穷的20%家庭拥有全部财富的8%。
14
三、统计分组的原则 四、分组标志的选择 1.穷尽原则:使总体中的每一个单位都应有组可归。
2.互斥原则:使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属于几个组。 四、分组标志的选择 1.要符合统计研究的目的和要求 2.必须选择最重要的标志作为分组依据 3.要考虑到社会经济现象所处的具体历史条件
15
五、统计分组的类型 1、品质分组 2、数量分组 (一)按照分组标志的性质不同 或称属性分组。按照品质标志进行的分组。
或称变量分组。按照数量标志进行的分组。
16
1、简单分组 2、复合分组 (二)按照分组标志的多少和分组的形式不同
将总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。 对所研究的总体按两个或两个以上的标志重叠起来分组。可用于对事物多方面、多层次的分析研究。
17
高校教师的复合分组 第一标志(职务) 第二标志(年龄) 第三标志(性别) 高级职称 (教授、副教授) 45岁以上 男 女 45岁以下
非高级职称 (讲师、助教)
18
3、分组体系 指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。 对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。 平行分组体系 对同一总体选择两个或两个以上标志分别进行层叠分组。各分组标志表现交叉结合使用。 复合分组体系
19
平行分组体系 男性 按性别分类 女性 高级 对教师的分类 共计7组 按职称分类 中级 初级 青年 按年龄分类 中年
20
复合分组体系 共计12组2×3×2 男 按性别分类 女 高级 对教师的分类 按职称分类 中级 按年龄分类 初级 中年 青年
21
统计分组的程序与原则 选择分组标志 确定分组体系 总体单位归类 完备性和互斥性:每个单位均能且只能归到某个组中。
科学性:组间差异大,组内差异小。
22
六、统计分组方法 分组方法 按品质标志分组 按数量标志分组 单项式分组 组距式分组 等距分组 异距分组
23
(一)品质标志分组 选择反映事物属性差异的标志作为分组依据。 1. 简单品质标志分组
简单品质分组指分组标志一经确定,组的名称和组数也就随之确定,而且各单位应分在哪一组也比较明确,不存在组与组之间界限区分困难的分组。 2.复杂品质标志分组 复杂品质分组指分组标志选定以后组间界限不易划分,存在交叉过渡形态,总体中的各单位归并于何组比较困难的统计分组。这种分组又叫分类。
24
(二)数量标志分组 选择反映事物数量方面的差别的标志作为分组依据。 指用单一的数值作为分组标志的分组。每个数值作为一个组。 单项式分组
变量是离散变量 变量的不同取值个数较少 编制条件: 同时 具备 如某班学生按年龄分组:17岁,18岁,19岁,20岁, 21岁,22岁。
25
【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。 编制结果如下: 日产量(件)X 工人数(人) f 20 21 22 23 24 25 26 3 5 6 4 2 1 合计
26
将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。
组距式分组 变量是连续变量; 或:总体单位数较多,变量不同取值个数也较多的离散变量。 编制条件: 60分以下60—70分70—80分80—90分90分以上 某班学生统计学成绩分组
27
组距式分组中的一些概念 上限 组限 下限 区间数值的最大值 区间数值的最小值 相邻两组中,前一组的上限与后一组的下限数值相重叠。 重合式
如果分组标志是连续型变量,则组限一般用重合式表达;如果分组标志是离散型变量,则组限一般用不重合式表达。 相邻两组中,前一组的上限与后一组的下限数值相重叠。 一般按“上限不在内”的原则处理。 重合式 前一组的上限与后一组的下限两变量值紧密相连但不重叠。 不重合式
28
组距 开口组 组数 每一组的区间长度 组距=上限-下限 缺少上限数值或下限数值的组 各组组距都相等的分组称为等距分组。
各组组距不相等的分组则称为异距分组,或称不等距分组。 组数 分组的个数 等距分组组距=(最大值-最小值)/组数 组数与组距成反比,即组数少,则组距大;组数多,则组距小。
29
组中值 注意 每一组中点位置的数值 重合式组限组的组中值= 非重合式组限组的组中值=
开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。 缺下限开口组的组中值= 缺上限开口组的组中值=
30
某地区100个百货商店 月销售额与流通费用情况 如:组距d=U-L =100-50=50(万元) 上组限U
销售额(万元) 商店数(个) 每百元商品销售额中支付的流通费(元) 50以下 50~100 100~200 200~300 300以上 10 20 30 25 15 14.2 11.4 10.1 9.2 8.5 如:组距d=U-L =100-50=50(万元) 上组限U 如:组中值x=(U+L)/2 =( )/2 =150(万元) 下组限L
31
七、统计资料的再分组 统计资料的再分组是指把统计分组资料按某种要求重新划定各组界限,再将资料中的单位数或比重分布做出相应的调整。
再分组的步骤如下: 1.确定再分组的各自范围。 2.计算新组各自相连组的比例。可用相连组的部分组距除以相连组的组距之和而求得。 3.确定再分组的对应单位数。即计算各组变量值的区间范围所对应的单位数 。 再分组中用比例分摊相应的单位数是假定现象为均匀变动,而客观情况并非完全如此,故再分组的结果一般表现为近似值。
32
某工业部门劳动生产率分组表 组号 按劳动生产率 分组(千元/人) 企业数 比例(%) 职工数 总产值 1 2 3 4 5 6 7 8 9
10 6以下 6~7 7~8 8~9 9~10 10~11 11~12 12~13 13~14 14以上 11 14 15 20 12 6.20 9.48 10.78 16.26 20.00 12.93 11.54 5.40 2.69 4.72 9.66 12.83 13.00 16.78 19.12 10.98 9.04 3.82 1.84 2.93 合 计 100 100.00
33
某工业部门劳动生产率再分组表 组 别 按劳动生产率分组 (千元/人) 企业数比例 (%) 职工数比例 总产值比例 A B C D 7.5以下
某工业部门劳动生产率再分组表 组 别 按劳动生产率分组 (千元/人) 企业数比例 (%) 职工数比例 总产值比例 A B C D 7.5以下 7.5~10 10~12.5 12.5以上 30 40 23 7 21.07 41.65 27.17 10.11 28.99 42.40 21.93 6.68 合 计 100 100.00
34
第三节 频数分布
35
在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,又称为次数分布或分配数列。
一、频数分布的概念 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,又称为次数分布或分配数列。 频数分布 总体按某标志所分的组 各组的频数或频率 构成 频数 各组分配的总体单位数 频率 各组单位数占总体单位总数的比重 =1 频率有两个性质:(1)0≤ ≤1,(2)
36
二、频数分布的种类 按分组标志和分组形式的不同可分成如下类别: 变量数列 品质数列 单项数列 组距数列 频数分布 等距数列 异距数列
37
品质频数分布 2009年末我国大陆人口的城乡分布 按城乡别分组 人口(万人) f 构成(%) f/∑f 总人口 城镇 乡村 133474
62186 71288 100.0 46.6 53.4
38
单项式频数分布 某高校在校学生年龄分布 按年龄分组(岁) 学生人数(人)f 比重(%) f/∑f 17 18 19 20 21 22 23
某高校在校学生年龄分布 按年龄分组(岁) 学生人数(人)f 比重(%) f/∑f 17 18 19 20 21 22 23 54 189 228 283 131 97 24 5.4 18.8 22.7 28.1 13.0 9.6 2.4 合 计 1006 100.0
39
组距式频数分布 某集团公司职工分组表 按月工资分组(元) 职工人数(人) f 比重(%)f/∑f 2000以下 2000~2100
某集团公司职工分组表 按月工资分组(元) 职工人数(人) f 比重(%)f/∑f 2000以下 2000~2100 2100~2200 2200~2300 2300~2400 2400~2500 2500以上 50 72 105 487 368 121 59 4.0 5.7 8.3 38.6 29.2 9.6 4.6 合 计 1262 100.0
40
三、累计频数和累计频率 向 上 累 计 下 累计频数和累计频率是将变量频数分布中各组频数或频率依次累加而得到的各组累计频数或累计频率。
从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。 从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。
41
某集团公司职工基本工资分组表 按月工资分组(元) 职工人数(人) 比重 (%) 向上累计 向下累计 人数 比重% 2000以下
某集团公司职工基本工资分组表 按月工资分组(元) 职工人数(人) 比重 (%) 向上累计 向下累计 人数 比重% 2000以下 2000~2100 2100~2200 2200~2300 2300~2400 2400~2500 2500以上 50 72 105 487 368 121 59 4.0 5.7 8.3 38.6 29.2 9.6 4.6 122 227 714 1082 1203 1262 9.7 18.0 56.6 85.8 95.4 100.0 1212 1140 1035 548 180 96.0 90.3 82.0 43.4 14.2 合 计 —
42
四、分布数列的编制 编制品质数列时,分组标志一经确定,组数便明确了,只要将各组相应的单位数计算清楚,然后按组别排列就可以了。
编制单项式变量数列时,先将各变量值出现的次数计算清楚,然后按变量值大小顺序将各组次数排列,便形成单项式变量数列。
43
品质数列的编制 中国体育代表团在悉尼奥运会上获金牌的项目 射击 射击 体操 体操 乒乓球 举重 乒乓球 羽毛球 举重 乒乓球 羽毛球 举重 举重 跳水 跳水 跳水 乒乓球 跳水 射击 体操 羽毛球 柔道 柔道 举重 田径 羽毛球 跆拳道 跳水
44
获金牌项目 金牌数(枚) 占总数比例(%) 跳水 5 17.86 举重 乒乓球 4 14.29 羽毛球 体操 3 10.71 射击 柔道 2 7.14 田径 1 3.57 跆拳道
45
【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。 编制结果如下: 日产量(件)X 工人数(人) f 20 21 22 23 24 25 26 3 5 6 4 2 1 合计 单项数列
46
变量数列的编制 组距数列 等距数列 异距数列 指每个组的变量值用一个区间来表现的变量数列 编制条件: 变量是连续变量;
或:总体单位数较多变量不同取值个数也较多的离散变量。 编制条件: 等距数列 异距数列 变量值变动区间的长度相等 变量值变动区间的长度不完全相等
47
适用于总体单位的标志值变动比较均匀的情况 编制等距数列
实例 己知某班35个学生统计学期末考试成绩如下,单位(分) 要求编制组距数列。
48
编制步骤: ⒈将原始数据排序,求全距 2.确定组距数列的类型 3.确定组距及组数 R≤组距(d) ×组数(m) 确定组距的原则: 要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
49
计算组数(组数不宜过多,也不宜太少) (当 的结果为整数时) (当 的结果为小数时) 上例中,取d=10,则有
50
4.确定组限 对于离散变量,相邻组组限可以间断,也可重叠; 对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以上”的开口组。 组限的表示方法
51
5、制作组距数列 某班统计学考试成绩表 按考试成绩分组(分) 学生人数(人) 60以下 60~70 70~80 80~90 90以上 3 8
合计 35
52
五、频数分布的类型 (-)钟形分布 钟形分布是指靠近两端的变量值分配次数较少,中间变量值则分配次数较多,绘制成的曲线图形状宛如一口古钟的次数分布。钟形分布是最常见的分布,其突出特征是“中间大,两头小”。
53
(二)U形分布 U形分布的特征与钟形分布特征恰恰相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,分布特征是“两头大,中间小”。绘成的曲线图形如英文字母“U”。 例如,人口在不同年龄上的患病率、死亡率等一般近似地表现为U形分布。
54
例如,商品供给量随着价格的提高而不断增加,使供给曲线呈正J分布;人口总体按年龄大小的分布一般呈反J形分布。
J形分布有正反两种情况:次数随变量值增大而增多时所绘成的曲线图形如英文字母“J”,称为正J形分布;次数随变量增大而减少时所绘成的曲线图犹如反写的英文字母“J”,称为反J分布。 例如,商品供给量随着价格的提高而不断增加,使供给曲线呈正J分布;人口总体按年龄大小的分布一般呈反J形分布。
55
第四节 统计表和统计图
56
统计表 作用 利用表格形式,把一系列统计数字按照一定的次序和逻辑关系表达出来的一种方法。
1、是表达和运用统计资料的特有形式,是进行定量分析研究的基本方法 。 2、使统计资料系统化、条理化、规范化、生动化。 作用 3、清晰地显示社会经济现象的活动过程和现象之间的复杂关系
57
统计表的构成 总标题是统计表的名称,用以概括说明整个表的内容,一般位于表的上方中央。 横标目(横行标题)是横行内容的名称,代表统计所要说明的对象,也称主词,一般列在表的左边。 纵标目(纵栏标题)是纵栏内容的名称,是用来说明主词情况的统计指标,也称为宾词,一般列在表内的上方。 统计数字是各项指标的具体数值,内容由横标目和纵标目所限定。 填表说明,一般表下附有资料来源、指标计算方法、填报单位、填表人、填表日期等说明。
58
资料来源:《中国统计年鉴》2001年注释:工业总产值按工厂法计算。
2000年我国工业总产值和增加值 总标题 宾词 企业单位数(个) 工业总产值(亿元) 工业增加值(亿元) 全国总计 轻工业 重工业 162885 81902 80983 纵栏标题 指标数值 横行标题 主词 表外资料 资料来源:《中国统计年鉴》2001年注释:工业总产值按工厂法计算。
59
统计表的分类 1.调查表、汇总表和分析表 统计表按作用不同可以分为调查表、汇总表和分析表。 调查表是在统计调查中用于登记、搜集原始资料的表格; 汇总表是用于统计资料整理、汇总的表格; 分析表是用于统计分析的表格。
60
2.空间数列表和时间数列表 统计表按所反映统计数列的时空性质不同,可以分为空间数列表和时间数列表。 空间数列表又称静态表,是反映同一时间条件下不同空间范围内的统计数列的表格,它可以说明现象在不同空间内数量分布状态。 时间数列表又称动态表,是反映同一空间条件下不同时间上的统计数列的表格,它可以说明在既定的空间范围内现象在不同时间上的变动过程。 时空间数结合表,指将时间数列和空间数列结合起来编制的统计表。
61
3.简单表、分组表和复合表 统计表按对总体分组的情况不同,可以分为简单表、分组表和复合表。 简单表是指对总体未做任何分组,仅按单位名称或时间顺序排列而成的统计表。 分组表又称简单分组表,是对总体的统计单位按一个标志进行分组而形成的统计表。 复合表又称复合分组表,是对总体的统计单位按两个或两个以上的标志进行交叉重叠分组,或按每一标志单独分组平行排列而形成的统计表。
62
简单表 指总体未经过任何分组的统计表 某地区2002年铁矿计划完成情况 企业名称 计划产量 (吨) 实际产量 计划完成 (%) 甲矿 乙矿
丙矿 丁矿
63
简单分组表 某地区2002年各类型企业总产值表 指总体按一个标志分组的统计表 企业按规模分组 总产值 (亿元) 比上年增长(%) 大型企业
中型企业 小型企业 合计
64
复合分组表 指总体按两个或两个以上标志进行交叉重叠分组的统计表 某中学学生构成情况表 单位:人 按学科 按性别 文科 理科 合计 男性 女性
100 160 200 300 260 560
65
统计表的设计与编制规则 必须遵循科学、简炼、实用、美观的原则。 统计表的标题、项目、指标要简明扼要,能准确反映内容。
如果指标的计量单位只有一个,则通常列在表的右上角,如果计量单位较多,则列在相应的指标栏内。 统计表的纵栏、横行的排列要尽量反映出内容方面的逻辑关系。 当统计表的栏目较多时,可编号说明其相互关系。主词栏和计量单位栏常用甲、乙、丙等文字编号,宾词栏常用1、2、3等数字编号。
66
表中的合计栏可以排在前面,也可以排在最后,如果只列出其中部分项目,则合计栏必须排在前面。
表中的统计数字要根据纵横关系对位,数字为零时要写出“0”来,不应填写数字的空格用“─”线表示;未发生的数字空着不填;估算的数字应在表下说明;无法取得的资料用“…”号表示;如果某项数字与邻项数字相同,则仍应填写数字,不得用“同上”、“同左”等字样或符号代替。 表的上下两端用粗线,左右两边不封口,纵栏之间用细线分开,横行之间可以不加线。如果横行过多,也可以每五行加一细线。 统计表的资料来源及其他需要说明的问题可在表下加以注明。
67
统计图 用来表现统计数据的各种几何图形、具体事物的形象、符号等都叫统计图。 用统计图来显示统计数据,具有直观、生动、形象、易懂的优点。统计图没有冗长的数据和呆板的表格形式,易为一般人接受和理解。 不同的统计图,绘制方法不同,但都必须遵守如实反映、便于比较、通俗易懂、鲜明醒目、灵活机动原则。
68
统计图的制图规则 明确制图目的,根据统计资料的性质和特点,突出重点,选择合适的统计图形
统计图的设计和绘制要保持严格的科学性与艺术性,简明扼要,道俗易懂,图形布局合理 图示资料应完整、准确;图题简明 统计图的坐标与尺度应科学合理
69
统计图 统计图的分类 几何图 按图形分 象形图 统计地图
用几何的线和形来表示和分析统计资料的统计图。如条形图、曲线图、圆形图、方快图、树形图、平面图和立体图等 几何图 按图形分 是利用现象本身形象的简化来表述和分析统计资料的统计图 象形图 在地图上用点、线、图来表述和分析统计资料的统计图,用来反映现象数量在地区上的分布状况 统计地图
70
常用统计图 数据类型 定性数据 定量数据 条形图 圆形图 折线图 雷达图 直方图 曲线图
71
条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也叫柱形图。
(一)条形图和直方图 1.条形图 条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也叫柱形图。 如根据下表中资料绘制条形图如下(见图3.1) 广告类型 人数(人) 商品广告 112 服务广告 51 金融广告 9 房地产广告 16 招生招聘广告 10 其他广告 2 合计 200
72
图3.1 条形图
73
2.直方图 直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标系中,横轴表示数据分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,即直方图。 根据下表中资料可绘制成直方图如图3.2。 我国2000年至2009年国内生产总值 单位:万元 年份 2000 2001 2002 2003 2004 总产值 89442 109655 120333 135823 159878 2005 2006 2007 2008 2009 184937 216314 265810 314045 335353
74
图3.2 直方图
75
(二)圆形图和环行图 1.圆形图 圆形图是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。 根据作用不同,可分为圆形比较图、圆形结构图和圆形结构比较图。我们主要介绍圆形结构图。 圆形结构图通过圆内各扇形的面积来反映总体中各组成部分所占的比例。 绘制圆形结构图的关键是正确计算各扇形的面积。由于在相同半径条件下,扇形面积与圆心角成正比,且圆心角度数为360,故各扇形的中心角度为3600×各组频率。
76
我国法人单位按单位类别分组统计表 按单位类别分组 单位数(万个) 比重(%) 企业法人 302.6 59.2 机关、事业法人 102.6
我国法人单位按单位类别分组统计表 按单位类别分组 单位数(万个) 比重(%) 企业法人 302.6 59.2 机关、事业法人 102.6 20.1 社会团体法人 10.6 2.1 居(村)委会 79.2 15.6 其他法人 15.7 3.0 合计 510.7 100.0 例如,根据2003年公布的我国第二次基本单位普查统计资料(见上表),企业法人占 59.2%,那么扇形的中心角度数应为360o×59.2%= 。依此类推,我们可绘制圆形结构图如图3.3所示。
77
图3.3 圆形图
78
2.环形图 环形图中间有一个“空洞”,总体中的每一个部分数据用环中的一段表示。 环形图可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。 设甲、乙两个教学班学生对某门课程教学评价资料如下表所示,据此资料作环形图如图3.4所示。
79
课程教学情况评价表 图3.4 环形图 班别 很不满意 不满意 一般 满意 很满意 甲班 2% 5% 20% 50% 23% 乙班 10%
30% 40% 15% 图3.4 环形图
80
(三)折线图和曲线图 1.折线图 折线图也称频数多边图,它是在直方图的基础上把相邻直方形的顶边中点连接成一条折线,再把拆线两端与横轴上直方形两侧延伸的假想组中点相连,就形成了频数分布折线图。 折线图也可以用组中值与次数求坐标点连接而成。 例如,根据直方图表中资料可绘制如下折线图(图3.5)。
81
图3.5 折线图
82
2.曲线图 曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。 曲线图根据所示数据的性质和作用不同,可分为频数分布曲线图、动态曲线图和依存关系曲线图。 在频数分布折线图的基础上,当变量数列的组数无限增多时,折线图便近似地表现为一条平滑的曲线,折线图就变成了频数分布曲线图。 例如,根据下表中资料资料可绘制出图3.6所示曲线图。
84
图3.6 曲线图
85
(四)雷达图 这种图形既象雷达荧光屏上看到的图象,也象个蜘蛛网,因此也有人称为蛛网图。设有n组样本S1,S2,…,Sn,每个样本测得P个变量Xl,X2,…,Xp,共计np个观测值。 要绘制这P个变量的雷达图,其具体做法是:先画一个圆并将圆P等分,得到P个点,让这P个点对应P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小用由半径上的点到圆心的距离表示,将同一个样本的值在P个坐标上的点用线段连接,这样n个样本形成的n个多边形就是一个雷达图。
86
例如,1998年至2008年我国农村居民消费支出构成资料如下表所示,据表中资料可作图3.7所示雷达图。
我国居民消费支出构成变化分析 单位:% 项 目 1998年 2002年 2008年 合 计 食品消费 衣着消费 居住消费 用及服务性消费 100 53.4 15.1 6.2 25.3 46.5 16.4 5.7 31.4 43.7 18.5 5.8 32.0
87
图3.7 雷达图
88
雷达图显示,1998年到2002年我国农村居民生活消费结构发生了较大变化,食品支出比重有较大下降,而用及服务性支出比重则有较大提高。2002年到2008年,消费结构得到进一步改善。同时我们也可以看到,我国农村居民消费支出模式10年来基本相同,这可从雷达图的形状看出。 在消费支出中,食品支出是第一位的,食品和用及服务性支出二者占了消费支出的绝大比重,衣着和居住支出占比重很小。
89
谢谢观赏!
Similar presentations