Presentation is loading. Please wait.

Presentation is loading. Please wait.

统计学原理 第三章 统计整理.

Similar presentations


Presentation on theme: "统计学原理 第三章 统计整理."— Presentation transcript:

1 统计学原理 第三章 统计整理

2 本章主要内容: 第一节 统计整理的意义和步骤 第二节 统计分组 第三节 分配数列 第四节 统计表 第五节 统计图

3 第一节 统计整理的意义和步骤 一、统计整理的概念和意义 1、概念
第一节 统计整理的意义和步骤 一、统计整理的概念和意义 1、概念 统计整理是根据统计研究的目的和任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。 2.意义 (1)统计整理是统计工作中一个十分重要的中间环节,它既是统计调查阶段的继续,又是统计分析阶段的前提和基础。 (2)统计整理实现了从个别单位的标志值向说明总体数量特征的指标值的过渡,是对社会经济现象从感性认识上升到理性认识的过渡阶段。

4 二、统计整理的步骤 1、设计整理汇总方案 汇总方案设计包括两个方面:一是对总体的处理,即确定总体的统计分组与分组体系;二是确定用哪些统计指标来说明总体,即根据研究目的设计一套汇总表。 2、对调查资料的审核 审核内容包括三方面:①完整性;②及时性;③准确性。 3、统计分组 就是按照一定的组织形式和方法,根据调查资料的性质与特点,将资料划分若干个不同的组别,以便对被研究的社会经济现象进行准确的数量描述和数量分析。

5 4、统计汇总 就是选择适当的汇总组织形式和技术方法,按照分组要求对原始资料进行汇总,计算各组及总体的单位数和标志总量,统计汇总是统计整理的中心内容。 5、编制统计表和绘制统计图 将整理结果用统计表和统计图的形式反应出来,它可以清晰地、简明扼要地表述统计资料的内容,形象生动地反映社会经济在数量方面的具体表现和有关联系。

6 第二节 统计分组 一、统计分组的概念 按性别分组
第二节 统计分组 一、统计分组的概念 统计分组:是根据统计研究的目的和事物总体内部的特点,将统计总体按照一定的标志区分为若干组或若干部分的一种统计方法。 “分”:就是把同一总体中性质不同的总体单位分配到不同的组里,突出组与组之间的差异性。“组”:就是把同一总体中性质相同的总体单位归并到同一组里,突出组内的同质性。 按性别分组 分组前 分组后 女生8人 占40% 男生12人 占60% 例1:某班学生(20人)总体按性别标志分组情况

7 例:欲了解我校的师资梯队和水平情况,就应该选取职称标志和年龄标志进行分组。若想了解我校学生的来源情况,就应该选取籍贯标志进行分组。
分组标志的选择是分组的关键。在统计整理中,选择什么样的标志就会形成什么样的分组体系。且分组标志一经确定,就突出了总体在此标志下的性质差异,而掩盖了总体在其他标志下的差异 所以,根据统计研究的目的,在对研究对象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组的标志。 例:欲了解我校的师资梯队和水平情况,就应该选取职称标志和年龄标志进行分组。若想了解我校学生的来源情况,就应该选取籍贯标志进行分组。

8 二、统计分组的意义与作用 统计分组是基本的统计方法之一,通过分组把总体中具有不同性质的单位分开,把性质相同的单位合在一起,保持组内资料的同质性和组间资料的差异性,正确地反映出统计总体的本质特征,以便进一步运用各种统计方法,研究现象的数量表现和数量特征。 统计分组法在统计认识中的作用是多方面的,主要有以下三方面: 1.划分事物的类型:不同类型的事物有不同的特点、性质和规律,只有通过科学的分组才能达到对不同类事物和总体的认识。

9 2.揭示现象内部结构:一是从静态上来看,各组占总体比重大小的不同,对总体的影响也不同,比重相对大的决定着总体的性质或结构类型;二是从动态上来看,观察各组比重的变化过程能更加深刻的认识现象和事物发展的规律和趋势。 3.分析现象之间的依存关系:不同现象之间的依存关系是一种比较紧密的联系,而统计分组法是分析研究此种关系最基本的一种方法。具体运用时关键是要分清影响因素(自变量)和结果因素(因变量) 『参下例』

10 耕地按耕作深度分组(厘米) 地块数 平均收获率(千克/每亩) 例1: 结果因素 影响因素 10-12 12-14 14-16 16-18
18-20 7 10 16 12 5 200 230 270 310 340 结果因素 影响因素 上表反映了该农作物的收获率随耕作深度的加深而提高,显然存在着正依存关系。 在社会经济现象中,还有很多存在这种关系,如:收入-消费、人口的文化程度-生育率等等。

11 例2:

12 1.按民族分组 2.按年龄分组 3.按政治面貌分组 4.按性别分组(参前例) 则: 汉族12人,占60% 回族5人,占25%
满族3人,占15% 1.按民族分组 20岁5人,占25% 21岁5人,占25% 22岁2人,占10% 2.按年龄分组 中共党员8人,占40% 团员12人,占60% 3.按政治面貌分组 23岁8人,占40% 4.按性别分组(参前例)

13 三、统计分组的方法 (一)分组标志和分组界限 分组标志:将统计总体划分为若干个性质不同组的标准或根据。 选择分组标志的原则:
1、根据统计研究的具体任务和目的选择分组标志 2、在对被研究现现象进行理论分析的基础上,选择能够反映现象本质或主要特征的分组标志。 3、结合现象所处的具体历史条件或社会经济发展条件选择分组标志 分组界限:就是要在分组标志的变异范围内,划定各组邻组间的性质界限和数量界限。 如:研究工业企业规模大小时,可以按企业职工人数、占地面积、产品产量、生产能力等众多标志进行分组。在这种情况下,应该从研究对象的特点出发,抓住具有本质性的区别及反映现象内在联系的标志作为分组标志。

14 (二)统计分组分类 1.按民族分组 2.按年龄分组 汉族12人,占60% 回族5人,占25% 满族3人,占15% 20岁5人,占25%
1、按分组标志性质不同分为:品质标志分组、数量标志分组。 (1)品质标志分组:就是根据统计研究的目的选择反应事物性质、属性差异的品质标志作为分组标志,在品质标志变异范围内划定各组的界限,将总体划分为若干个性质不同的组别。 (2)数量标志分组:就是根据统计研究的目的选择反映事物数量差异数量标志作为分组标志,在数量标志变异范围内划定各组数量界限,将总体划分为若干个性质不同的组别。 [前例] 汉族12人,占60% 回族5人,占25% 满族3人,占15% 1.按民族分组 品质分组 22岁2人,占10% 20岁5人,占25% 21岁5人,占25% 2.按年龄分组 23岁8人,占40% 数量分组

15 按性别分组 男12人,占60% 女8人,占40% 按政治面貌分组 男12人 团员8人 按性别分组 中共党员4人 女8人 团员4人
2.按分组标志的多少划分:统计分组分为简单分组和复合分组。 简单分组是对研究的总体仅按一个标志进行的分组; 复合分组是对研究的同一总体选择两个或两个以上标志层叠起来进行的分组。 前例: 男12人,占60% 女8人,占40% 按性别分组 简单分组: 复合分组: 男12人 女8人 按性别分组 按政治面貌分组 团员4人 中共党员4人 团员8人

16 复合分组体系

17 第三节 分配数列 一、分配数列的概念 分配数列在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各单位在各组间的分布,称为次数(或频数)分布,又称分配数列。它包含两个要素:组别和次数。 次数(频数):分布在各组的单位数。 比率(频率):各组次数与总次数之比。

18 二、分配数列的种类 根据分组标志类型的不同,分布数列可分为品质数列和数量数列。 1.品质分配数列的含义和编制:
品质分配数列是按照品质标志进行分组所编制的分配数列(简称品质数列)。它由各组名称和次数组成。

19 2.数量分配数列 (1)概念:数量分配数列是按照数量标志进行分组所编制的分配数列(简称变量数列)。它也是由各组名称和次数组成。
(2)变量数列的种类:单项式数列和组距式数列。 单项式数列是指数列中每组的数值只用一个变量值表示,即一个变量值就代表一组。 (见例1)。 组距式数列是指数列中每一个组由两个变量值所确定的一个数值范围来表示。 (见例2)。

20 例1: 某班学生年龄情况表 按年龄分组(岁) 人数(人) 比重(%) 20 21 22 23 5 2 8 25 10 40 合计 100

21 例2:某班学生身高情况表 按身高分组(米) 人数(人) 比重(%) 1.4-1.5 1.5-1.6 1.6-1.7 1.7-1.8
1.8-1.9 4 6 2 20 30 10 合计 100 频数 频率 各组名称

22 3.与组距数列相关的概念 组数:即组的数目 组限:每组的两端数值,表示各组的数量界限。下限:最小变量值;上限:最大变量值。
闭口组:上限和下限都齐全的组。 开口组:只有上限或者下限的组 组距:即各组上限与下限之差。各组组距之和叫全距 组中值:即各组上限与下限的中点数值。 组中值=(上限值+下限值)/2 开口组计算组中值的方法:若遇到开口组,其组中值的确定是以相邻组的组距作为该组的组距确定的。 缺下限的开口组组中值=上限-邻组组距/2 缺上限的开口组组中值=下限+邻组组距/2

23 例子 南海公司员工月工资资料表 月工资( 元) 人数( 人) 比重(%) 1000 以下 22 2.8 1000 -2000 85 10.6
组中值=(上限+下限)/2 =3500 南海公司员工月工资资料表 月工资( 元) 人数( 人) 比重(%) 1000 以下 22 2.8 1000 -2000 85 10.6 2000 -3000 124 15.5 3000 -4000 306 38.3 4000 -5000 187 23.4 5000 -6000 51 6.4 6000 以上 25 3.1 合  计 800 100 组距1000 上限 下限 组限

24 二、组距数列的编制 1、先将变量值按一定顺序排列
原始资料的变量值一般是没有排列顺序的。编制变量数列,第一步就是将原始资料变量值按照一定的顺序排列起来。 2、确定变量数列的形式 要确定编制单项变量数列还是组距数列,主要取决于所研究变量的类型和变量的变动幅度。 3、确定组距和组数 组距的大小与组数的多少互为制约,成反比关系。对于组距和组数,原则上都应力求符合实际,能够反映总体分布的特点。 4、确定组限 当组距、组数确定之后,就需要具体确定各组的数量界限。 5、计算各组单位数,编制变量数列。

25 三、次数分布的主要类型 1.钟型分布 2.U型分布 3.J型分布

26 第四节 统计表 一、统计表的概念 1.广义: 用于统计工作各个阶段的任何反映统计资料的表格都是统计表,如用于调查阶段的调查表,用于统计整理阶段的整理表,用于统计分析阶段的分析表等。 2.狭义: 专指用于统计整理阶段的整理表,即是指把经过整理汇总的资料,按照一定的顺序集中而有条理地反映出来的一种表格。

27 二、统计表的构成 1、从形式上看,统计表是由总标题、横行标题、纵栏标题、指标数值和有关说明构成。
总标题是表的名称。横行标题是横行的名称。纵栏标题是纵栏的名称。指标数值列在各横行标题与各纵栏标题的交叉处。 2、从内容上看,统计表由主词栏和宾词栏构成。 主词是统计表所要说明的总体,或总体的各个组、各个单位的名称。宾词是指用以说明总体的各个指标。统计表的构成可以通过下表加以理解。

28 例 单位____ 总标题 纵栏标题 横 行 标 题 数据资料 (指标数值) 主词 宾词 2003年某月某公司各企业劳动生产率统计表 分组
总产值(万元) 职工人数(人) 劳动生产率 (元/人) P 1 2 3 大型 5000 2000 25000 中型 3000 1500 20000 小型 1000 10000 合计 9000 4500 纵栏标题 数据资料 (指标数值) 主词 宾词

29 三、统计表的种类 简单表:即主词不经过任何分组的统计表,仅仅列出总体各单位名称或是按时间顺序排列的统计表。(参教材中表3.8)
统计表按其主词的结构状况,即按照主词是否分组以及分组程度,可分为简单表、简单分组表和复合分组表。 简单表:即主词不经过任何分组的统计表,仅仅列出总体各单位名称或是按时间顺序排列的统计表。(参教材中表3.8) 简单分组表:即主词按某一个标志进行简单分组的统计表,也就是按简单分组形成的统计表。(参教材中表3.9) 复合分组表:即主词按两个或两个以上的标志进行复合分组的统计表。(参教材中表3.10)

30 四、编制统计表应注意的事项 1、统计表的各种标题应简明、确切地表达其内容。 2、主词各行和宾词各栏,一般按先局部后整体的原则排列。
3、如表中栏次较多,通常要加以编号。 4、数字应对准位数,填写整齐。 5、表中必须注明计量单位。 6、表式通常是左右开口。 7、必要时,应在表下方注明表中某些资料的来源或对某指标的计算方法、计算口径做出说明。

31 第五节 统计图 一、统计图的概念 二、统计图的种类
第五节 统计图 一、统计图的概念 统计图是用点、线、面积等来说明统计资料对比关系的几何图或象形图,是统计资料的基本形式之一。利用统计图反映社会经济现象数量方面的对比关系,具有直观、形象、具体、生动,使人一目了然的特点。 二、统计图的种类 常用的图形有:直方图、条形图、折线图、曲线图、饼图等。

32 直方图 用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布
在直角坐标系中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图

33 直方图的绘制 频 数 (天) 25 20 15 10 5 30 销售量(台) 某电脑公司销售量分布的直方图
我一眼就看出来了,销售量在170~180之间的天数最多! (天) 25 20 15 10 5 30 180 190 200 170 210 160 220 140 150 240 230 销售量(台) 某电脑公司销售量分布的直方图

34 条形图

35 直方图与条形图的区别 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的
直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列,条形图则是分开排列 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据

36 折线图 折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉
折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布一致

37 折线图的绘制 频 数 (天) 25 20 15 10 5 30 销售量(台) 某电脑公司销售量分布的折线图 140 150 160 170
180 190 200 210 220 230 240 销售量(台) 某电脑公司销售量分布的折线图

38 曲线图 主要用于显示时间数列数据,以反映事物发展变化的规律和趋势,时间一般绘在横轴上,数据绘在纵轴上。可通过Excel“插入”中的“图表”绘制。

39 饼图

40 结 束 THANKS


Download ppt "统计学原理 第三章 统计整理."

Similar presentations


Ads by Google