第 3 章 统计整理 统计学
【学习目标】 1. 理解统计整理的作用、原则及分类; 2. 掌握分配数列的分类及其编制方法; 3. 掌握统计图表的绘制方法。 第3章第3章
3.1 统计整理 统计整理的概念 统计整理是指根据特定的统计研究目的与要求, 对统计调查所搜集到的个体的原始数据进行分组、汇 总,或对原始数据进行再分组或汇总,使之条理化、 系统化的工作过程 统计整理的原则 去伪存真;去粗取精;科学分类;浓缩简化 第3章第3章
3.1.3 统计整理的步骤 1. 设计统计整理方案 2. 审核统计数据 3. 分组和汇总统计数据 4. 编制统计图表 5. 保管统计数据 第3章第3章
3.2 统计分组 统计分组的概念 统计分组是指根据统计研究的目的和现象的本质特 征,将统计总体按照一个或几个标志进行划分,形成 若干性质不同的部分或组的科学分类方法。 统计分组的作用 1. 划分社会经济现象的类型 2. 反映社会经济现象的内部结构 3. 揭示社会经济现象的依存关系 第3章第3章
3.2.3 统计分组的原则 1. 根据研究目的选择分组标志 2. 根据现象本质选择分组标志 3. 根据所处条件选择分组标志 统计分组的种类 按标志表现分组 1. 品质标志分组 2. 数量标志分组 第3章第3章
按标志数量分组 1. 简单分组 2. 复杂分组 3. 体系分组 第3章第3章
3.3 分配数列 分配数列的含义 是指在统计分组的基础上,把总体的所有单位按 组归类并按一定的顺序排列起来,形成总体各单位在各 组间的分布,称为分配数列,也称次数分布数列。各组 的单位数称为次数或频数,各组次数与总次数之比称为 比重或频率。 分配数列的种类 品质数列 按品质标志分组所形成的分配数列 第3章第3章
例: 2006 年我国财政支出情况表 支出类别支出金额 ( 亿元 ) 比重(%) 经济建设费 社会文教费 国防费 行政管理费 其他支出 合计 第3章第3章
变量数列 是指按数量标志分组所形成的分配数列。 反映总体各单位在某一数量标志方面的分布 情况及总体内部的构成情况。根据数量标志 的分组类型,变量数列又可分为单项式数列 和组距式数列。 1. 单项式数列 是指单项式分组形成的变量数列,其中每 一个变量值代表一组。 第3章第3章
跳槽次数(次)频数(人) 合计 100 例:某人才市场 100 名求职者跳槽次数情况表 第3章第3章
2. 组距式数列 是指按组距式分组形成的变量数列,其中变量 值的一定范围代表一组 。 例:某企业 100 名职工月工资构成表(等距数列 ) 月工资(元 / 月)频数(人)比重(%) 1000 以下 ~ ~ ~ ~ 以上 55 合计 100 第3章第3章
例:某地区 50 家中小企业利润构成表 (单位:万元) (异距数列 ) 职工人数频数(个)比重(%) 10 以下 ~ ~ ~ 以上 510 合 计 第3章第3章
3.3.3 分配数列的编制 相关术语和步骤 1. 全距 2. 组数 斯特吉斯经验公式: 3. 组距 4. 组限 ( 1 )最小组的下限要小于或等于最小变量值,最大 组的上限要大于最大变量值。 ( 2 )对于连续型变量,要求相邻组的上下限必需 重合,即本组下限为相邻下一组的上限,且遵循 “ 上 限不在组内 ” 的原则。 第3章第3章
5. 组中值 闭口组: 下开口组: 上开口组: 第3章第3章
分配数列编制 例: 50 名面试人员按问题回答正确数分组 问题回答正确数(个)频数(人)比重(%) 60 ~ ~ ~ ~ ~ ~ ~ ~ ~ 合计 第3章第3章
累计分配数列的编制 1. 向上累计 由变量值小的组向变量值大的组逐组累计, 说明各组上限以下所包含的总体单位数或比重 。 2. 向下累计 由变量值大的组向变量值小的组逐组累计, 说明各组下限或下限以上所包含的总体单位数 或比重。 第3章第3章
3.4 统计图表 统计图 直方图 直方图也叫柱状图,是由一系列高度不等的纵向 条纹表示数据的分布状态。以分配数列中的次数( 或比重)作为纵坐标,以变量值作为横坐标绘制而 成。一般用来表示变量型数据的分布特征。 第3章第3章
~ 7070 ~ 8080 ~ 9090 ~ ~ ~ ~ ~ ~ 150 第3章第3章
条形图 是由一组宽度固定但长度不一的长方形图形来 表示各组的次数或频率的图形方法。一般用来表示 品质型数据的分布特征。 例: 饮料名称购买次数 可口可乐 20 百事可乐 13 健怡可乐 8 雪 碧 4 芬 达 5 第3章第3章
第3章第3章
曲线图 当变量数据较多或分组较多时,直方图或 条形图不能清晰地反映数据的分布特征,把直 方图的各长方形顶端的中点用折线连接起来, 构成折线图,由于数据分组较多,因此,呈现 出一条比较圆滑的曲线,即构成曲线图 。 b) 左偏分布 a) 对称分布 第3章第3章
c ) 右偏分布 d) 正 J 分布 e) 反 J 分布 f) U 型分布 第3章第3章
散点图 例:某音像店 10 周广告投放次数与销售额之间的 关系如下表: 周次 广告次数 X 销售额 Y (百美元) 第3章第3章
某音像店广告次数与销售额的关系 广告投放次数 X 销售额 Y 第3章第3章
茎叶图 例:某心理学家发明了一种测试成年人智力的 新方法。对 20 人测试,得到如下数据。 第3章第3章
第3章第3章
箱线图 箱线图( Boxplot )也称箱须图( Box-whisker Plot ),是由变量的五个特征值绘制而成的图形,由一个 箱子和两条线段构成。其中五个特征值分别为:最小值、 下四分位数、中位数、上四分位数与最大值 。 例:某车间为了提高生产效率,决定对 10 名工人的操作方法 进行改良,改良前后产量数据如下表所示,试绘制箱线图 分析操作方法改良对生产效率的影响。 (单位:件 ) 工人 序号 改良前 改良后 第3章第3章
图 3 - 7 改良前后箱线图 改良前 改良后 产量 P25 P100 P0 P50 P75 第3章第3章
饼形图 可口可乐 20,40% 百事可乐 13,26% 健怡可乐 8,16% 雪碧 4, 8% 芬达 5, 10% 图 3 - 8 50 次软饮料购买数据饼图 第3章第3章
3.4.2 统计表 统计调查所得来的原始资料,经过整理,得 到说明社会现象及其发展过程的数据,把这些数据 按一定的顺序排列在表格中,就形成统计表。 统计表是由纵横交叉的线条所绘制而成的表 格,是表现统计资料的一种形式。 1. 统计图的作用 ( 1 )统计数据条理化、系统化 ( 2 )用数量说明研究对象之间的相互关系。 ( 3 )用数量把研究对象之间的变化规律显著地表示 出来。 第3章第3章
2. 统计图的构成 纵栏标题 横行标题指标数值 ( 1 )从结构看:总标题、横行标题、 纵栏标题、指标数值 总标题 ( 2 )从内容看:总标题、主词栏、宾词栏、指标数值 总标题 宾词栏 主词栏指标数值 第3章第3章
3 .统计表的分类 ( 1 )简单表:主词未经任何分组的统计表。如下表: 2008 年中国对主要国家和地区货物进出口额 (单位:亿美元) 国家和地区货物出口额货物进口额 欧盟 美国 中国香港 日本 东盟 韩国 俄罗斯 印度 中国台湾 第3章第3章
( 2 )分组表:主词只按一个标志进行分组的统计表。如 下表: 2008 年我国 GDP 总值构成情况 (单位:亿元) 按产业分类增加值比上年增长(%) 第一产业 .55.5 第二产业 .39.3 第三产业 .59.5 第3章第3章
( 3 )复合表:主词按两个或两个以上标志进行分组 的统计表。如下表: 2008 年全部金融机构本外币存贷款及其增长速度 资金构成年末数(亿元)比上年增长(%) 各项存款余额 . 3 其中:企业存款 . 5 城乡居民储蓄存款 . 7 其中:人民币 . 3 各项贷款余额 . 9 其中:短期贷款 . 3 中长期贷款 . 2 第3章第3章
【本章小结】 统计整理是统计调查的延续,是统计分析的前 提和基础。在统计分组的基础上,我们可以编制分 配数列,来描述现象的分布特征。 统计图能够直观、生动、形象地表示统计数据 的分布特征,例如条形图、饼图、直方图、折线图、 曲线图、茎叶图、箱线图、雷达图等都能较好地说 明统计数据的分布特征,并且在 Excel 里面能基本 完成。 统计表是表示统计数据分布特征的一种重要的 形式。 第3章第3章
【学习建议】 在本章的学习过程中,要注意把握统计整理的 步骤、统计分组的概念及作用,注意分组标志的 选择和组限、组距及组数的确定原则,熟练进行 变量数列的编制。重点把握次数分布表的绘制, 并能够通过次数分布表绘制相应的统计图和统计 表,使零散紊乱的资料条理化和系统化。 第3章第3章
1. 本章重点 统计分组;变量数列的编制;统计图和统计表的绘制。 2. 本章难点 统计分组;变量数列的编制;次数分布表的绘制。 第3章第3章