第 4 章 调查数据的整理与显示 2 第一节、定类数据的整理与显示 第二节、定序数据的整理与显示 第三节、定量数据的整理与显示.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
单项选择题 判断题 陈 琳.
第 3 章 数据的图表展示 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第三章 统计数据的概括性描述.
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
证券投资技术分析.
知识模块一 供求理论 主讲人:程春梅(博士、教授) 单 位:辽宁工业大学.
统计学原理 第三章 统计整理.
统计学原理(第三讲) 罗洪群.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第七单元 折线统计图 折线统计图(第1课时) 浙江省诸暨市暨阳小学 卢慧飞.
折线统计图(第1课时) 第七单元 折线统计图 兰州新区中川镇中川小学 魏红
折线统计图 张家产中心完小.
扇 形 统 计 图 吴兴区太湖小学 黄晓燕.
第 3 章 数据的整理与显示 PowerPoint 统计学.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
第六章 调查数据的整理 第一节 数据的预处理 第二节 统计分组和次数分布 第二节 统计表和统计图.
定积分的换元法 和分部积分法 换元公式 分部积分公式 小结 1/24.
2-7、函数的微分 教学要求 教学要点.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
                                                                                                                                                                
第三章 统计整理 第一节 统计整理概述 第二节 统计分组 第三节 频数分布 第四节 统计表和统计图.
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第 3 章 基本概念.
绘制圆与多边形 椭圆形 绘制椭圆形的方法是 drawOval(x ,y , width , height), 绘制实心椭圆形的方法是
第三章 社会统计资料的整理 主要内容 统计分组的原则与标准 统计表 变量数列的编制 统计图
第十章 方差分析.
数据挖掘工具性能比较.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
第2章 统计数据的描述(2) ——统计整理.
C语言程序设计 主讲教师:陆幼利.
相似三角形 石家庄市第十中学 刘静会 电话:
网页设计与制作 —— 学习情境二:网页模板设计
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
6.4 你有信心吗?.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
统计图表绘制 电子工业出版社.
可编辑图表汇总 修改方法: 点击图表内容→“设计”选项卡→编辑数据.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
静定结构位移计算 ——应用 主讲教师:戴萍.
分数再认识三 真假带分数的练习课.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
用样本估计总体.
滤波减速器的体积优化 仵凡 Advanced Design Group.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第十七讲 密码执行(1).
三角 三角 三角 函数 余弦函数的图象和性质.
1.4.1正弦函数、余弦函数的图象.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第 4 章 调查数据的整理与显示

2 第一节、定类数据的整理与显示 第二节、定序数据的整理与显示 第三节、定量数据的整理与显示

 在获得原始数据资料之后,需要使用一定的方法对 数据进行整理和综合,目的是从大量的原始数据资 料中提炼所需要的信息,使之可以提供概要信息并 能反映对象总体的基本数量特征,便于人们的理解 和使用。表格和图形是整理和反映调查资料的主要 工具。  重点:了数据整理的全过程,掌握分组方法及变量数列编制 的原则,灵活设计调查表和调查图。  难点:针对不同类型的数据进行图、表的设计,区分不同图、 表的应用。

调查数据的整理 要弄清所面对的数据类型,因为不同类型的数据, 所采取的处理方式和方法是不同的 对定类数据和定序数据主要是做分类整理 对定距数据和定比数据则主要是做分组整理 适合于低层次数据的整理和显示方法也适合于高层 次的数据;但适合于高层次数据的整理和显示方法并 不适合于低层次的数据

第一节、定类数据的整理与显示 11 。定类数据整理: 列列出各类别 计算各类别的频数 制作频数分布表 用 图形显示数据 频频数和频数分布 (( 1 )、频数 / 次数 Frequency :落在某特定类别(或组) 中的数据个数 (( 2 )、比例 Proportion :某一类别数据占全部数据的比 值 (( 3 )、百分比 Percentage :将对比的基数作为 100 而计 算的比值 (( 4 )、比率 Ratio :不同类别数值的比值 (( 5 )、频数分布 Frequency Distribution :把各个类 别及落在其中的相应频数全部列出,并用表格的形式表现出 来。

【例 1 】 为为研究广告市场的状况,一家广告公司在某城市随 机抽取 200 人就广告问题做了邮寄问卷调查,其中 的一个问题是 “ 您比较关心下列哪一类广告? ” 1 .商品广告; 2 .服务广告; 3 .金融广告; 4 .房地产广告; 5 .招生招聘广告; 6 .其他广告。

某城市居民关注广告类型的频数分布

2 、定类数据的图示 (( 1 )条形图( bar graph ) 条条形图是用宽度相同的条形的高度或长短来表示数据变动的 图形,在表示定类数据的分布时,是用条形图的高度来表示 各类别数据的频数或频率 绘绘制时,各类别可以放在纵轴,称为条形图,也可以放在横 轴,称为柱形图。

( 2 )圆形图 (pie chart) 也也称饼图,是用圆形及园内扇形的面积来表示数值 大小的图形。主要用于表示总体中各组成部分所占 的比例,对于研究结构性问题十分有用。 例例如,关注服务广告的人数占总人数的百分比为 25.5%

例:某商店顾客购买计算机频数分布表 公司频数比重( % ) 苹果 1326 康柏 1224 贝尔 510 盖特威 918 IBM1122 合计 50100

50 次购买计算机的频数分布条形图

购买饮料品牌 【例】一家市场调查 公司为研究不同品牌 饮料的市场占有率, 对随机抽取的一家超 市进行了调查。调查 员在某天对 50 名顾客 购买饮料的品牌进行 了记录,如果一个顾 客购买某一品牌的饮 料,就将这一饮料的 品牌名字记录一次 。 右边就是记录的原始 数据 绿色健康饮品

购买饮料品牌条形图

购买饮料品牌饼图

第二节 定序数据的整理与显示 11 、定序数据的整理 ( 1 )相关概念(可计算的指标): ①①、累计频数 cumulative frequencies :各类别的频数逐 级累加得到的频数。 ②②、累计频率 cumulative percentages :将各类别的频率 ( 百分比 ) 逐级累加。 (( 2 )编制累计频数分布表 【【例 3.2 】在一项城市住房问题的研究中,研究人员在甲乙 两个城市各抽样调查 300 户,其中的一个问题是: “ 您对您家庭 目前的住房状况是否满意? 非非常不满意; 2 .不满意; 3 .一般; 4 .满意; 5 .非常满 意

甲城市家庭对住房状况评价的频数分布

2 、定类数据的图示 — 环形图 环环形图中间有一个 “ 空洞 ” ,总体中的每一部分数据 用环中的一段表示 环环形图与圆形图的区别: ①①、圆形图只能显示一个总体中各部分所占的比例 ②②、环形图则可以同时绘制多个总体的数据系列, 每一个总体的数据系列为一个环 ③③、环形图可用于进行比较研究 ④④、环形图可用于展示定类和定序的数据

甲乙两城市住房状况评价 图 3-4 甲乙两城市家庭对住房状况的评价 8% 36% 31% 15% 7% 33% 26% 21% 13% 10%

第三节、数值型数据的整理与显示 11 、分组方法: (( 1 )单变量值分组  ①、适合于离散变量;  ②、适合于变量值较少的情况。 (( 2 )组距分组(等距分组和异距分组)  ①、将变量值的一个区间作为一组;  ②、适合于连续变量;  ③、适合于变量值较多的情况;  ④、必须遵循 “ 不重不漏 ” 的原则;  ⑤、可采用等距分组,也可采用不等距分组 。

等距分组与异距分组 等等距分组:标志值在各组保持相等的组距,即各组 的标志值变动都限于相同的范围。一般用于标志值 变动比较均匀的场合。 异异距分组:各组的组距不相等。

单变量值分组  —— 以某一变量值分组(单项数列) 。  适用于取值不多的离散型变量。 例例:某企业职工家庭人口分组调查表

简单分组和复合分组 按按分组标志的多少,可分为简单分组和复合分组。 简简单分组:就是对研究现象按一个标志进行分组。 复复合分组:用两个或两个以上标志分组,即先按一 个标志分组,在此基础上再按第二个标志分小组, 又再层叠地按第三个标志分成更小的组,这称为复 合分组。 ( 多个变量值)

例: 2002 年 1 月比特啤酒公司  6 6 0 个销售点的啤酒销售量 ( 单位:桶 )

比特公司啤酒销售量的分组调查 分组调查整理后, 将杂乱无章的 60 个原始数据 压缩到 8 组,清晰地反映了更多的有用信息。

比 特公司啤酒销售量的分布特征 图 1.1 比特公司啤酒销售量的频数分布

我国电视观众调查

按品质标志分组的频数分布表 例例:某企业职工人数调查表

异距分组 ——— 每组包含某一区间内的变量值。 适适用于连续型变量和取值很多的离散型变量。 组组距数列是最重要的频数分布表。  例:某企业职工工资的分组调查

组距数列中的几个基本概念 ①①、下限:一个组的最小值 ②②、上限:一个组的最大值 ③③、组距:上限与下限之差 ④④、组中值:下限与上限之间的中点值 组组中值 = (上限值 + 下限值) /2 下下限开口组组中值 = 上限值 - 邻组组中值 /2 上上限开口组组中值 = 下限值 + 邻组组中值 /2

组距数列中的几个基本概念 在在编制组距数列时,需要解决如何分组、分组 数量、组距、组限等问题。 重重叠组限 —— 相邻组的上下限重合。 适适用于连续型变量。但各组上、下限中有一个 不包含再内。通常按 “ 上限不在内 ” 处理,即组区 间是 [ a, b ) 的形式。 l不l不重叠组限 —— 相邻组的上下限不重合。 l适l适用于离散型变量。

离散型变量的分组(不重叠组限) 比特公司啤酒销售量的分组调查

连续型变量的分组 ( 重叠组限: 上限不在内 ) 某企业职工工资的分组调查

例: 按雇工人数分组的私营企业规模调查

有有些现象中各类型的数值差异很大,其标志值呈几 何级数变化,则组距就应按几何级数确定。 例例:某市零售商店年营业额分组调查

分组数量和组距的确定 分分组的数量和组距应根据对象的特点和分析的需要决定。 第第一,确定组数。斯特格斯 (Sturges) 经验公式: k= lgN 第第二,确定组距。组距 = (最大值 - 最小值) / 组数 第第三,确定组限。 一一个组的最小值叫下限 一一个组的最大值叫上限 分分组过多则难以反映总体的数量分布特征; 分分组过少则会丢失许多重要的调查信息。

(3) 使用 SPSS 制作频数分布表 利利用 Analyze==>Descriptive Statistics==> FREQUENCY 功功能:返回各组的频数。

调调查图可以形象、直观、生动、简洁地显示数据的 特征。 常常用的调查图有以下几种: l1l1. 折线图 l—l—— 通常用来描述时间序列数据,用以表示某些指 标的变化趋势。 l制l制作折线图时应正确选择坐标轴轴的刻度。对同样 的调查资料,延伸或压缩某一坐标轴可能传达不同 的甚至是误导的印象。 调查图

图 1.2 失业人数调查图 过分压缩了 Y 轴

图 1.3 失业人数调查图 过分压缩了 X 轴

图 1.4 各类进口商品的变化情况 柱形图示例

圆饼图 ——— 用来表示总体各部分在总体中所占的结构比率。 已婚 孤寡或离婚 单身 已婚 孤寡或离婚 单身 图 1.6 某企业员工的婚姻状况

经济管理中几种常见的频数分布曲线 l①l①正态分布曲线 l—l—— 这是客观事物数量特征上表现得最为普遍的一 类频数分布曲线。 l如l如人的身高、体重、智商,钢的含碳量、抗拉强度, 某种农作物的产量等等。 图 1.7 正态分布曲线

偏态曲线 图 1.8 偏态曲线 右偏(正偏) 左偏(负偏) 例如收入和财富的频数分配曲线就是右偏的,大量财富都 集中在极少数富豪手中,而多数人则是低收入者。 此外,在产品质量管理中也普遍存在这种现象,如多数次 品都集中出在少数工人手中;次品也大都出在少数几道工序 上。这就要求在管理和控制上需要突出重点、抓住关键因素。 —— 按其长尾拖向哪一方又可分为右偏 ( 正偏 ) 和 左偏 ( 负偏 ) 两类。

J 形曲线 其其典型的应用分别是经济学中的供给曲线和需求曲线。 供供给曲线 ( 正 J 形 ) 表现为随着价格的增加,供给量以 更快的速度增加; 需需求曲线 ( 倒 J 形 ) 表现为随着价格的增加,需求量以 更快的速度减少。 供供给和需求曲线的交点即供求平衡点。 正 J 形 倒 J 形 图 1.9 J 形曲线

U 形曲线 人人和动物的的死亡率、设备的故障率等通常都服 从于 U 形曲线分布。 图 1.10 U 形曲线 —— 又称生命曲线或浴盆曲线

习题 1. 调查数据分为哪几种类型?各有何特点? 2. 简述调查数据的分组的方法。

内容 定类数据的整理与显示 1 定序数据的整理与显示 2 定量数据的整理与显示 3