应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.

Slides:



Advertisements
Similar presentations
第 4 章 调查数据的整理与显示 2 第一节、定类数据的整理与显示 第二节、定序数据的整理与显示 第三节、定量数据的整理与显示.
Advertisements

全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
单项选择题 判断题 陈 琳.
第九章 金融资本 第一节 借贷资本和利息 第二节 货币需求与供给 第三节 股份资本 第四节 保险业资本 第五节 金融衍生产品.
证券投资技术分析.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第七单元 折线统计图 折线统计图(第1课时) 浙江省诸暨市暨阳小学 卢慧飞.
折线统计图(第1课时) 第七单元 折线统计图 兰州新区中川镇中川小学 魏红
折线统计图 张家产中心完小.
实用操作系统概念 张惠娟 副教授 1.
《高等数学》(理学) 常数项级数的概念 袁安锋
UI(用户界面)集训班 Illustrator 高级班.
常用逻辑用语复习课 李娟.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
                                                                                                                                                                
统 计 学 Statistics.
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
如何使用CiteSpace分析Derwent专利数据
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
数 控 技 术 华中科技大学机械科学与工程学院.
数学模型实验课(三) 插值与三维图形.
第十章 方差分析.
数据挖掘工具性能比较.
整合思维导图的初中英语教学设计 主讲人:卢璐.
第3章 信息与信息系统 陈恭和.
2.1.2 空间中直线与直线 之间的位置关系.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
C语言程序设计 主讲教师:陆幼利.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
第四章 四边形性质探索 第五节 梯形(第二课时)
模型分类问题 Presented by 刘婷婷 苏琬琳.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
VisComposer 2019/4/17.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
用计算器开方.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
更新教学理念,提高教学有效性 感城中心学校 陈利平.
6.4 你有信心吗?.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
统计图表绘制 电子工业出版社.
可编辑图表汇总 修改方法: 点击图表内容→“设计”选项卡→编辑数据.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
三角 三角 三角 函数 余弦函数的图象和性质.
学习目标 1、什么是列类型 2、列类型之数值类型.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授

以Excel 和SPSS为工具的管理统计 主要参考书: 1.马庆国.管理统计-数据获取、统计原理SPSS工具与应用研究。北京:科学出版社,2003 2.张建同、孙昌言、王世进.应用统计学.北京:清华大学出版社,2010,3 3.何晓群.多元统计分析.北京:中国人民大学出版社,2004 4.戴维 M.莱文、戴维 F.斯蒂芬等 (张建同、刘文驰等译)以Excel为决策工具的商务统计.北京:机械工业出版社,2009年5月

典型的统计软件 几种常用的统计软件 (Software) SAS SPSS MINITAB STATISTICA Excel SAS 应用统计第1章 几种常用的统计软件 (Software) 典型的统计软件 SAS SPSS MINITAB STATISTICA Excel MINITAB STATISTICA Excel SAS SPSS

第一章 统计数据的收集与整理 本章教学目标: 了解统计学的基本知识; 统计数据的收集、调查; 掌握利用统计图表整理和表示统计数据的基本方法; 应用统计第1章 第一章 统计数据的收集与整理 本章教学目标: 了解统计学的基本知识; 统计数据的收集、调查; 掌握利用统计图表整理和表示统计数据的基本方法; 掌握利用 Office 软件绘制各种统计图表、计算各种统计综合指标。

本章主要内容 §1.1 统计学概述 §1.2 统计数据的收集 §1.3 问卷设计 §1.4 统计表和统计图

§1.1 什么是统计学?  统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识 应用统计第1章 §1.1 什么是统计学?  统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识 :1, 1, 3 1. 数据搜集:例如,调查与试验 2. 数据整理:例如,分组 3. 数据展示:例如, 图和表 数据分析:例如,回归分析

Statistics的定义 (不列颠百科全书) 应用统计第1章 Statistics的定义 (不列颠百科全书) Statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列颠百科全书) :1, 1, 3

统计数据的内在规律 (一些例子) 正常条件下新生婴儿的性别比为107:100 应用统计第1章 统计数据的内在规律 (一些例子) 正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 农作物的产量与施肥量之间存在相关关系 :1, 1, 3

统计学的应用领域 统计学 经济学 管理学 医学 工程学 社会学 …

基于统计学的数据转换应用

应用统计的领域 actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)

应用统计的领域(续) hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)

二、统计研究对象的特点 1.数量性 2.总体性 3.具体性 4.差异性 统计学研究的对象是客观现象的数量特征和规律性。 统计学研究的是客观现象总体的数量特征与规律性,而不是个体的量。 3.具体性 统计的对象是一定时间、地点、条件下事物的量,而不是抽象对象的量,这是统计学和数学的一个重要区别。 4.差异性 组成统计研究对象总体的个体是有差异的,否则就不需要进行统计分析。统计研究中需要对总体中大量的个体进行观察并进行综合分析,由此才能获得总体的数量分布特征。

三、统计学的分类 统计学大致有以下两种主要的分类方法。 1.描述统计学和推断统计学 这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。 描述统计学 是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。 在二十世纪之前统计学基本上处于描述阶段。描述统计学是统计学的基础。 推断统计学 是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。 推断统计学是近代统计学的核心,也是统计学中的主要内容。

应用统计第1章 统计学的分科 统计学的分科 描述统计 推断统计 理论统计 应用统计

(包括分布理论、大数定律和中心极限定理等) (利用样本信息和概率论对总体的数量特征进行估计和检验等) 应用统计第1章 描述统计与推断统计的关系 概率论 (包括分布理论、大数定律和中心极限定理等) 推断统计 (利用样本信息和概率论对总体的数量特征进行估计和检验等) 样本数据 反映客观现象的数据 描述统计 (统计数据的搜集、整理、显示和分析等) 总体数据 总体内在的数量规律性 统计学探索现象数量规律性的过程

2.理论统计学和应用统计学 理论统计学 是研究统计学的数学原理,它基于概率论的原理,还包括不属于传统概率论的一些内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。 在统计实践中经常会遇到一些原有的统计方法不能适应的新问题,需要创造新的统计模型和统计分析方法,这就需要统计理论的研究与指导。 应用统计学 将统计学的基本原理应用于各个领域就形成各种应用统计学的分支。它包括适用于各个领域的一般性的统计方法,如参数估计、假设检验、方差分析、回归分析等,还包括在某一领域中特定的分析方法,如经济统计中的时间数列分析和指数分析等。 应用统计学侧重于阐明统计学的基本原理,并将理论统计学的成果作为工具应用于各个领域。

统计基本术语 变量:事物的特征,是运用统计方法所分析的对象。例如,在商业模型中,销售额、每年的开支和每年的净利润都是企业想要分析的变量。 数据 :是与变量相关的值。变量可能随时间变动,如某一公司的期望销售额、开支和净利润每年都有所不同。这些不同的值就是与变量相关的数据,或者简单地说,就是统计所要分析的“数据”。 注意:变量需赋予可操作定义 ,否则会产生歧义。如:对销售额的操作性定义可能会发生这样错误的理解:一个人认为年销售额是指全部连锁店的年销售额,而另一个人则认为是每家店的年销售额。

统计基本术语 总体:所研究对象的全体。 个体:指总体中的每个元素或单元。总体依其所包含的个体总数分为有限总体和无限总体。 样本:从总体中挑选出来用于分析的一部分。这种挑选通常是相对独立的。样本是进行推断统计的依据。 参数:参数是描述总体特征的数值。 统计量:是描述样本特征的数值

§1.2 数据的计量与类型 统计学中将变量分为分类变量或数值变量。 分类变量(也称为定性变量)的值只能按类别分开。 §1.2 数据的计量与类型 统计学中将变量分为分类变量或数值变量。 分类变量(也称为定性变量)的值只能按类别分开。 数值变量(也称为定量变量)的值表示数量。数值变量可进一步分为离散变量和连续变量。

§1.2 数据的计量与类型 四种计量尺度 数据的计量尺度 定类尺度 定序尺度 定距尺度 定比尺度

定类尺度 (概念要点) 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 应用统计第1章 定类尺度 (概念要点) 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有=或的数学特性

定序尺度 (概念要点) 对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 应用统计第1章 定序尺度 (概念要点) 对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有>或<的数学特性

定距尺度 (概念要点) 1. 对事物的准确测度 2. 比定序尺度精确 3. 数据表现为“数值” 4. 没有绝对零点 应用统计第1章 定距尺度 (概念要点) 1. 对事物的准确测度 2. 比定序尺度精确 3. 数据表现为“数值” 4. 没有绝对零点 5. 具有 + 或 - 的数学特性

定比尺度 (概念要点) 1. 对事物的准确测度 2. 与定距尺度处于同一层次 3. 数据表现为“数值” 4. 有绝对零点 应用统计第1章 定比尺度 (概念要点) 1. 对事物的准确测度 2. 与定距尺度处于同一层次 3. 数据表现为“数值” 4. 有绝对零点 5. 具有  或  的数学特性

四种计量尺度的比较 “√”表示该尺度所具有的特性 四种计量尺度的比较 √ 定类尺度 定序尺度 定距尺度 定比尺度 应用统计第1章 四种计量尺度的比较 四种计量尺度的比较 定类尺度 定序尺度 定距尺度 定比尺度 分类(=,≠ ) 排序( < ,> ) 间距( + ,- ) 比值( × ,÷) √ 计量尺度 数学特性 “√”表示该尺度所具有的特性

应用统计第1章 数据类型与统计方法 数据类型与统计方法 定类数据 定序数据 定距数据 定比数据 品质数据 数量数据

§1.3 统计数据的收集 数据是统计分析的基础,社会经济统计中所需要的数据与资料主要来源于统计调查。 一.数据采集的基本要求 1.准确性 §1.3 统计数据的收集 数据是统计分析的基础,社会经济统计中所需要的数据与资料主要来源于统计调查。 一.数据采集的基本要求 1.准确性 2.及时性 3.完整性 4.系统性 指统计调查的数据资料应配套,要能从不同侧面反映所研究总体的特征,才能为科学的判断和决策提供依据。

二.普遍调查 普遍调查简称普查,是专门组织的一次性的全面调查 。如全国的人口普查、能源普查、工业普查等。 组织方式有两种: 1.建立专门的普查机构 2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。 普查时注意的原则: 规定统一的标准时点 规定统一的普查期限 规定普查的项目和指标。

普遍调查实例 【例1.1】 2002年在国务院统一部署下,开展全国“基本单位普查”。关于这次普查的部分重要要求与规定如下: 【例1.1】 2002年在国务院统一部署下,开展全国“基本单位普查”。关于这次普查的部分重要要求与规定如下: 调查目的:统计分析全国和各省市地区的单位总数、性质、隶属关系、分布情况等。 标准时间:2001年12月31日。 调查对象:各类法人单位,各类法人单位所属的产业活动单位。 调查项目:单位总数; 性质分类(企业法人、事业法人、社团法人、机关法人、其他法人); 基本情况—— 性质划分、隶属关系(中央、省市、区县、街道等); 主要构成(产业结构、行业分布、地区分布、经济成分、规模结构); 分布情况。

三.重点调查 ——在总体中选择部分重点单位进行调查,以了解总体基本情况的一种非全面调查。 重点调查的特点: (1) 重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。 (2) 重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。 (3) 重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。

四.典型调查 ——也是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入细致的调查。 典型调查的作用和目的 (1) 研究新事物或某种倾向性的社会问题 通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物发展变化的趋势,形成科学的预见。 (2) 分析事物的不同类型 通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转化和发展。

五.典型调查(续) (3)典型调查可用来研究事务的变化规律。 (4)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。

六.抽样调查 ——是指按随机原则从总体中抽取部分单位组成样本。目的是利用样本数据推断(估计)总体的数量分布特征。 抽样调查是现代推断统计的核心,也是最重要的统计调查方法。

抽样调查中四种误差 涵盖误差 :当某一组代表性的样本被排除在抽样调查之外时所引起的选择偏差。 无回应误差 :抽样时,对样本个体数据收集失败会导致无回应偏差。 抽样误差:选择抽样调查是因为这种方法简单、低成本和有效。但同时也意味着有的个体被抽中,有的个体没有被抽中。 测量误差:测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。 课堂讨论:举例说明这几种误差。

七.网上调查 截至2009年6月底,中国网民规模达到3.38亿人,较2008年底增长13.4%,上网普及率达到25.5%。网民规模持续扩大,互联网普及率平稳上升。其中宽带网民数达到3.2亿,占比高达94.3%,较2008年底上升了3.7个百分点。另外,截至2009年6月底,作为国家域名,CN域名总计达到1,296万个。作为我国互联网的重要基础资源,CN域名已经广泛地应用在金融、汽车等各个行业中。截止2009年6月我国互联网用户发展情况如图1.2所示。

(资料来源:第23次中国互联网络发展状况统计报告) 图1-2 2008-2009年我国互联网用户发展情况 (资料来源:第23次中国互联网络发展状况统计报告)

网上调查优势 及时性和共享性 便捷性和低成本 可靠性和客观性 更好的接触性 穿越时空性

§1.4 问卷设计 问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。 1.合理性 合理性指的是问卷必须紧密与调查主题相关。 2.一般性 即问题的设置是否具有普遍意义。 3. 逻辑性 问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。 4. 明确性 所谓明确性,事实上是问题设置的规范性。 5.非诱导性 非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。

§1.4统计表和统计图 在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。

一、分类数据的图表 1、频数分布表 频数分布表列出了一系列分类数据的频率、总数或百分比,可以看出不同类别数据间的区别。 表2-1 1 000美元用途的频数分布表 用钱做什么 百分比/% 购买奢侈品、旅游或礼物 20 向慈善机构捐款 2 还贷 24 储蓄 31 购买必需品 16 其他 7

一、分类数据的图表 2、条形图

一、分类数据的图表 3、圆饼图

一、分类数据的图表 4、 帕累托图 在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下剩余的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”

二、数值数据的图表 例:某公司汽车销售量 (单位:辆)

1、频数分布表 分组统计整理后, 将杂乱无章的 60 个原始数据压缩到8组,清晰地反映了更多的有用信息。

制作频数分布表的注意事项 分组的数量 实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。 如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通常应在5~15 之间。在绘制直方图时可以参照下表: 样本容量 n 参考分组数 20~50 5~6 51~100 7~8 101~200 8~9 201~500 9~10 501~1000 10~11 1000以上 11~20

制作频数分布表的注意事项 2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。采用哪种分组方法应根据数据的分布特点而定。通常,当数据在一定范围内基本呈对称分布时,宜采用等距分组;而当数据的分布状态极度偏斜时,则宜采用不等距分组。

例: 按雇工人数分组的私营企业规模统计

制作频数分布表的注意事项 3)组限:组限也即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。 重叠和组限不重叠组限 重叠组限——相邻组的上下限重合。 适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是 [a, b)的形式。 注意:Excel在制作频数分布表时采用的是“上限在内”的规则。 不重叠组限——相邻组的上下限不重合。 适用于离散型变量。

例:离散型变量的分组(不重叠组限) 某公司某月汽车销售量的频数分布表

例:连续型变量的分组(上限不在内) 某企业职工工资的分组统计

制作频数分布表的注意事项 4) 组中值 组中值是各组的代表值,在计算分组数据的许多统计指标时要用到。通常取该组上限和下限的平均值为组中值。如表2-7所示,10~19的组中值是14.5,20~29的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。

使用 Excel 制作频数分布表 ①利用 Excel 的 FREQUENCY 函数 语法规则: 接收区间——各组上限值组成的一列区域 功能:返回各组的频数。 ②使用【工具】→“数据分析”→“直方图”功能

二、 统计图 统计图可以形象、直观、生动、简洁地显示数据的特征。 常用的统计图有以下几种: 1.折线图 二、 统计图 统计图可以形象、直观、生动、简洁地显示数据的特征。 常用的统计图有以下几种: 1.折线图 ——通常用来描述时间序列数据,用以表示某些指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。

过分压缩了Y轴 图1.2 失业人数统计图

过分压缩了X轴 图1.3 失业人数统计图

2.柱形图、条形图和直方图 柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。 (1)柱形图 ——主要用于表示时间序列数据。

柱形图示例 图1.4 各类进口商品的变化情况

(2)直方图——用以表示数据的频数分布规律。 图1.5 比特公司啤酒销售量的频数分布

未分组数据的茎叶图 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 对于n(20≤n≤300)个数据,茎叶图最大行数不超过 L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别 直方图可大体上看出一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息

未分组数据—茎叶图 (茎叶图的制作) 树茎 树叶 数据个数 10 11 12 13 788 3 13 24 10 022347778889 0012222333344466777889 0133445799 茎叶图类似横置的直方图 图 某车间工人日加工零件数的茎叶图

4.曲线图 ——用于描述连续型变量的分布特征。 ⑴ Office 中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标签下选“平滑线”复选框,就将折线图转换为曲线图。

Cumulative Distribution 累积分布 累积分布表示的是小于或等于每一组上限的项目数 累积相对频数分布表示的是小于或等于每一组上限的项目比例 累积百分数分布表示的是小于或等于每一组上限的项目的百分数

穹形图是一种累积频数分布或累积相对频数分布的图形 数据值列示在横轴上 纵轴为累积频数或相对累积频数 Ogive 穹形图 穹形图是一种累积频数分布或累积相对频数分布的图形 数据值列示在横轴上 纵轴为累积频数或相对累积频数

Example:比特啤酒公司销售量

——这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。 ⑵经济管理中几种常见的频数分布曲线 ①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。 图1.7 正态分布曲线

——按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。 ②偏态曲线 ——按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。 右偏(正偏) 左偏(负偏) 图1.8 偏态曲线 例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。 此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。

③ J 形曲线 其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更快的速度增加; 供给和需求曲线的交点即供求平衡点。

人和动物的的死亡率、设备的故障率等通常都服从于 U 形曲线分布。 ——又称生命曲线或浴盆曲线 图1.10 U形曲线 人和动物的的死亡率、设备的故障率等通常都服从于 U 形曲线分布。

5.对数图 人们经常对时间序列变量的相对变化率而不是绝对数值的变化感兴趣,如各种经济变量的环比发展速度。此时若要用统计图直观反映增长率等现象的变动趋势,就需要使用对数图。 对数图是以时间为横轴,以10为底的对数比率刻度为纵轴的折线图。可以通过对数图中各线段的斜率比较各时期增长率的大小。考虑以下统计数据:

对数图可以直观反映时间序列的环比变化趋势 图1.14 可以在Office图表类型中选择自定义类型中的“对数图”,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度”设为“对数刻度”来绘制对数图。

例:某公司总成本和劳动成本的增长 该公司总成本和劳动成本每年增加相同的数量,因而用绝对数据作图时两条线是平行的,不小心可能会得出劳动成本占总成本固定比例的误解。实际上第1年占40%,第6年占60%。使用对数图就可以清晰反映劳动成本有更高的增长率。

图1.15 对数图反映了劳动成本增长率大于总成本增长率 图1.15 对数图反映了劳动成本增长率大于总成本增长率