应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements


因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二节 换元积分法 一、第一类换元积分 法(凑微分法) 二、第二类换元积分法. 问题 解决方法 利用复合函数,设置中间变量. 过程令 一、第一类换元积分法(凑微分法)
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第四章 数据分布的集中趋势和离中趋势 第一节 集中趋势指标 第二节 离中趋势指标.
第三章 单变量综合性描述统计量 宇传华.
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数
人教版五年级数学下册 众 数.
10.2 立方根.
第三章 统计数据的描述 教师:刘小林.
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
第三章 集中量数.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)
统计学原理(第四讲) 罗洪群.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
统 计 基 础 课 程 辅 导 教 案 青海省大通县农广校.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第一节 分布的集中趋势 第二节 分布的离散程度
统计学期末复习
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
数 控 技 术 华中科技大学机械科学与工程学院.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
模型分类问题 Presented by 刘婷婷 苏琬琳.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第二章 Java基本语法 讲师:复凡.
Descriptive Statistics
用计算器开方.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
小数的大小比较 仙岩镇第二小学 陈曼丽.
统计图表绘制 电子工业出版社.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二章 计量资料的统计描述.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
Presentation transcript:

应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授

第2章 统计数据的描述度量 本章主要介绍以下 3类综合统计指标: 度量中心(集中)趋势的平均指标 度量离散程度的指标 度量偏斜程度的指标 度量两种数值变量关系的指标

§2.1 度量集中趋势的平均指标 平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势。 §2.1 度量集中趋势的平均指标 平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势。 平均指标按计算方式可分为数值平均数和位置平均数两大类。

一.数值平均数 ——是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。 (一)算术平均数 1.算术平均数的基本公式

2.算术平均数的计算 (2)加权算术平均数 xi —第 i 组的代表值(组中值或该组变量值); f i —第 i 组的频数。 (1)简单算术平均数 n —总体单位总数;xi —第 i 个单位的标志值。 (2)加权算术平均数 xi —第 i 组的代表值(组中值或该组变量值); f i —第 i 组的频数。

使用 Excel 函数求加权算术平均数 利用 Excel“数学和三角函数”中的 SUMPRODUCT 函数可以方便地计算出分组数据的 加权算术平均数。 语法规则: 格式:SUMPRODUCT(<区域1>,<区域2>,…) 功能:返回两个或多个区域中对应元素乘积之和。 例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。

(二)几何平均数 当统计资料是各时期的发展速度等前后期的两两比环数据,要求每时期的平均发展速度时,就需要使用几何平均数。 几何平均数是 n 个数连乘积的 n 次方根。 1. 简单几何平均数 2. 加权几何平均数 f i — 各比率出现的频数

例:某公司原料成本随时间增长的情况如下表 求原料成本的平均年增长率。 解一: 解二: 年平均增长率 = 1.0688 - 1 = 6.88%

3.使用 Excel 求几何平均数 可以使用 Excel 统计函数中的 GEOMEAN 函数返 回几何平均数。 语法规则: 功能:返回所有参数中数据的几何平均数。

二.位置平均数 位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。 (一)中位数 ——将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me 。 中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。 比如有 5 笔付款:9元,10元,10元,11元,60元 付款的均值为 20 元,显然这并不是一个很好的代表值,而中位数 Me = 10 元则更能代表平均每笔的付款数。

1.使用 Excel 的统计函数返回未分组数据的中位数 可以使用 Excel 统计函数中的 MEDIAN 函数返回 未分组数据的中位数。 格式:MEDIAN(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的中位数。

2.分组数据中位数的确定 对于分组数据的统计资料,中位数要用插值法来估算。 (1)计算各组的累计频数; (2)确定中位数所在的组 ——是累计频数首次包含中位数位次Σf /2的组。 其中:L — 中位数所在组的下限; Sm-1 — 中位数所在组前一组的累计频数; fm — 中位数所在组的频数; d — 中位数所在组的组距。

例:计算下表数据的中位数 解:Σf/2 = 27.5,中位数在“15-25”的组中,

(二)众数 ——是总体中出现次数最多的标志值,记为M 0。 众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。 在某些情况下,众数是一个较好的代表值。 例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。 又如,当要了解大多数家庭的收入状况时,也要用到众数。

1.未分组数据众数的确定 在数据量很大的时候,可以使用 Excel 统计函数中的 MODE 函数返回众数。 功能:返回所有参数中数据的众数。

2.分组数据众数的确定 对于分组数据的统计资料,众数也要用插值法来估算。 (1)确定众数所在的组 对于等距分组,众数组是频数最高的组; (2)使用以下插值公式计算 Δ1 Δ2 众数 L d 其中: L — 众数组的下限 Δ1— 众数组与前一组的频数之差 Δ2 — 众数组与后一组的频数之差 d — 众数组的组距

例:计算下表数据的众数 解:众数组是“15-25”的组,则

三.算术平均数和位置平均数间的关系 1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同。 x f (Me,M0) x f Me M0 2.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数。 3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数。 x f Me M0

补充习题 补充题3:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。

补充题3 答案 Σf/2=143/2=71.5,中位数所在组为“100~150”的组, 众数组为“100~150”的组,

四分位数 (概念要点) 25% 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 3. 不受极端值的影响 应用统计第1章 四分位数 (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 QL QM QU 25% 3. 不受极端值的影响 4. 可用于定序数据,也可用于数值型数据,但不能用于定类数据

四分位数 (位置的确定) 未分组数据: 组距分组数据: N+1 下四分位数(QL)位置 = 4 3(N+1) 上四分位数(QU)位置 = N 应用统计第1章 四分位数 (位置的确定) 下四分位数(QL)位置 = N+1 4 上四分位数(QU)位置 = 3(N+1) 未分组数据: 下四分位数(QL)位置 = N 4 上四分位数(QL)位置 = 3N 组距分组数据:

数值型未分组数据的四分位数 (7个数据的算例) 应用统计第1章 数值型未分组数据的四分位数 (7个数据的算例) 原始数据: 23 21 30 32 28 25 26 排 序: 21 23 25 26 28 30 32 位 置: 1 2 3 4 5 6 7   7+1 QL位置 = 4 = = 2 QU位置 = 3(N+1) 3(7+1) = 6 N+1 QL= 23 QU = 30

数值型未分组数据的四分位数 (6个数据的算例) 应用统计第1章 数值型未分组数据的四分位数 (6个数据的算例) 原始数据: 23 21 30 28 25 26 排 序: 21 23 25 26 28 30 位 置: 1 2 3 4 5 6   QL位置 = N+1 4 = 6+1 = 1.75 QU位置 = 3(N+1) 3(6+1) = 5.25 QL= 21+0.75(23-21) = 22. 5 QU = 28+0.25(30-28) = 28.5

数值型分组数据的四分位数 下四分位数: 上四分位数:

数值型分组数据的四分位数 【例】根据第三章表中的数据,计算50 名工人日加工零件数的四分位数 QL位置=50/4=12.5 表 某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 累积频数 105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 5 8 14 10 6 4 16 30 40 46 50 合计 — QU位置=3×50/4=37.5

使用Excel统计函数中的QUARTILE函数 格式:QUARTILE (数据集, 第nthquart分位数) 功能:返回不同nthquart的四分位数。 如果nthquart等于 函数QUARTILE的返回值 最小值 1 第一四分位数(第25 个百分点值) 2 中位数(第 50个百分点值) 3 第三四分位数(第 75 个百分点值) 4 最大值

五数汇总和箱线图 五数汇总包括最小值、第一分位数、中位数、第三分位数和最大值这样五个数据,即 箱线图(亦称箱须图)提供了基于五数汇总的几何图形

箱线图和四种不同类型分布图的联系 c)右偏分布 a)钟形分布 b)左偏分布 d)矩形分布

§2.2 度量离散程度的指标 x 变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差和变异系数。 §2.2 度量离散程度的指标 要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。 x 频数 变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差和变异系数。

【案例】道格拉斯公司应如何选择供应商 道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?

一.极差 极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。 极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。 但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据的信息,因而是一种比较粗糙的变异指标。

二.平均差 平均差是各数据与其均值离差绝对值的算术平均数,通常记为A.D。 平均差越大,反映数据间的差异越大。 但由于使用了绝对值,其数学性质很差,因而很少使用。

四分位差 1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 应用统计第1章 四分位差 1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 4. 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性

三.方差和标准差 方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。 应注意总体方差、标准差与样本方差、标准差是有区别的。 1.总体方差和总体标准差 总体方差是各总体数据与其均值离差平方的均值,记为  2,总体标准差记为。

2.样本方差与样本标准差 样本方差记为 S 2,样本标准差记为 S,在推断统计中,它们分别是总体方差和标准差的优良估计。 其中:n 为样本容量,Xi 为样本观察值 为样本均值。

变异系数 当需要比较不同总体的离散程度时,如果使用的度量单位不同,或它们在数量级上相差很大,则用绝对数值表示的方差和标准差就缺乏可比性,此时就应使用相对变异指标(变异系数)。 例如,对汽车发动机的汽缸而言,0.05毫米的标准差就很大了,但对建筑工程而言则可完全忽略不记。 相对变异指标中最重要的是标准差系数,是标准差与均值之比,记为V 。

未分组数据方差和标准差的计算 方差和标准差的手工计算非常烦琐,只要求掌握以下两种方法。 ⑴使用计算器的统计功能(SD或STAT功能) ⑵使用 Excel 的统计函数 ①VARP(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的总体方差。 ②STDEVP(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的总体标准差。 ③VAR(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的样本方差。 ④STDEV(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的样本标准差。

§2.3 度量偏斜程度的指标 总体分布的特征不仅与均值和变异指标有关,而且与分布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这种分布形态上的数量特征,往往具有重要的社会经济意义。偏度系数是度量偏斜程度的指标,主要有以下两种计算方法: 一、用标准差为单位计量的偏度系数 该偏度系数记为SK,计算公式为 SK是无量纲的量,取值通常在-3~+3之间,其绝对值越大,表明偏斜程度越大。当分布呈右偏态时,SK>0,故也称正偏态;当分布为左偏态时,SK<0,故也称负偏态。但除非是分组频数分布数据,否则SK公式中的众数M0有很大的随

二、使用三阶中心矩计量的偏度系数 该偏度系数是用三阶中心矩除以标准差的三次方来度量偏斜程度,记为,计算公式为 称为三阶中心矩。 偏度系数 可以适用任何数据。 和SK的计算方法不同,因此根据同一资料计算的结果也不相同。 可以使用Excel统计函数中的SKEW函数返回数据的偏度系数,语法规则如下:   格式:SKEW(<区域或数组1>,<区域或数组2>,…) 功能:返回所有参数中数据的偏度系数。

§2.4度量两种数值变量关系的指标 协方差:协方差测试了两数值变量(和)的线性联系,表示为Cov(X,Y)。其计算用下列公式表示。 2. 相关系数:相关系数测定了两数值变量间的线性相关强度。相关系数的值从完全负相关–1到完全正相关+1。

使用 Excel 求各种统计指标 当数据量很大时,手工计算统计指标是非常烦琐的,尤其是标准差、方差数等的计算量很大。