第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

1 、谁能说说什么是因数? 在整数范围内( 0 除外),如果甲数 能被乙数整除,我们就说甲数是乙数的 倍数,乙数是甲数的因数。 如: 12÷4=3 4 就是 12 的因数 2 、回顾一下,我们认识的自然数可以分 成几类? 3 、其实自然数还有一种新的分类方法, 你知道吗?这就是我们今天这节课的学.
3 的倍数特征 抢三十

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
第四章 数据分布的集中趋势和离中趋势 第一节 集中趋势指标 第二节 离中趋势指标.
第六章 市场调查资料的整理与分析 学习目标: (一)知识目标 ·了解市场调查资料整理的含义与意义; ·认识市场调查资料整理的程序和方法;
主讲人:赵丽 政治与公共事务管理学院 管理定量分析 主讲人:赵丽 政治与公共事务管理学院
第二章 地理数据的来源、加工和处理.
第三章 单变量综合性描述统计量 宇传华.
区域教育质量监测、诊断与评价 ——测评知识专题讲座.
第三章 综合指标分析.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
人教版五年级数学下册 众 数.
八 统计 第三课时 认识特殊的单式折线统计图 拓展练习.
10.2 立方根.
第三章 统计数据的描述 教师:刘小林.
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
任务4 综合指标分析 请同学们回忆 任务1中指标分成哪几种?.
US Dollar Index 聚金财富金融研究中心 研究员:罗晨.
第三章 集中量数.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)
4 静态指标分析方法 教学目标 从本章开始,进入统计分析阶段的学习。统计分析的方法很多,其中静态指标分析法是统计分析的基础。静态指标分析法是利用统计指标对现象进行深入的综合分析研究,揭示研究现象的特征及其规律性的方法。通过本章学习,正确理解总量指标、相对指标、平均指标和标志变异指标的概念、意义、特征和作用;了解总量指标的种类;熟练掌握相对指标、平均指标和标志变异指标的计算方法及应用原则;明确平均指标与标志变异指标的关系。
统计学原理(第四讲) 罗洪群.
财务绩效评价计分方法 1、基本指标计分 财务绩效定量评价的基本指标计分是按照功效系数法计分原理,将评价指标实际值对照相应行业标准值,按照规定的计分公式计算各项基本指标得分。    (1)单项指标得分= 本档基础分 调整分 + 本档基础分=指标权数×本档标准系数 功效 系数 实际值-本档标准值 调整分=
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
定积分的换元法 和分部积分法 换元公式 分部积分公式 小结 1/24.
统 计 基 础 课 程 辅 导 教 案 青海省大通县农广校.
统计学原理.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一节 分布的集中趋势 第二节 分布的离散程度
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
北师大版三年级数学下册 分数比大小.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Descriptive Statistics
用计算器开方.
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二章 计量资料的统计描述.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
2.3.运用公式法 1 —平方差公式.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数 第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数 它是同质总体内各单位某类变量分布集中趋势的代表值,它是同质总体内某类变量所有变量值的平均数。 例如, 甲数列:68、69、70、71、72, = 70 乙数列:50、60、70、80、90, = 70 绘制成线段如图3-1所示。 50 60 70 80 90 甲 乙 图3-1

因此,统计平均数是对变量数列围绕中心值分布状况的一种统计描述。 图3-1显示:甲数列集中程度大,乙数列离散程度大。 算术平均数是测定集中趋势最常用的代表值,它的实质是把同质总体中各单位变量值的差异(离差)正负相互抵消后反映变量集中趋势中心点的代表值。如甲、乙两数列: 甲数列:68、 69、 70、 71、 72, = 70 离差:-2 -1 0 1 2 乙数列:50、 60、 70、 80、 90, = 70 离差:-20 -10 0 10 20 因此,统计平均数是对变量数列围绕中心值分布状况的一种统计描述。

1.简单算术平均数 用字母表示为: 式中: —— 算术平均数; xi —— 表示第i个变量值; n —— 总频数; Σ —— 加总符号。 代入数值为: 甲: = = 70 乙: = = 70 =

2.加权算术平均数 (1)根据单项变量分布数列计算算术平均数 用字母表示: = 式中:fi——第i组的变量值出现的次数,即频数。 利用分组数据计算算术平均数的过程是: ①表内,根据x 栏与f 栏内数值计算出xf栏内数值。Xf 栏为各组变量总值, Xf 栏的合计数为总体变量总值。 ②表外,将Σ Xf (变量总值)和Σf(总频数)代入公式,计算出算术平均数 。 例:某生产组10名工人生产甲产品,日产量分组资料 如表3-5所示。试计算工人平均日产量。

计算表明,平均日产量26件趋近工人数最多即频数最大的那个变量值30件。若本例各变量值x不变,各组工人数f 的分布变化,可得表3-6。 表3-5 加权算术平均数计算表 = = = 26 (件) 计算表明,平均日产量26件趋近工人数最多即频数最大的那个变量值30件。若本例各变量值x不变,各组工人数f 的分布变化,可得表3-6。 日产量(件)xi 工人数(人)fi Xi · fi 10 1 20 2 40 30 7 210 合 计 260

计算表明,平均日产量14件趋近于工人数最多即频数最大的变量值10件。 日产量(件)xi 工人数(人)fi Xi · fi 10 7 70 表3-6 加权算术平均数计算表 根据表3-6资料计算平均日产量为: = = 14(件) 计算表明,平均日产量14件趋近于工人数最多即频数最大的变量值10件。 日产量(件)xi 工人数(人)fi Xi · fi 10 7 70 20 2 40 30 1 合 计 140

权数不仅可以用绝对数f 表示,也可用相对数即频率f/Σf表示。即: 由上例可以看出,用分组数据计算平均数,平均值的大小受两个因素影响:一个是各组变量值x,另一个是各组次数即频数f的影响。当各组变量值x 不变时,各组次数即频数f 对平均值 的大小起着权衡轻重的作用。因此,次数f 称为权数,这种方法称为加权算术平均法。 权数不仅可以用绝对数f 表示,也可用相对数即频率f/Σf表示。即: = =

例 如表3-7所示。 = = 26(件) 日产量(件)xi 工人数(人)fi fi/Σfi xi·( fi/Σfi) 10 1 0.1 20 例 如表3-7所示。 表3-7 加权算术平均数计算表 = = 26(件) 日产量(件)xi 工人数(人)fi fi/Σfi xi·( fi/Σfi) 10 1 0.1 20 2 0.2 4 30 7 0.7 21 合 计 1.0 26

若掌握组距数列资料,计算方法是:先计算组中值xi ,然后再按上述方法计算加权算术平均数。如表3-8所示。 (2)根据组距式变量分布数列计算加权算术平均数 若掌握组距数列资料,计算方法是:先计算组中值xi ,然后再按上述方法计算加权算术平均数。如表3-8所示。 表3-8 组距数列加权算术平均数计算表 日产量 (件) 组中值(件)x 工人数(人) xf x·f/ Σf f f/Σf 400以下 350 5 0.083 1750 29.05 400~500 450 13 0.217 5850 97.65 500~600 550 18 0.300 9900 165.00 600~700 650 15 0.250 9750 162.50 700~800 750 7 0.117 5250 87.75 800以上 850 2 0.033 1700 28.05 合 计 — 60 1.000 34200 570.00

缺下限组组中值 = 上限–邻组组距/2 = 400–100/2 = 350(件) ①计算组中值: 缺下限组组中值 = 上限–邻组组距/2 = 400–100/2 = 350(件) 缺上限组组中值 = 下限–邻组组距/2 = 800–100/2 = 850(件) 上下限齐全组组中值 =(上限+下限)/2 = (500+400)/2 = 450(件) … … ②计算平均数: = = 34200/60 = 570(件) = = 570(件)

算术平均数 = 变量值总量 / 单位总量 (二)算术平均数的变形 ─ 调和平均数 综上,简单算术平均数与加权算术平均数之间没有根本区别,因为一个变量值乘上一个频数(权数)与多次加总同一个变量值是意义相同的。它们的基本公式都是相同的: 算术平均数 = 变量值总量 / 单位总量 (二)算术平均数的变形 ─ 调和平均数 在实际工作中有时由于资料的原因不能直接计算算术平均数,可采用调和平均数的形式间接算出算术平均数,其计算结果与算术平均数相同。因此,在这种情况下调和平均数的应用是算术平均数的变形形式。如表3-9所示。 表3-9 同种商品价格及销售额资料 商场名称 价格(元)x 销售额(元)m 甲 0.80 16000 乙 1.00 21000 丙 1.20 21600 合 计 — 58600

Σm 是变量总值,因为m =xf ,所以m/x =f 是各组频数,Σm/x是总次数。由此可见,调和平均数是算术平均数的变形形式。 调和平均数的计算方法如表3-10所示。 表3-10 调和平均数计算表 Σm 是变量总值,因为m =xf ,所以m/x =f 是各组频数,Σm/x是总次数。由此可见,调和平均数是算术平均数的变形形式。 加权调和平均数的计算方法为: 平均价格 = = 58600/59000 = 0.99(元/件) 商场名称 价格(元)x 销售额(元)m 销售量(件)m/x 甲 0.80 16000 20000 乙 1.00 21000 丙 1.20 21600 18000 合 计 — 58600 59000

调和平均数有以下特点: 1.调和平均数易受极端值影响,当变量呈明显偏态时它的代表性会受影响。 2.当变量中有0值时,调和平均数无法计算。 (三)几何平均数:在第六章中介绍。 (四)中位数和众数(略) 本小节小结 算 术 由于在计算时所有变量值均参加了计算, 集 平均数 因此,算术平均数能够代表所有的变量 中 平均值 值。算术平均数对极端值反应很灵敏。 趋 调和均值: 调和平均数是算术平均数的变形。 势 中位数是各变量值中央位置的代表值, 测 位置值 中位数 不受极端值影响。众数是出现次数最多 度 众 数 的变量值,不受极端值影响。

极差也称全距,是变量值中最大值与最小值之差。用公式表示为:全距(R)= 最大变量值 - 最小变量值。如: 二、离中趋势的代表值——标志变异指标 均值是描述变量分布集中趋势,标准差是描述变量分布离中趋势,两者相辅相成共同反映变量分布特征的一对对立统一的代表值。描述离中趋势的代表值常用的有:极差、标准差和离散系数等。 (一)极差 极差也称全距,是变量值中最大值与最小值之差。用公式表示为:全距(R)= 最大变量值 - 最小变量值。如: 甲数列: 50 、60 、70 、80 、90 , R = 90-50 = 40 乙数列: 68 、69 、70 、71 、72 , R = 72-68 = 4 组距数列计算全距: 全距(R)= 最高值组上限值 - 最低值组下限值。如表3-11: 表3-11 40名工人日产量资料 产量(件) 50~60 60~70 70~80 80~90 90~100 合计 人数(人) 2 8 16 10 4 40

R = 100-50 = 50(件) 用离差评价变量的离散状况:极差值越小表明变量值离散范围小,离散程度小,变量值集中,平均数代表性大;极差值越大,表明变量值离散范围大,离散程度大,变量值分散,平均数代表性小。极差值对极端值反应灵敏。 (二)方差和标准差 方差和标准差是最重要、最常用的离中程度的度量方法,多用于以算数平均数为集中趋势度量的场合。 1.方差 它是各变量值相对于平均数的离差的平方的平均数,方差习惯上用字母“σ2 ”表示。它的计算过程是:先用各个变量值xi减去其平均数 ,得出离差xi- 。而离差有正、负之分,为了防止正、负离差相互抵消,可取离差的平方值(xi- )2,最后用离差平方之和除以项数n 或总次数Σf 可得方差。

(1)简单式方差: σ2 = (2)加权式方差: 2.标准差 标准差是方差的平方根,其计算公式为: (1)简单式方差: σ= (2)加权式方差: 3.标准差的计算方法 (1)简单式标准差: 计算过程如表3-12、3-13所示。

σ= = 14.14(件) = 350/5=70(件) 日产量(件)xi 离差(xi- ) 离差平方(xi- )2 50 -20 400 表3-12 甲组简单式标准差计算表 = 350/5=70(件) σ= = 14.14(件) 日产量(件)xi 离差(xi- ) 离差平方(xi- )2 50 -20 400 60 -10 100 70 80 10 90 20 合 计 Σ — 1000

计算表明,乙组比甲组标准差小,则乙组比甲组离中程度小,即乙组变量值分布范围比甲组集中,乙组平均数代表性大。 日产量(件)xi 表3-13 乙组简单式标准差计算表 = 350/5=70(件) σ= = 1.414(件) 计算表明,乙组比甲组标准差小,则乙组比甲组离中程度小,即乙组变量值分布范围比甲组集中,乙组平均数代表性大。 日产量(件)xi 离差(xi- ) 离差平方(xi- )2 68 -2 4 69 -1 1 70 71 72 2 合 计 Σ — 10

产量(件) xi 人数(人) fi 总产量(件) xi fi 离差(件)xi- 离差平方(xi- )2 离差平方加权(xi- )2fi 12 (2)加权式标准差(计算过程如表3-14)。 表3-14 单项数列标准差计算表 产量(件) xi 人数(人) fi 总产量(件) xi fi 离差(件)xi- 离差平方(xi- )2 离差平方加权(xi- )2fi 12 1 -4 16 13 2 26 -3 9 18 14 3 42 -2 4 15 60 -1 5 80 17 68 54 19 38 20 合计 25 400 ─ 100

= 400/25 = 16(件) σ= = = 2(件) 计算公式如下: 由组距式变量数列计算标准差,见表3-15。 σ= = = 2(件) 由组距式变量数列计算标准差,见表3-15。 表3-15 组距变量数列标准差计算表 = 3100/100 = 31(千克) 日产量(千克) 人数(人)fi 组中 值xi xi fi xi- (xi- )2 (xi- )2fi 15~25 20 400 -11 121 2420 25~35 50 30 1500 -1 1 35~45 40 1200 9 81 2430 合 计 100 ─ 3100 4900

σ= = 7(千克) (三)离散系数 若研究的总体不同,或计量单位不同,或平均数相差悬殊,它们离中趋势的绝对数是不可以比较的。为此,要计算离中趋势的相对数,即离散系数。 离散系数有几种,常用的是标准差系数,它是标准差除以平均数表明每单位平均数的离散程度,用百分数表示,是变量分散性的相对程度度量。标准差系数常用字母“Vσ”表示,计算公式为: Vσ = ×100% 1.比较总体相同,计量单位不同两组变量数列的离散程度 例如,某市6岁男童体重与身高资料如下: 平均数 标准差 体重: 19.39千克 2.16千克 身高: 115.87厘米 4.86厘米

表3-16 成人组身高标准差计算表(单位:厘米) 标准差系数为: 体重: Vσ = 2.16/19.39×100% = 11.14% 身高: Vσ = 4.86/115.87×100% = 4.19% 计算表明体重变异大于身高变异。 2.比较计量单位相同平均数差异大的两组变量的离散程度 例如,表3-16和表3-17两组资料。 表3-16 成人组身高标准差计算表(单位:厘米) 身高xi xi- (xi - )2 164 -4 16 166 -2 4 168 170 2 172 合 计 ─ 40

= 73(厘米) σ= 1.414(厘米) 标准差系数为: 成人组 Vσ = 1.68% 幼儿组 Vσ = 1.94% = 168(厘米) σ= 2.828(厘米) 表3-17 幼儿组身高标准差计算表 = 73(厘米) σ= 1.414(厘米) 标准差系数为: 成人组 Vσ = 1.68% 幼儿组 Vσ = 1.94% 计算表明成人组身高离散程度小于幼儿组。 身高xi xi- (xi - )2 71 -2 4 72 -1 1 73 74 75 2 合 计 ─ 10

计算表明,甲国企业员工月平均收入离散程度小。 本小节小结: (一)离散程度的实质 3.比较总体不同、计量单位也不同的两组变量的离散程度 例如,甲国某企业员工月平均收入3000美元,标准差180美元;乙国某企业员工月平均收入7500欧元,标准差600欧元,问哪国员工月平均收入离散程度小? 甲国 Vσ = 6% 乙国 Vσ = 8% 计算表明,甲国企业员工月平均收入离散程度小。 本小节小结: (一)离散程度的实质 标准差可以概括地、直接地、平均地描述变量发布的离散程度,是各变量值xi距离它们的平均数 远近的一种尺度。概率论指出,在正态分布中68%的变量值分布在距离平均数一个σ值的范围内,95%的变量值分布在距离平均数两个σ值的范围内,其余的5%远离平均数。

平均数通常可用来寻找变量分布的中心值;标准差则度量了各变量值对于平均数的分布程度。两者关系用正态分布图展示: (二)平均数与标准差 平均数通常可用来寻找变量分布的中心值;标准差则度量了各变量值对于平均数的分布程度。两者关系用正态分布图展示: 68% 95% 99%

本章小结: (一)总体变量分布特征的统计描述 将采集到的资料整理成变量数列后,呈现给我们的只是一个总体变量分布形态,进一步研究总体变量分布的规律性,就会发现总体变量分布具有集中趋势和离中趋势两个方面的特征。因此 就需要对总体变量分布特征进行集中趋势和离中趋势的描述—— 平均指标和变异指标。 平均值——算术、调和、几何平均 集中趋势测度 位置值——中位数、重数 总体变量 分布特征 绝对数——全距 离中趋势测度 平均数——标准差 相对数——标准差系数

加权调和平均: = 用 对变量值倒数 加权平均; (二)权数的意义 加权算术平均: = 用 对变量值x加权平均; 加权调和平均: = 用 对变量值倒数 加权平均; 加权标准差:σ= 用 对离差 加权平均。