第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

因数与倍数 2 、 5 的倍数的特征
摆一摆,想一想. 棋子个数数的个数 摆出的数 、 10 2 、 11 、 20 3 、 12 、 21 、 30 4 、 13 、 22 、 31 、 40 5 、 14 、 23 、 32 、 41 、

因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
3.5 元 / 千克 2.6 元 / 千克 买 3 千克 要多少钱? = (元)
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
第一节 数理统计的基本概念.
第三章 单变量综合性描述统计量 宇传华.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
医学统计学 1 主讲人 陶育纯
第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数
人教版五年级数学下册 众 数.
第三章 函数逼近 — 最佳平方逼近.
10.2 立方根.
第三章 统计数据的描述 教师:刘小林.
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
第三章 集中量数.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第二章 统计资料的整理与分析 上一张 下一张 主 页 退 出.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一节 分布的集中趋势 第二节 分布的离散程度
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
第8章 静电场 图为1930年E.O.劳伦斯制成的世界上第一台回旋加速器.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
计算.
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Partial Differential Equations §2 Separation of variables
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Descriptive Statistics
用计算器开方.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
第4章 Excel电子表格制作软件 4.4 函数(一).
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
小数的大小比较 仙岩镇第二小学 陈曼丽.
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二章 计量资料的统计描述.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
2、5、3的倍数的特征.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
一元一次方程的解法(-).
Presentation transcript:

第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)

例如:不同国家、地区、种族之间身高、体重等 集中趋势的度量 平均数的意义 作为一个资料的代表,指资料中各变数集中 较多的中心位置,用来与另一资料相比较。 不同的平均数适合于不同的数据资料。 例如:不同国家、地区、种族之间身高、体重等 的比较;不同品种的家畜、家禽之间生产 性能的比较

集中趋势的度量 3.1.1 算术平均数 一、定义 样本的平均数记为 是最常用的一种集中趋势度量指标。 总体平均数记为 一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。 是最常用的一种集中趋势度量指标。 样本的平均数记为 总体平均数记为

集中趋势的度量 二、计算公式: :第i个观察值或变数 n:观察值或变数的个数 ∑:求和符号(sigma)

集中趋势的度量 三、算术平均数的性质 ∑(xi- ) =(x1- )+(x2- )+……+(xn- ) = x1+x2+……+xn+n• (一)离均差之和为零: 一个样本观察值与平均数之差简称离均差。 ∑(xi- ) =(x1- )+(x2- )+……+(xn- ) = x1+x2+……+xn+n• = ∑xi- n‧∑xi/n = 0

集中趋势的度量 三、算术平均数的性质 (二)离均差平方和最小: 一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。 所以:平均数是与各个观察值最接近的数值。 平均数代表这个样本的集中趋势。

样本平均数常作为检验对象的原因 1、离均差的平方和∑( - )2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。 1、离均差的平方和∑( - )2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。 2、样本平均数是总体平均数的无偏估计值,即E( )=μ。 3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。

集中趋势的度量 3.1.2 中位数(Md) 定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。

集中趋势的度量 3.1.2 中位数(Md) 对于频数分布的资料,公式如下: Lmd:中位数所在组的组下限; fm:中位数所在组的频数; C:从第一组到中位数所在组前一组的累计频数 n:样本含量; i:组距;

集中趋势的度量 3.1.3 几何平均数 定义:n个非负数的乘积开n次方的根称为几何平均 数,用 G 表示。

集中趋势的度量 3.1.3 几何平均数 为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。 几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。 能够消弱数据中个别过分偏大值的影响。

!!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。 集中趋势的度量 3.1.4 众数 定义:在资料中某一个变数出现次数最多,就称 之为众数。 1. 离散性资料:出现频数最多的数。 2. 连续性资料:频数分布表中,频数出现最多的 一组的组中值。 !!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。

集中趋势的度量 3.1.5 调和平均数 定义:各观察值倒数的算术平均数的倒数 适用于极端右偏态

集中趋势的度量 3.1.5 调和平均数 例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。 由于数据极端右偏态,用调和平均数较为合理。

2.2.3 百分位数(百分位点) 指将一组 n 个数据由小到大排列,如果小于 某数值的数据个数为全体数据个数的x%,则称该数为第 x 百分位数或 x% 分位数。 25%分位数或下四分位数:0.25n个数的后一个数。 50%分位数或中位数:0. 5n个数的后一个数。 75%分位数或上四分位数:0.75n个数的后一个数。 1

集中趋势的度量 3、中位数 适用于非参数检验,如卡方检验。 4、几何平均数和调和平均数 适用于右偏态分布。

3.2标准差 离散趋势的度量 平均数的代表程度与样本的变异程度有关 一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。

离散趋势的度量 3.2标准差 即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。 产仔数 总和 甲 8,4,16,12,22,17,6,14,6,5 110 11 乙 14,8,11,9,11,12,10,14,13,8

离散趋势的度量 3.2标准差 1.如果各个变数相同或者变异程度比较小,则平 均数能够代表整个样本。 2.如果各个变数的变异程度比较大,则平均数的代 表性就小。 因此,单靠平均数不能全面、正确地了解样 本。也不能了解平均数作为样本的变异程度。

离散趋势的度量 3.2 范围(全距) 定义:全部变数的最大值与最小值之差 R= Max(x) -Min(x) 范围或全距可以反映变异程度的一部分,但是不能代表样本内各变数之间的变异程度。 目前,被广泛使用的是以标准差来度量变异程度。

离散趋势的度量 3.2.1 标准差的定义 如果一个样本有n个观察值 x1,x2 …… xn,设其算术平均数为 ,则该样本的标准差为: 标准差考虑了每个变数与平均数的离差。 每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。 因此,标准差是离散程度的度量

离散趋势的度量 3.2.2 标准差公式的来源 1.离均差=(x- ) 2.离均差之和= ∑(x- )=0 虽然离均差可以衡量变异程度,但是离均差之和为0,所以不是理想的指标 1.离均差=(x- ) 2.离均差之和= ∑(x- )=0 3.离均差平方和 SS= ∑(x- )2 为了合理地计算平均差异,用平方和的办法来消除离均差的正负号,离均差平方相加,得到平方和(SS),但是由于不同样本的观察值个数不同,所以离均差平方和也不是理想指标

离散趋势的度量 3.2.3 样本方差和样本标准差 将离均差平方和求平均数,称为样本方差,目的是消除观察值个数的影响 样本方差开方,目的是使变异还原,即标准差。

离散趋势的度量 3.2.4 总体方差和样本标准差 总体是未知的,用样本标准差估计和推断总体标准差

3.2.5 自由度: df,n-1 如果一个样本含有n个变数,从理论上讲,n个变数都同样用以计算标准差,n个变数与平均数相减有n个离均差。

离散趋势的度量 3.2.5 自由度: 例如:有3个变数,平均数等于5。 问着三个变数可能是多少? (4、5、6)(2、4、9)(3、5、7)…… 他们的共同特点:前两个数可以自由选择,为了使平均数等于5,第三个数不用选就确定了。这时(3-1)=2就是所谓自由度。 自由度: 消除限制性因数后,所剩余的独立变数的个数,用df表示。

离散趋势的度量 三、方差和标准差的计算公式 1. 直接法 2. 加权法

3.2.6 标准差的性质 标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。 在计算标准差时,在各观测值加上或减去一个常数,其数值不变。 当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。

3.2.6 标准差的性质 在资料服从正态分布的条件下: 平均数左右一倍标准差( ±S)范围: 约有68.26%的观测值; 也就是说全距近似地等于6倍标准差,可用( )来粗略估计标准差。

离散趋势的度量 3.3 变异系数(C.V) 标准差与平均数的比值称为变异系数 ⁂ 用于比较度量单位不同以及不同时期 的资料。