第三章 单变量综合性描述统计量 宇传华.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
医院统计.
資料分析 ---敘述統計分析.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
( Measures of Dispersion )
医学统计学 1 主讲人 陶育纯
人教版五年级数学下册 众 数.
第三章 函数逼近 — 最佳平方逼近.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
基本概念 资料类型 计量资料:用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得数据为数值变量。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第十四章 数值变量的统计描述.
第 3 章 敘述統計:數值方法.
第 5 章 樣本資料的數值分布.
第一章 敘述統計學.
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
第 4 章 分散量數.
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第十章 方差分析.
第八章 報酬與風險.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
Descriptive Statistics
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
(四)标准差(standard deviation)
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二章 计量资料的统计描述.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第七章 计量资料的统计分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
Presentation transcript:

第三章 单变量综合性描述统计量 宇传华

本章内容 定量资料的描述 定性资料的描述 二、中位数 第一节 中心趋势指标 一、算术平均数 第二节 离散与变异性指标 三、几何均数 第一节 中心趋势指标 一、算术平均数 二、中位数 三、几何均数 四、众数 第二节 离散与变异性指标 一、全距 二、方差与标准差 三、变异系数 四、四分位间距 定性资料的描述 第二节 离散与变异性指标 五、多样性指数 第三节 率、比及其注意事项

第一节、中心趋势指标 常用的中心趋势指标有:算术均数、几何均数、中位数、众数,统称为平均数(average) 一、算术平均数( The Arithmetic mean) 简称均数(Mean)或均值,定义为所有测量值之和除以变量值个数(即,样本含量Sample Size)。反映一组呈对称分布的变量值在数量上的平均水平。

(1)直接计算法 公式 : 举例1:试计算1,3,7,9的均数? 例2:试计算1,3,3,7,7,9,9,9的均数?

(2)加权法

均数的特征

二、 中位数与百分位数 平均存活天数? (一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。 二、  中位数与百分位数 11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,>60,>60 平均存活天数? (一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。 存活天数 2, 3, 4, 7, 9, 10, 13, 15, 50,>60,>60 秩次 1 2 3 4 5 6 7 8 9 10 11

计算 公式: n为奇数时 n为偶数时

例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 天,求其中位数。 例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 天,求其中位数。 19

频数表资料的中位数 i; fm 下限值L 中位数M 上限值U

68 中位数=4.5+0.5x[(150x50%-68)/37] =4.59

中位数的特征 计算时只利用了位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 适用于各种分布类型的资料, 特别适合于:大样本偏态分布资料 或者一端或两端无确切数值的资料

(二)百分位数(percentile) 百分位数示意图

1.直接计算法 设有n个原始数据从小到大排列,第X 百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时: Trunc()取整函数

例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: (1)n=120, ,为整数:

患 者: 住院天数: (2) ,带有小数, 故取整 trunc(118.8)= 118

2.频数表法 公式:

例 试分别求表3.3频数表的第25、第75百分位数。 P25=4.0+0.5x[(150x25%-36)/32]=4.02 P75=5.0+0.5x[(150x75%-105)/22]=5.17

三、 几何均数(geometric mean) 可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。

(1)直接法 几何均数:变量对数值的算术均数的反对数。 其他对数(如自然对数)变换获得相同的几何均数

例3.6 测定10名伤寒病人血清 抗体滴度分别为1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1:16,1:64, 1:128,求其平均抗体滴度。 以其滴度的倒数为原变量值,代入公式有: 平均抗体滴度为: 1:11

(2)加权法 公式:

例3.6的血清抗体滴度资料的频数表

几何均数的特征 1、几何均数适用于对数正态分布,如药物的效价、抗体的滴度、传染性疾病的潜伏期等资料。 2、变量x服从对数正态分布,即表示变量lg(xi)服从正态分布。对于lg(xi),具有正态分布的所有特性。

四、众数(Mode) 是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。 例 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55, ,61,61,62,62,试求众数。 众数的特征 1、对于某些数据而言,例如均匀分布,并不存在众数; 2、对于某些数据存在两个或多于两个的众数; 3、定性数据可以存在众数; 众数对于进一步的统计学计算与分析不具备应用价值。 58,58,58,58

五、其他位置指标 1、四分位数(Quartile)(三个四分位数) 2、十分位数(Centile): 9个十分位数 3、百分位数(Percentile)99个百分位数

离散与变异性指标 全距 四分位间距 方差 标准差 变异系数 多样性指数 全距、四分位间距、方差、标准差、变异系数与多样性指数

一、全距(Range)与绝对差 全距为最大值与最小值之差,也叫极差 缺点:仅利用了两个极端值。

二、方差与标准差 方差(Variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 (一)样本方差为各变量值到样本均数距离的平方和除以自由度的商值,即 (二)总体方差定义为

标准差(standard deviation) 样本标准差为样本方差的平方根; 总体标准差为总体方差的平方根。

样本标准差实用公式

仍然用钉螺抽样数据为例, 1+3+3+7+7+9+9+9=48,n=8

样本标准差的加权公式

随机变量xi的标准化 如果随机变量xi服从正态分布,均数和标准差分别为 和s,则随机变量xi的标准化正态离差值(Standard normal deviation)又称为标准化得分值(Standard Scores )为:

三、变异系数 (coefficient of variation) 变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。

某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg, 比较其变异度?

四、四分位数间距 (inter-quartile range) 四分位数间距,用IQR表示: IQR= 第三四分位数:Q3 第一四分位数:Q1

五、多样性指数 ( Indices of Diversity) 描述无序分类变量在各各义类别间频数的离散度。 用熵与最大熵之比表达离散度 频数资料的公式 频率资料的公式

第三节 率、比及其注意事项 一、率(rate): 在特定条件下,可能发生某现象的总例数中,实际发生某现象的强度或频率。

二、比(ratio) 构成比(Proportion,constituent ratio):构成比指标用以表示事物内部某一构成成分在全部构成中所占的比例或比重。 相对比( relative ratio)是由两个有关联的指标之比。

三、应用率比指标时的注意事项 mp = p 1、保证有足够的样本含量; 2、不要将率和比指标混淆; 3、注意平均率的计算;(p1+p2)/2 4、率和比指标比较时,要有可比性(不可比时可采用率标准化); 5、不要简单由样本率的差异做出结论。率比和均数一样都有抽样误差,需采用假设检验下结论。 mp = p

直接法标准化举例 两种疗法治疗某病的治愈率比较

某病两种治疗方法的治疗效果 组别 标准治疗人数 甲法 乙法 治愈率 (%) 预期 治愈数 儿童 150 40.0 60 20.0 30 成人 60.0 90 80.0 120 合计 300 46.7

作业 实习册的 实习一、定量与定性数据的描述 P5~6: 3、4、5、6、7