第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.

Slides:



Advertisements
Similar presentations
3 的倍数特征 抢三十
Advertisements


因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 微分及其应用. 三、可微的条件 一、问题的提出 二、微分的定义 六、微分的形式不变性 四、微分的几何意义 五、微分的求法 八、小结 七、微分在近似计算中的应用.
2 , 5 的倍数的特征. 我们可以先写出几个 5 的 倍数来看看。 对,先研究小范围的数, 再进行推广验证。
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
医院统计.
医学统计学 主讲人:信息部 林雪君.
第三章 单变量综合性描述统计量 宇传华.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
( Measures of Dispersion )
医学统计学 1 主讲人 陶育纯
人教版五年级数学下册 众 数.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第三章 集中量数.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
第一章.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
基本概念 资料类型 计量资料:用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得数据为数值变量。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第十四章 数值变量的统计描述.
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第十章 方差分析.
正态分布.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Descriptive Statistics
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
第4章 Excel电子表格制作软件 4.4 函数(一).
小数的大小比较 仙岩镇第二小学 陈曼丽.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
(四)标准差(standard deviation)
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二章 计量资料的统计描述.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第七章 计量资料的统计分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
Presentation transcript:

第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定

第一节 频数分布 一、频数分布表(frequency table)

例2-1 测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。 75 76 72 69 66 57 68 71 73 82 80 67 64 74 58 70 60 77 65 62 79 78 61 81 63 84

频数表的编制步骤 (1)求极差(range):即最大值与最小值之差,又称为全距。R=84 – 57 =27(次/分) 27/10=2.7 ≈3 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56~ 59~ …… 80~ 83~85 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。

表2-1 130名健康成年男子脉搏(次/分)的频数分布表 表2-1 130名健康成年男子脉搏(次/分)的频数分布表 N=∑f

二、频数分布图

三、频数表和频数分布图用途 (1)对称分布 :若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布 1.描述频数分布的类型 (对称分布、偏态分布) (1)对称分布 :若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布

是否为对称分布?

是否为对称分布?

(2)偏态分布 : 1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。

表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布

2)左偏态分布(负偏态分布): 左侧的组段数多于右侧的组段数,频数向左侧拖尾。

表2-3 101名正常人的血清肌红蛋白含量分布

2.描述频数分布的特征 表2-1数据的频数分布特征: ①数据变异(离散)的范围在57~84 (次/分 ) ②数据集中(平均)的组段在68~73 (次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。

3.便于发现一些特大或特小的可疑值 4.便于进一步做统计分析和处理

第二节 集中趋势的描述 统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。 算术均数(均数)(mean) 第二节 集中趋势的描述 统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。 常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median)与百分位数(percentile) 众数(mode)

一、算术均数 算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。

1、计算方法 (1)直接计算法 公式 : 举例:试计算4,4,4,6,6,8,8,8,10的均数?

例2-1 测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。 75 76 72 69 66 57 68 71 73 82 80 67 64 74 58 70 60 77 65 62 79 78 61 81 63 84

(2)加权法(利用频数表): 公式 : k:频数表的组段数, f :频数, X:组中值。

表2-2 130名健康成年男子脉搏(次/分)的频数分布表 表2-2 130名健康成年男子脉搏(次/分)的频数分布表 ∑fX2 N=∑f ∑fX

均数适用于对称分布,特别是正态分布资料。 2、应用 均数适用于对称分布,特别是正态分布资料。

二、 几何均数(geometric mean) 可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。

几何均数(geometric mean) 几何均数:变量对数值的算术均数的反对数。 其他对数(如自然对数)变换获得相同的几何均数

例2-5 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。 平均抗体效价为: 1:57

(2)加权法 公式:

例2-6 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。

适用于成等比数列的资料,特别是服从对数正态分布资料。 2、应用: 适用于成等比数列的资料,特别是服从对数正态分布资料。

三、 中位数与百分位数 平均存活天数? (一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。 三、  中位数与百分位数 11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,>60,>60 平均存活天数? (一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。

计算 公式: n为奇数时 n为偶数时

例2-3 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。 例2-3 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。

频数表资料的中位数 i; fm 下限值L 中位数M 上限值U

例2-1频数表中位数的计算 中位数=71+3x[(130x50%-59)/26] =71.69 N=∑f

应用 1、各种分布类型的资料 2、特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。

(二)百分位数(percentile) 百分位数示意图

1.直接计算法 设有n个原始数据从小到大排列,第X 百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时: Trunc()取整函数

例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: (1)n=120, ,为整数:

患 者: 住院天数: (2) ,带有小数, 故取整 trunc(118.8)= 118

2.频数表法 公式:

当 时,公式(2-9)即为中位数的计算公式

例2-9 试分别求例2-1频数表的第25、第75百分位数。 例2-9 试分别求例2-1频数表的第25、第75百分位数。 P25=65+3x[(130x25%-19)/15]=65.90 P75=74+3x[(130x75%-85)/19]=74.66

众数(mode) 众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。 例2-7 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。

众数(mode) 众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。 例2-7 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。

正态分布时: 均数=中位数=众数 正偏态分布时:均数 > 中位数 >众数 负偏态分布时:均数 < 中位数 <众数 正态分布时: 均数=中位数=众数 正偏态分布时:均数 > 中位数 >众数 负偏态分布时:均数 < 中位数 <众数

第三节 离散趋势的描述 甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。 第三节 离散趋势的描述 设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数(万/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,见下图2,三名医生的计数结果得到的均数均为500,5个数值之和均为2500。 甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。

常用统计指标:极差、四分位数间距、方差、标准差和变异系数。 一、极差(Range) 极差,用R表示:即一组变量值最大值与最小值之差。 对于书中例2-1数据,有 简单,但仅利用了两端点值,稳定性差。

二、四分位数间距 (quartile range) 下四分位数: 上四分位数: 例2-1数据 P25=65+3x[(130x25%-19)/15]=65.90 P75=74+3x[(130x75%-85)/19]=74.66

三、方差与标准差 1. 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 总体方差 样本方差 离均差平方和SS

样本标准差用 表示 ,其度量单位与均数一致,所以最常用。 2、 公式: 样本标准差用 表示 ,其度量单位与均数一致,所以最常用。 离均差平方和SS

标准差的公式还可以写成 : 利用频数表计算标准差的公式为

例2-11 对例2-1的前10个数据: 75,76,72,69,66,72,57,68,71,72, 用直接法计算标准差。

例2-12 利用表2-2中的数据和频数表法计算标准差。 例2-12 利用表2-2中的数据和频数表法计算标准差。 ∑fX2 N=∑f ∑fX

标准差的意义和用途 说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差; ...。 标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。 用于计算变异系数 用于计算标准误(见第四章) 结合均值与正态分布的规律,估计参考值的范围(见第五节)。

四、变异系数 变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。

某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg, 比较其变异度?

第四节 正态分布

正态曲线(normal curve)的发现 de Moivre(1667-1754),published in 1733 Laplace(1749-1827) Gauss(1777-1855)正态分布: 又称高斯分布(Gaussian distribution)

, 一、正态分布的概念和特征 1.正态分布曲线的数学表达式 (概率密度函数,probability density function,pdf ) ,

2.正态分布的特征 正态曲线下面积分布有一定的规律,总面积=1。

累积面积可通过对概率密度函数f(X)积分求得 (累积)分布函数:

图2-7 正态曲线面积分布示意图

二、标准正态分布

见P404~405,Z~N(0,1)2

例2-1的130名健康成年男子脉搏资料的均数、标准差分别为:71. 32与5 例2-1的130名健康成年男子脉搏资料的均数、标准差分别为:71.32与5.80 (次/分);问在正态分布假定下,脉搏在65~75(次/分)之间有多少人?

正态分布 标准正态分布

第五节 医学参考值范围的制定 一、基本概念

1.意义:医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。 由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”。

2.单、双侧问题,常依据医学专业知识而定 双侧 : 如:血清总胆固醇、血液白细胞数无论过低或过高均属异常 单侧上限 : 如:血清转氨酶、 体内有毒物质过高异常(越低越好,<P95) 单侧下限 : 如:肺活量过低异常(越高越好, > P5 )

3. 有90%、95%、99% 等医学参考值范围,最常用的是95% 。 计算医学参考值范围的常用方法: 1、正态分布法 2、百分位数法

二、正态分布法

公式: Z Z Z 单侧下限 单侧上限 Z

单侧下限 单侧上限

例2-16 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的95%参考值范围。 例2-16 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的95%参考值范围。 表2-7 282名正常人尿汞值( )测量结果

单侧上限