流行病学原理 Dona Schneider, PhD, MPH,FACE
流行病学定义 Epi + demos + logos = “ 降临于人类的东 西 ” 关于人群中疾病发生频率的分布范围和 决定因素的研究。( MacMahon and Pugh, 1970 )
流行病学定义 关于特定人群中健康相关状 况或事件的分布范围和决定 因素的研究,以及运用该研 究对健康问题进行控制。 (John Last, 1988 )
流行病学的运用 识别病因 Legionnaire’s 病 完成疾病的临床构图 Tuskegee 实验 判断治疗和预防的效果 乳房 X 线光片,临床实验 分辨新综合症 不同种类的肝炎
流行病学的运用 监护一个团体,地区或国家的健康 监督,事故报告 判断可能性的表述中有多大概率 DES 女儿 研究时间上的趋势对未来采取预防措施 吸烟和肺癌 估计健康服务的需求
伦敦关于死亡数的生命表
Graunt ’ s 观察 男婴的多出生 婴儿高死亡率 不同季节的死亡率
1632 年的年死亡率:十大致死因素
1900 年美国主要致死因素
地方性流行和流行
人口金字塔
统计学 统计学:应用数学一大分支,运用一系 列步骤浓缩,描述,分析和阐明信息 生物统计学:统计学有关健康信息的亚 学科
统计学(续) 描述统计:对信息定量总结的方法 中心趋势的估计 离散度的估计 推论统计:基于人群中的亚单位(样本) 提供的信息作出关于更大人群的一般化 结论的方法。
总体和样本 在决定使用何种统计检验之前,我们应 该知道我们的信息代表的是一个总体还 是一个样本 样本是可以代表总体的子集。
样本 随机采集的样本具有代表性(也就是, 每一个数据点和其他所有数据点拥有同 等的被选择的机会) 在一些情况下,样本可能是分类的,但 在每一类中必须随机
例子 我们需要采集一个样本,可以反映人口 的性别和年龄: 按性别将数据分类 在每一类中,在进一步按年龄分类 在每一个性别 / 年龄类中随机选择,从 而选出的数据关于人口成比例
总体和样本 你可以区分某个统计是关于总体的还是 关于样本的: 希腊字母代表总体参数(未知但是固定) 阿拉伯字母代表样本统计(已知但是随 机)
数据的分类 定性或定量 定性:非数字的或绝对的 例:性别,种族 / 种族划分 定量:数字的 例:年龄,体温,血压
数据的分类 离散或连续 离散:有固定数字或数值 例:婚姻状况,血型,孩子的数目 连续:有不定的数字或数值 例:身高,体重,体温
提示 定性(绝对)的数据是离散的 定量 ( 数字 ) 的数据可能是: 离散的 连续的
定性数据:名词性的 数据落在没有自然顺序的互斥种类(离散) 例如: 种族 / 种族划分 性别 婚姻状况 ICD-10 代码 二分的数据,如 HIV+ 或 HIV- ; “ 是 ” 或 “ 不是 ”
定性数据:一般的 数据落在有范围或分等级的互斥种类 (离散) 例如: 等级 社会经济状况 疾病的程度 低,中,高
定量数据:间断的 标准单位测量的数据 衡量的不仅仅是一数据点不同于另一个 数据点,还衡量相差多少 例如: 自发病以来持续了多少天(离散) 华氏或摄氏温度(连续)
定量数据:比率 标准单位测量的数据, 0 代表完全没有 例如: 孩子的数目(离散) 开尔文温度(连续)
描述生物统计学回顾 平均 中位数 众数和极差 方差和标准差 频数分布 直方图
平均 最常使用集中趋势 算术平均 公式: x = ∑ x / n 外层敏感度
例如:每周发生意外事故的次数 8, 5, 3, 2, 7, 1, 2, 4, 6, 2 x = ( )/10 = 40/10 = 4
中位数 将一定范围内的数据分成相等的两部分 的数值 将数据排序: 如果 n 是偶数,取观察值中间两数的平均数 如果 n 是奇数,取观察值的中间数为中位数
给定一个偶数观察值( n=10 ) : 例如: 1,2,2,2,3,4,5,6,7,8 中位数 = (3+4)/2 = 3.5 给定一个奇数观察值( n=11 ): 例如: 1,2,2,2,3,4,5,6,7,8,10 中位数 = 4 为第 (n+1)/2=(11+1)/2=6 个观察值
众数 在一组数中出现次数最多的数 例如: 1,2,2,2,3,4,5,6,7,8 众数 =2
极差 在一个分布中最大数和最小数之间的差 值 例如: 1,2,2,2,3,4,5,6,7,8 极差 = 8-1 = 7
方差和标准差 衡量关于平均数数值的离散度(或散度 ) 如果数值均接近平均数,方差值小 如果数值均远离平均数,方差值大
方差
标准差
对称分布和倾斜分布
对称分布和倾斜分布的频率图
12 位病人的五点焦虑衡量指数
12 位精神病人的频率图
夏季露营发生的需要急诊处理的事故
直方图
频数多边形
频数多边形和直方图
描述统计 用来作为关注健康相关结果的第一步 检测事件发生的次数确认是否增长(流 行) 检测事件的类型,找出哪些人会得病 ( 人 口统计学的不同),在什么地方什么时 候得病(空间 / 事件不同)