第四章 队 列 研 究 (cohort study) 流行病学教研组 流行病与卫生统计学教研室
流行病学是研究人群中疾病与健康状况的分布及其影响因素,并研究防制疾病及促进健康的策略和措施的科学。 流行病学任务的三个阶段 ----揭示现象 ----找出原因 ----提供措施
流行病学方法 观察法 描述性研究 横断面调查 监 测 生态学研究 分析性研究 病例对照研究 队列研究 实验法 实验性研究 临床试验 现场实验 社区干预实验 理论法 理论流行病学研究 产生假设 检验假设 验证假设 流行病学研究方法分类
队列(cohort) 队列原意是指古罗马军团中的一个分队,流行病学家加以借用,表示有共同经历或共同状态的一群人,例如一组出生队列有相同的出生年代,一组吸烟队列有共同的吸烟经历。队列有固定队列与动态队列之分。
固定队列 Fixed Cohort 出现结局 未出现结局 研究开始 研究结束
动态队列 Dynamic Cohort 出现结局 失访 研究开始 研究结束
病因和危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生。 因 果
暴露组的率>未暴露组的率,则可认为暴露与疾病存在联系,可能是因果联系。 研究对象是加入研究时未患所研究疾病的一群人,根据是否暴露于所研究的病因或暴露程度而划分为不同组别(队列),随访观察不同组别结局。 暴露组的率>未暴露组的率,则可认为暴露与疾病存在联系,可能是因果联系。
主要内容 第一节 概 述 第二节 研究设计与实施 第三节 资料的整理与分析 第四节 常见偏倚及其控制 第五节 优点与局限性 第六节 研究实例
第一节 概 述 概 念 基本原理 研究目的 研究类型
基本概念 暴露 exposure 研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究变量
基本概念 暴露 exposure 研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究变量 危险因素risk factor 是泛指那些能够使人群疾病发生频率升高的因素,也就是流行病学中广义的“病因”。
基本概念 暴露 exposure 研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究变量 危险因素risk factor 是泛指那些能够使人群疾病发生频率升高的因素,也就是流行病学中广义的“病因”。 保护因素protective factor 是泛指那些能够使人群疾病发生频率下降的因素。
随访一定时间,比较两组或多组之间所研究结局(outcome,发病或死亡等)发生率的差异,从而判断研究暴露因素与研究结局之间的关系 基本原理 根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组与非暴露组,或是暴露程度不同的若干组 随访一定时间,比较两组或多组之间所研究结局(outcome,发病或死亡等)发生率的差异,从而判断研究暴露因素与研究结局之间的关系
队列 队列研究的结构模式图 时间顺序 Yes 暴露组 No Yes 非暴露组 No 结局(疾病) 是否暴露某一因素 随访 调查人群 随访 未患某研究 疾病 Yes 随访 非暴露组 No
研究特点 观察法 设立对照,是分析流行病学 由因及果,时间顺序合理,可解决因果关系 可以观察一种因素与多种疾病的关系
研究目的 检验病因假设 ( hypothesis) 评价预防措施效果 (effect of prevention) 研究疾病的自然史( natural history of disease) 新药的上市后监测
研究类型 前瞻性队列研究(prospective cohort study) 历史性队列研究(historical cohort study) 双向性队列研究(ambispective cohort study)
研究类型 时间顺序 过去 现在 将来 历史性队列 双向性队列 前瞻性队列 回顾性收集已有的历史资料 继续前瞻性收集资料 前瞻性收集资料
time Exposure Study starts Disease occurrence 历史性队列 双向性队列 前瞻性队列
前瞻性队列研究 Prospective Cohort Study 研究队列的确定是现在(concurrent) 根据研究对象现在的暴露分组 需要随访(follow-up) 结局在将来某时刻出现
优 点 时间顺序增强了病因推断的可信度 直接获得暴露与结局资料,结果可信 能获得发病率 缺 点 所需样本量大,花费大,时间长 影响可行性
前瞻性队列研究应用条件 明确地检验假设 所研究疾病的发生率较高,一般不低于5‰ 明确规定暴露因素和结局变量 可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群 足够的人、财、物力
历史性队列研究 Historical (Retrospective) Cohort Study 根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组 不需要随访,研究开始时结局已出现
优 点 缺 点 短期内完成资料的收集和分析 时间顺序仍是由因到果 省时、省力、出结果快 资料积累时未受到研究者的控制,内容上未必符合要求 需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料
双向性队列研究 Mixed (Ambispective) Cohort Study 研究队列的确定是过去 根据研究对象过去某时刻的暴露情况分组 需要随访 部分结局可能已出现
第二节 设计和实施 确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
一、确定研究因素 主要暴露因素 在描述性研究和病例对照研究的基础上确定 可能影响结局的因素 混杂因素 人口学特征等 暴露测量 混杂因素 人口学特征等 暴露测量 性质 定性(quality) 定量(quantity) 方法 访谈 实验室检查 查阅记录
二、确定研究结局 结局是研究队列中预期结果事件 发病、死亡、健康状况和生命质量 终极结果(发病)或中间结局(血清变化) 正面(生命延长)和负面(发病) 定性或定量 可多个或多方面(实例的结局是PHCC死亡 )
一次研究可有多个结局 慢性支气管炎 吸烟 吸烟 肺癌 冠心病 结局的测量 采用国际或国内通用的标准
三、确定研究现场与研究人群 有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高 有代表性 研究现场
三、确定研究现场与研究人群 从目标人群中抽出的具有代表性的人 未患所研究疾病 分为暴露人群和非暴露人群 研究人群
暴露人群选择 特殊暴露人群: 一般是指超额暴露于可疑病因或生活习惯或职业可能与所研究疾病有关的人,即高危人群.如:吸烟人群,井下工人,冶炼工人等. 一般人群:指一个地区的全部人口或其样本. 便于随访的人群:如组织人群(机关单位,企事团体等)
非暴露人群选择 选择原则:对照人群除暴露因素的影响外, 其他各种因素的影响或人群的特征(如年龄,性别,职业,民族等)都应尽可能与暴露组相似. 内对照(internal controls): 一群研究对象内部 外对照(external controls): 一群研究对象外部 总人口对照(total population controls):整个地区现成的发病或死亡资料 多重对照(multiple controls):两种或以上的对照形式
四、确定样本量 计算样本量时需考虑的问题 抽样方法 暴露组与非暴露组的比例 失访率
四、确定样本量 影响样本量的因素 一般人群中所研究疾病的发病率(P0) 暴露人群的发病水平P1(D=P1-P0),D值越大,N越小 相对危险度(risk ratio, RR) α值 把握度1-β
四、确定样本量 样本大小的估计: 查表 公式计算(条件 暴露组和对照组样本含量相等) P1:暴露组预期发病率 P0:对照组预期发病率 :两个发病率的平均值 P1:暴露组预期发病率 P0:对照组预期发病率
已知 p0=0.007,RR=2.5,α=0.05,β=0.1 计算样本量 根据上述条件 Zα=1.96, Zβ=1.282 ,q0=0.993 p1=p0×RR=0.0175,q1=0.9825 代入公式得 N=2310 考虑到失访,实际上每组需扩大10%,即2541人
五、资料的收集与随访 资料收集 基线资料(base-line) 查阅纪录 暴露的资料 调查询问 个体的其他信息 健康或疾病检查 随访(follow-up) 随访对象、内容和方法 随访间隔、随访者 观察终点、终止时间 资料收集 查阅纪录 调查询问 健康或疾病检查 环境监测等
六、质量控制 调查员选择 调查员培训 制定调查员手册 监督
第三节 资料的整理和分析 资料的基本整理模式 率的计算 效应估计
一、资料的基本整理模式 病例 非病例 合计 暴露组 a b a+b=n1 非暴露组 c d c+d=n0 a+c=m1 b+d=m0 表4-3 队列研究资料归纳整理表 病例 非病例 合计 暴露组 a b a+b=n1 非暴露组 c d c+d=n0 a+c=m1 b+d=m0 a+b+c+d=t 暴露组发病率=a/n1 非暴露组发病率=c/n0
二、率的计算 累积发病率 发病密度 标化死亡比 标化比例死亡比
变化范围 0~1 CI= 累积发病率 (cumulative incidence) 观察期内发病(或死亡)人数 观察开始时的人口数 变化范围 0~1 适用条件 样本大 人口稳定 整齐的资料 报告时必须注明时间长短
发病密度 (incidence density) 观察期内发病(或死亡)人数 ID = 观察人时 变化范围 0~∞ 适用条件 观察时间长 人口不稳定 存在失访 资料很整齐
人时(person time)的计算 人年:一个人观察一年算为一人年 精确法:以个人为单位计算(小样本) 近似法:年初人数+年末人数/2(大样本) 寿命表法:大小样本都可用
标化死亡比 (standardized mortality ratio SMR) 预期发病(死亡)数为全人口某病的发病(死亡)率×观察人口数 变化范围 0~∞ 适用条件 结局事件的发生率低 不宜直接计算率时
SMR的意义:被研究人群发生(死于)某病的危险性是标准人群的多少倍 研究人群某病发病(死亡)危险=标准人群 SMR>1 研究人群某病发病(死亡)危险>标准人 群,是标准人群的SMR倍 SMR<1 研究人群某病发病(死亡)危险<标准人群
标化比例死亡比 (standardized proportional mortality ratio,SPMR) 全人口中某病因死亡数 全部死亡数 ×某单位实际全部死亡数 变化范围 0~∞ 适用条件 不能得到历年人口资料 仅有死亡人数、原因、日期和年龄
三、效应估计 率的显著性检验 U检验 直接概率法 二项分布检验 泊松(Poisson)分布检验 2检验 计分检验(score test)
队列研究资料归纳整理表 病例 非病例 合计 发病率 暴露组 a b a+b=n1 a/n1 非暴露组 c d c+d=n0 c/n0 a+c=m1 b+d=m0 a+b+c+d=t
三、效应估计 危险度估计 相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系
相对危险度(Relative Risk RR ) 暴露组率 非暴露 组率 意义 E发病或死亡的危险是Ē的多少倍 RR值 暴露的效应 暴露与结局关联强度
肺癌 疾病 吸烟者 非吸烟者 心血管疾病 296.75 50.12 4.69 10.7 RR 170.32 1.7 意义 (1/10万人年) 心血管疾病 170.32 1.7 意义 吸烟者因肺癌死亡的危险是非吸烟者的10.7倍 吸烟者因心血管疾病死亡的危险是非吸烟者的1.7倍
表4-5 RR与关联强度 很强 10~ <0.1 强 3.0~9.9 0.1~0.3 中 1.5~2.9 0.4~0.6 弱 1.2~1.4 0.7~0.8 无 1.0~1.1 0.9~1.0 关联强度 RR
( ) ln ln RR Var l 96 . 1 ± ln ( ) RR95%CI Woolf法 RR的95%CI d c b a RR Var 1 + = ln ln RR的95%CI ( ) RR Var l n 96 . 1 ± ln 反自然对数即为RR95%CI
归因危险度 (Attributable Risk, AR ) c 或 ( ) 1 - = × RR I AR n e 意义 E与Ē 人群比较,所增加的疾病发生数量 AR值 暴露因素消除后所减少的疾病数量
心血管疾病 肺癌 疾病 RR AR 非吸烟者 吸烟者 意义 1.7 10.7 126.43 170.32 296.75 45.43 4.69 (1/10万人年) 心血管疾病 肺癌 疾病 1.7 10.7 RR 126.43 170.32 296.75 45.43 4.69 50.12 AR 非吸烟者 吸烟者 意义 RR 吸烟对肺癌的病因学意义较大 AR 戒烟对心血管疾病的预防作用较大 即公共卫生意义较大
意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比 归因危险度百分比AR%(病因分值EF) 或 - % 100 × = e I Ie AR 1 RR RR 意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比
人群归因危险度 (population attributable risk, PAR) PAR= It-I0 It:总人群率 Io:非暴露组率 意义 暴露人群与一般人群比较,所增加的疾病发生率的大小 PAR值 暴露因素消除后所减少的疾病数量
人群归因危险度百分比 PAR% 或 Pe:总人群的暴露比例 意义 PAR占总人群全部发病(或死亡)的百分比
剂量反应关系 分析方法 列出不同暴露水平下的发病率 以最低暴露水平组为对照,计算各暴露水平的RR和危险度差(RD) 必要时,应对率的变化作率的趋势性检验
结果 血清胆固醇水平 患冠心病的RR 说明存在剂量效应关系 表4-7 40~59岁男子按初始血清胆固醇分组冠心病6年发生情况 表4-7 40~59岁男子按初始血清胆固醇分组冠心病6年发生情况 血清胆固醇(mmol/L) 人数 病例数 危险度 平均年发病率 RR AR <210 454 16 0.0352 0.0059 1.00 0.0000 210- 455 29 0.0637 0.0106 1.81 0.0285 >245 424 51 0.1203 0.0200 3.39 0.0851 合计 1333 96 0.0720 0.0120 结果 血清胆固醇水平 患冠心病的RR 说明存在剂量效应关系
第四节 偏倚及其控制 选择偏倚 失访偏倚 信息偏倚 混杂偏倚
一、选择偏倚 selection bias 研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。
预防为主,抽样方法正确,严格按规定标准选择对象,提高研究对象的应答率和依从性 产生原因 选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等 控 制 预防为主,抽样方法正确,严格按规定标准选择对象,提高研究对象的应答率和依从性
二、失访偏倚 lost to follow-up 研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。
控 制 设计 选择便于随访的人群 实施 加强对随访员的管理 整理资料 对于有缺项或漏项的对象进行补查 在计算的研究样本的基础上扩大10% 控 制 设计 选择便于随访的人群 在计算的研究样本的基础上扩大10% 实施 加强对随访员的管理 制定随访计划和监测措施 期中分析 整理资料 对于有缺项或漏项的对象进行补查
三、信息偏倚 information bias 在获取暴露、结局或其他信息时所出现的系统误差或偏差
产生原因 疾病、暴露标准不明确 检验仪器不精确、检验技术不熟 询问技巧不佳记录错误,造假等
控 制 提高临床诊断技术、明确各项标准 选择精确稳定的测量方法 事前调准仪器 严格实验操作规程 同等对待每个研究对象 控 制 提高临床诊断技术、明确各项标准 选择精确稳定的测量方法 事前调准仪器 严格实验操作规程 同等对待每个研究对象 培训调查员,提高技巧,统一标准
四、混杂偏倚 confounding bias 与所研究因素和结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系。
控 制 设计阶段 限制研究对象,匹配 分析阶段 分层分析、标准化或多因素分析
第五节 优点与局限性 一、优 点 直接获得暴露组和非暴露组的发病率或死亡率 直接估计危险度 符合时间顺序,验证病因的能力较强 一、优 点 直接获得暴露组和非暴露组的发病率或死亡率 直接估计危险度 符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
第五节 优点与局限性 二、缺 点 不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 二、缺 点 不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 设计要求严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的引入增加分析难度
第六节 研究实例 二硫化碳长期低剂量的暴露与冠心病的关系
二硫化碳(CS2) 神经系统毒物,抑制酶的活性,影响脂蛋白代谢,造成心血管疾病 长期接触低浓度二硫化碳可引起慢性中毒,引起精神病、多发性神经炎、动脉粥样硬样等 短时间接触高浓度的二硫化碳蒸气可急性中毒
20世纪60年代芬兰职业卫生研究所Hernberg和Tolonen教授所做的5年前瞻性队列研究确定了二硫化碳长期低剂量暴露与冠心病的因果关系
一 确定研究因素 研究因素 长期低剂量的CS2暴露 定义 有CS2暴露,在不至引起急性中毒的间工作至少5年以上
二 确定研究结局 结局指标 心肌梗死 血压变化 心电图的改变 心绞痛发作
三 确定研究现场和人群 暴露组 1942~1967年间某粘纤厂25至64岁,至少有5年CS2暴露史的所有工人(343名,全为男性) 对照组 年龄相差不超过3岁,出生地区相同,工种的体力消耗相当,在同一城市的造纸厂随机选择的343名男性工人
四 资料收集 查阅档案记录 询问 实验室检查 用药情况、既往车间CS2的浓度等 姓名、性别、年龄、工种及工作年限、吸烟、业余时间的体力活动情况 实验室检查 血糖、血脂、血清胆固醇水平、血压、心电图、心脏大小、体重及车间CS2浓度的动态变化
五 质量控制 采用国际通用的标准和规定 事先校准各种仪器和设备 重复测量和分析某些指标
六 资料分析 CS2暴露组发生心肌梗死的相对危险度为3.57,两组致死性心肌梗死发生率和总的心肌梗死发生率差异有显著性(表1)
表1 暴露组和对照组的心机梗死发生率及相对危险度
表2 CS2与不同临床类型冠心病的RR与AR比较 心肌梗塞 3.57 5.25 致死性心肌梗塞 4.69 3.21 非致死性心肌梗塞 2.74 2.04 心绞痛 1.89 11.6 心电图冠心样改变 1.4 6.1
七 结论 长期低剂量(20~30ppm)CS2暴露与冠心病的发病和死亡存在因果关系 措施 芬兰当局已于1972年把CS2的车间最高容许浓度从20ppm降至10ppm
Thank you!