队 列 研 究 (Cohort Study) 临床流行病学与循证医学教研室.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

皮肤性病学 Dermatovenereology 山西医科大学第二医院 山西医科大学第二医院皮肤性病科.
第一篇 人群健康研究中的流行 病学原理与方法.
队列研究 放射医学与公共卫生学院 许锬.
病例对照研究 Case-control Study.
临床科研试验设计方法.
(Epidemiology in community health nursing)
第十二章 队列研究 邹焰.
全球健康危机 W. Thomas London, M.D. 翻译:章杨.
《临床医学研究方法》第二章第四节 队列研究练习题解 (供研究生、七年制使用) 临床流行病学循证医学教研室.
肺结核.
证券投资技术分析.
队 列 研 究 Cohort study wn.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
*****临床试验 研究中心:河北医科大学第二医院 ***科 主要研究者:**** 申办者:********公司
研究中心:河北医科大学第四医院 ***科 主要研究者:**** 申办者:********公司 CRO:********公司
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
病例对照研究 case-control study
完全随机设计多样本资料秩和检验.
队列研究.
第四章 队 列 研 究 (cohort study) 流行病学教研组 流行病与卫生统计学教研室.
研究设计 入门.
第七章 固定资产 本章结构 固定资产的性质与分类 固定资产的增加 固定资产的折旧 固定资产的修理 固定资产的减少
非实验性研究.
吸烟与心血管疾病.
糖尿病流行病学.
评估达力士软膏的长期有效性、安全性和耐受性
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第一节 儿科学的范围和任务.
病因性研究证据的分析与评价 井冈山大学循证医学研究中心 黄 玉 珊.
内科护理学实验 1 血糖的监测与护理 实验学时:4学时 实验类型:综合性.
③如何进行行为安全观察.
队 列 研 究 前瞻性研究(prospective study)、 发生率研究(incidence study)、
第四章 队列研究 (cohort study)
预 防 医 学 Preventive Medicine 预防医学教研室
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
调查设计.
病因探索 (Quest the cause of disease)
Autonoma de San大学医学院教授
化学品清单 类型.
第十章 方差分析.
数据挖掘工具性能比较.
1085至1125年间的官员地域分布与社会关系 1.
第七章 参数估计 7.3 参数的区间估计.
C语言程序设计 主讲教师:陆幼利.
项目名称:XXXXXXXXXXXX 研究科室:XXX 主要研究者:XXX 日期:xxxx年XX月XX日.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第四章 队列研究 Cohort Study.
试验名称: 申办方: CRO:.
6.4 你有信心吗?.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
比率 比值 比例 Janice S.Dorman.Ph.D. 翻译 yitongjianghu(DXY)
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Biases and Their Control
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
队列研究 (cohort study).
本底对汞原子第一激发能测量的影响 钱振宇
Sssss.
MTOR典型案例征集大赛 标题: 医院: 科室: 姓名: 邮箱: 2015 年 月 日.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

队 列 研 究 (Cohort Study) 临床流行病学与循证医学教研室

队列 研究 一、队列研究概述 临 床 某种疗法的效果 某种药物的疗效 某药物不良反应 影响预后的因素 评价 治疗 病因 预防 B 级 水平 证据 循证 医学 重要 贡献 癌 症 心血管病

前瞻研究 定群研究 队列研究 随访研究 病例对照研究的延续 研究时向:因 果 队列(cohort) 共同暴露(exposure)于某因素 非试验性研究 研究时向:因 果 队列(cohort) 共同暴露(exposure)于某因素 或具有共同特征的一组人群。

1. 队列研究概念 病人在“自然状态”下,根据某暴露因素 暴露与否,将选定的研究对象分为暴露组和 非暴露组,随访观察两队列疾病及预后结局 (发病、治愈、药物反应、生存、死亡等), 以验证假设暴露因素与研究疾病之间有无因 果联系的观察分析方法。 可以分为临床研究模式和病因研究模式。

常见暴露因素 1: 服用(曾服用)某种药物(剂量); 接受(曾接受)某种或某组治疗措施; 接受(曾接受)核素、放射线检查; 应用药物预防疾病或者并发症的发生; 具有某些特征,如: 高血压、高胆固醇心血管事件的差别; 不同病情、病程、严重程度的预后比较; 不同心理、营养、免疫状态的疾病结局 ; 不同行为因素对疾病发生及预后的影响等。

常见暴露因素 2: 接触(曾接触)某可疑毒物或化学物质等; 习惯食用(曾食用)某种(些)食物; 具有某(些)行为,如:吸烟或饮酒、长期 上网,长期熬夜,滥用药物等; 从事某种职业,如:石棉工人、翻砂工人、 高空作业、司机、教师、炊事员等。

暴露组: 暴露于(接受)某因素的队列。 非暴露组: 未暴露于(未接受)该因素的队列。 如:临床评价某种疗法或药物的效果或副作用时, 在患同一种病人中: 暴露组:接受该疗法或某药物的病人, 非暴露组:接受其它某疗法或药物的病人。

人数 比较 a + + a/(a+c) 有差异? c + b - b/(b+d) d 研究时向:因 果 图2-4-1 队列研究示意图 疾病及 图2-4-1 队列研究示意图 疾病及 其结局 人数 比较 接受某种治疗措施与否 临床研究模式:临床患者 自然状态下 a + + a/(a+c) 有差异? 随访观察 c 研究 对象 + b 病因研究模式:无病人群 自然状态下 - b/(b+d) d 暴露 与否 研究时向:因 果

2. 队列研究的人群类型 (1)固定队列(fixed cohort) 研究对象在固定时期或一个短时期 之内进入队列并随访至终止,不加 新成员。 (2)动态队列(dynamic cohort) 某时期确定队列后,可随时增加新 的观察对象。

3. 队列研究的方法类型 (1)前瞻队列 (2)历史队列 (3)双向队列 (4)病例队列 E E E E E E 3. 队列研究的方法类型 (1)前瞻队列 (2)历史队列 (3)双向队列 (4)病例队列 研究开始 历史性队列 研究开始 前瞻性队列 E 追溯收集历史资料 继续追踪收集资料 E E 双向性队列 E E 追踪收集资料 E 过去 现在 将来 图2-4-2 前三种队列研究方法类型

(1)前瞻性队列(prospective cohort ) 例:Johnson等人(1981年)评价骨髓移植术 治疗急性白血病的效果。 存活 11例 9例处于 缓解阶段 24例首次化疗后 接受骨髓移植术 的急性白血病儿 E 急 性 白血病 患 儿 死亡 13例 追踪 观察 两年 存活 2例 1例处于 缓解阶段 21例首次化疗后 复发又接受化疗 的急性白血病儿 不能 随机 分组 E 死亡 19例 现在 2年后 现代医学认为,没有理由认为HLA与急性白血病存活有联系。两组病人生存差异完全可能是两种疗法的差异。 特点:可信性强;观察时间长,定期随访;费时间、人、物力。

(2)历史性队列(historical cohort study) 又称回顾前瞻性研究(retrospective prospective study); 非并行队列研究(non-concurrent cohort study) 或数据库研究(database study)。 该方法暴露组和非暴露组的确定要根据过去 某时期暴露于某因素情况而定。观察结局(如: 发病或死亡)在研究开始时就可以从历史资料中 获得。其观察时间提前,而非由果到因的观察, 故该研究方法本质上属于前瞻性研究,资料收集 及分析可在较短时间内完成。

冠脉支架 1年期靶血管血运重建(TVR)临床 结果,共1558例。 例:波士顿科学公司2006年回顾比较了应用两种 冠脉支架 1年期靶血管血运重建(TVR)临床 结果,共1558例。 紫 杉 醇 药物释放冠脉支架 TVR 3.2% 两种冠 脉支架 接受者 P=0.23 雷帕霉素药物释放冠脉支架 TVR 4.4% 1年前 现在 但在糖尿病患者中,紫杉醇支架的TVR发生率明显低于雷帕霉素 支架(2.8%:8.5%),P=0.004。 提示:糖尿病患者用紫杉醇支架疗效优于雷帕霉素支架。 特点:时间短、省人、物力、出结果快;暴露与结局跨度时间长、偏倚大。

(3)双向性队列(ambispective cohort ) 紫 杉 醇 药物释放冠脉支架 紫 杉 醇 药物释放冠脉支架 两种冠 脉支架 接受者 结果 雷帕霉素药物释放冠脉支架 雷帕霉素药物释放冠脉支架 1年前 现在 2年后

(4)病例队列研究(case cohort ) 该方法将队列设计和病例对照研究设计相互 交叉,融合两者的优点后形成的一种设计方法。 按一定比例 子队列(对照) R 随访一定时间 收集欲研究疾病 结局或发病者 全队列 剩余者 用一定统计方法比较随访后两组资料,以探讨 影响结局(疾病)发生、生存时间和预后等的因素。

资料分析时,子队列中的发病病例需要 排除于子队列分析。 要求病例与对照都来自于界定明确、有 基线资料记录的队列,暴露史的质量较高, 还可以有病例尚未发病时的实验室检验记录, 而且可以省去对占绝对多数的未发病成员的 暴露史调查。

4. 三类队列研究的优缺点 表2-4-1 三类队列的优缺点 名 称 优 点 缺 点 前瞻队列(即时性) 偏倚小 时间长、工作量 和费用大 4. 三类队列研究的优缺点 表2-4-1 三类队列的优缺点 名 称 优 点 缺 点 前瞻队列(即时性) 偏倚小 时间长、工作量 和费用大 历史队列(非即时性) 时间短、 准确性差 结果快 双向队列 相对弥补

5. 选用不同队列研究类型的原则 1)应有明确的检验假设,检验的因素必须找准; 选择队列研究前,需根据具体情况 考虑不同类型队列的优缺点。 5. 选用不同队列研究类型的原则 选择队列研究前,需根据具体情况 考虑不同类型队列的优缺点。 (1)选择前瞻性队列时,应重点考虑: 1)应有明确的检验假设,检验的因素必须找准; 2)所研究疾病的发病率或死亡率应较高,如: 不低于5‰。

3)应明确规定暴露因素,并且应有把握获得观察 人群的暴露资料。 4)应明确规定结局变量,如:发病或死亡,并且 要有确定结局的简便、可靠的手段。 5)应有把握获得足够的观察人群,并将其清楚地 分成暴露组与非暴露组。 6)大部分观察人群应能被长期随访,并取得完整 可靠的资料。 7)有足够的人、财、物力支持该项队列研究工作。

(2)选择历史性队列研究时,除考虑前述 1)~5)点,还应考虑是否有足够量的、 完整可靠的过去某段时间内有关研究 对象的暴露和结局的历史记录或档案 材料。 如:医院的病历、个人的医疗档案、 及工厂和车间的各种记录等。在具备条件 的情况下,可以应用历史性队列研究 设计方法。

(3)选择双向性队列研究时,应考虑: 在具备进行历史队列研究的基础上, 如果从暴露到现在的观察还不能满足 研究的要求,需继续前瞻性观察一段 时间时,则选用双向性队列研究。

二、队列研究的主要内容 1. 确定研究因素、分组和暴露因素分级 (1)研究因素与分组的确定 1)因素多为已被病例对照研究、临床经验和/或 1. 确定研究因素、分组和暴露因素分级 (1)研究因素与分组的确定 1)因素多为已被病例对照研究、临床经验和/或 现况研究初步验证的暴露因素。 对暴露因素必须有明确的规定,即定性和/或 定量的规定。

如:探讨脑卒中患者急性期低血脂水平与 神经损伤严重程度关系时,定义血清总胆固醇 (TC)和甘油三酯(TG): 低 < 610 mmol/L 高 ≥ 610 mmol/L 低 < 210 mmol/L 高 ≥ 210 mmol/L TC TG

又如:探讨吸烟与肺癌之间的因果联系时, 纸烟 雪茄烟 烟斗烟 吸烟 不吸烟 ① 定性 吸烟量/日 吸烟年限 ② 定量 ③ 半定量 暴露因素与疾病之间有无剂量反应关系 是判断它们之间有无因果联系的重要条件。

根据暴露因素可将研究对象分为: 暴露组 (暴露亚组) 非暴露组 (非暴露亚组) 严重暴露 中度暴露 轻度暴露 如:暴露水平: 按吸烟支数/日

(2)收集研究对象暴露因素的暴露资料方法 通过直接调查询问或信访获得研究对象的暴露 情况。如:吸烟习惯、饮食习惯,年龄等。 2)医学检查 l)调查问卷 通过直接调查询问或信访获得研究对象的暴露 情况。如:吸烟习惯、饮食习惯,年龄等。 2)医学检查 如:测量血清胆固醇,血红蛋白水平等; 测量血压、身高或体重; 收集心电图、X光检查资料。 3)相关记录 如:病历、健康卡、门诊记录、预防接种卡等 4)环境检测 如:检测环境有害物质含量。

收集暴露资料时要注意收集队列研究开始前 研究对象的暴露年限,如:探讨吸烟与肺癌关系时, 要了解队列研究开始前每个研究对象吸烟年限。 有些研究较融易收集暴露年限,有些则不容易收集, 如:探讨胆固醇与心脏病之间联系,除非每个研究 对象有以前历史记录,大部分情况下无法知道研究 对象的暴露年限。 了解暴露年限对确定研究对象及队列研究追踪 观察期有指导性意义。

2. 研究对象的选择 (1)研究对象的条件 1)临床研究 满足临床诊断标准、纳入标准并不能被 排除的患者,有无特征的两个队列应有 2. 研究对象的选择 (1)研究对象的条件 1)临床研究 满足临床诊断标准、纳入标准并不能被 排除的患者,有无特征的两个队列应有 较大的可比性。 2)病因研究 目前未患某研究结局疾病,在 观察期间 可能发生研究结局疾病的人群。

3)暴露与非暴露分组 队列研究根据研究因素将研究对象分为 暴露组与非暴露组。若研究因素(暴露 因素)属于分类变量 如:心电图正常与不正常, 心电图不正常 暴露组 心电图正常 非暴露组 如果暴露因素是连续变量,如:胆固醇 水平,可将暴露水平分为几个级别(亚组), 暴露水平最低者为非暴露组。

(2)暴露组的选择(有暴露因素值得研究) 1)医院内各种患者:不同干预措施的比较. 2)人群中的患者:结果具有代表性。观察 费用高,易失访。如:阿司匹林与冠心病复发。 3)医疗人寿保险:如:心电图正常与异常的观察。 4)有组织的人群团体:如:健康体检。 5)特殊暴露人群:如:射线 白血病。 6)职业人群

(3)非暴露组的选择 1)内对照 在选定的一组研究人群内部形成了对照组为 内对照。如:高血压病人服用两种药物的对照。 2)外对照 暴露组选自特殊暴露或职业人群时,需在 该人群外寻找对照组。如:研究教师与静脉曲张, 选择教师以外的人作对照。 3)同时设内对照与外对照 可同时设立内对照与外对照,以便增加判断 因果联系依据及减少只用一种对照带来的偏倚。

1)两组人群的基本特征,如:疾病严重程度、 (4)暴露组与非暴露组的可比性 1)两组人群的基本特征,如:疾病严重程度、 病期、病理类型、年龄、性别、民族、职业、 文化程度、经济状况等是否可比。 2)两组在追踪观察过程中发现/检测所研究 疾病及其结局的手段或标准是否可比。

结局指追踪观察中出现的预期结果的事件。 (1)存活结局 发病、治愈、副作用显现、疾病复发等, 严格的标准:不同型、期、轻重程度。 3. 观察结局的确定 结局指追踪观察中出现的预期结果的事件。 要按国际或国内统一标准确定诊断。 (1)存活结局 发病、治愈、副作用显现、疾病复发等, 如:高血压与冠心病之间的关系,观察结局 为冠心病的发生。 严格的标准:不同型、期、轻重程度。 (2)死亡结局:注意其它死亡。 (3)结局指标:影像、生化等客观指标。

(1)临床观察:依据事件发生时间和量而定并要结合 (2)病因研究:考虑诱导期(完成充分病因过程)和 4. 追踪观察期间的确定 (1)临床观察:依据事件发生时间和量而定并要结合 疗程。 (2)病因研究:考虑诱导期(完成充分病因过程)和 隐伏期(病因过程完成到疾病发现前时间)。如: 评价日本原子弹爆炸后幸存者发生恶性肿瘤危险时, 没必要在原子弹爆炸发生即开始随访,应根据评价 恶性肿瘤特征最短诱导期和隐伏期,在原子弹爆炸 数月后或数年后开始随访,尽量缩短观察期,节约 人力、物力、经费并减少失访。 队列研究开始前,对最短诱导期和隐伏期应做出 恰当估计,以合理确定随访观察期限。

5.样本含量的确定 (1)估计非暴露组的发病率(P0) 一般无法精确地估计非暴露组发生率。 队列研究样本含量估计中常用一般人群 发生率代替非暴露组发生病率。 (2)估计的该因素引起的相对危险度 (3)所希望达到的检验显著性水平(α) (4)所希望达到的检验把握度(1-β) 把握度也称检验效力,要求(1-β) 越大,则需要的样本量也越大。

(5)队列研究样本含量计算公式:(P35) ) ( P q p Z n - + = b a 2 1 ) ( P q p Z n - + = b a 式中:P1为暴露组发生率, q1=1-p1 , q0=1-p0 P0为非暴露组发生率,p=(p0+p1)/2, q=1-p z α和z β分别为与α、β值相对应的 标准正态分布分位数。

表2-4-2 标准正态分布的分位数表 α或β Zα (单侧检验) Zβ (单侧和双侧) Zα (双侧检验) 0.001 3.090 3.290 0.002 2.878 3.090 0.005 2.576 2.807 0.010 2.326 2.576 0.020 2.058 2.326 0.025 1.960 2.242 0.050 1.645 1.960 0.100 1.282 1.645 0.200 0.842 1.282

n= = 3892.1 例:拟用队列研究探讨孕妇服用某种药物与婴儿先天 心脏病之间的联系。 已知:非暴露孕妇生先天性心脏病婴儿的发生率 为8‰,估计RR为2,设α=0.05(双侧),β=0.10。 求:样本含量。 Z = 1 . 96 , Z = 1 . 282 , p = . 008 , q = . 992 , a b P = RR × p = 2 × . 008 = . 016 , q = . 984 1 1 P = ( . 008 + . 016 ) / 2 = . 012 , q = . 988 代入公式: (1.96√2×0.012×0.988+1.282 √ 0.016×0.984 + 0.008×0.992) (0.016-0.008) 2 n= = 3892.1 2

计算结果:暴露组与非暴露组各3892人。 如果暴露因素与疾病之间真的存在因果联系, 队列研究选择3892人作暴露组,再选择3892人作 非暴露组。 在0.05显著水平上,检出暴露组与非暴露组 发病率之间差异的可能性为90%。 队列研究容易发生失访。考虑失访的可能性, 须加10%的样本量,两组各实际需要样本量为: n=3892/0.9=4324人。 暴露组与非暴露组各需要至少4324人。

三、随访资料的收集 1. 收集的主要内容 追踪暴露组与非暴露组的每个观察 对象发生研究结局指标。 2. 收集资料的方法 1. 收集的主要内容 追踪暴露组与非暴露组的每个观察 对象发生研究结局指标。 2. 收集资料的方法 (1)从常规登记中收集结局资料 如:病历、传染病报告、尸检报告或 生命 统计,出生死亡登记等。 (2)定期健康检查 定期体检以确定疾病发生情况。

(3)随访收集结局资料时的注意事项 1)随访中,确定结局情况的方法在暴露组与 非暴露组应当一致。 2)若以死亡为观察结局时,不能简单地接受 死亡证书的诊断,还要从临床病历来收集 其他资料,如:病理诊断、实验室诊断、 尸检结果等,以进一步核实死亡原因。

3)用定期健康检查方法收集结局资料时,最好用 双盲法处理暴露组与非暴露组,否则,有时在 暴露组和非暴露组检出疾病的机会是不同的。 如:研究暴露于石棉和间皮瘤联系时,当检查 医生知道受检者是从事生产石棉制品工人时, 容易将该受检者诊断为间皮瘤。 4)随访期间,暴露组和非暴露组的观察对象可能 改变原来暴露于暴露因素的状态,要注意收集 队列变换资料。

四、资料分析 队列研究资料分析的主要任务  计算暴露组与非暴露组的发生率;  比较、检验两组间的差异;  计算暴露组与非暴露组的发生率;  比较、检验两组间的差异;  评价暴露因素与疾病结局的因果关系;  为诊治疾病咨询提供客观依据。

根据统计分析的要求,队列研究的 资料一般整理成表2-4-3的模式。 表2-4-3 队列研究资料归纳整理表 病例 非病例 合计 发病率 资料一般整理成表2-4-3的模式。  表2-4-3 队列研究资料归纳整理表   病例 非病例 合计 发病率 暴 露 组 a b a+b=n1 a/n1 非暴露组 c d c+d=n0 c/n0 合 计 m1 m0 t 式中a/n1和c/n0分别为暴露组的发病率和 非暴露组的发病率,是统计分析的关键指标。

(1)发病密度(Incidence density, ID) (死亡密度) 1)定义 某人群中新病例(死亡)数与该 1.疾病发生(死亡)频率的测量 (1)发病密度(Incidence density, ID) (死亡密度) 1)定义 某人群中新病例(死亡)数与该 人群中所有个体观察时间和之比。    I 2)公式 ID= ΣTi ID 为发病密度 I 为观察期间内新病例。 ΣTi 为每个观察对象的观察时间之和。

å 从发病密度定义可见,发病密度表示 单位时间内新病例数的变化。 发病密度的分母(观察时间之和)常用 人时(Person Time)来表示。 那么,上述公式可表示为: P å = i T I ID 式中: I 为新病例数, 为观察人时。 i å T P 估计发病密度需要计算人时,人时可用暴露人日、暴露人月或暴露人年表示,常用的是暴露人年。

假设随访观察 101人,观察时间为 3年。 若在3年内101人中没有发生疾病,也未失访, 每个人观察了 3年,暴露人年为: 101×3=303人年; 如果观察 3年期间内,观察到 1年时出现 1个 病例,观察至 2年时出现 2个病例,余98人观察了 3年,那么, 暴露人年=1×1+2×2+98×3=299人年; 其 ID=3/299≈0.01人年。

3)适用条件 ① 观察人数足够多 ② 观察人口不固定 ③ 资料不整齐(含终检人资料) 终检人: 当年进入观察队列的人; 失访的人; 含有不满整年部分的人; 改用其他疗法的人; 死于其他病的人。

4)注意点 ① 发病密度有时间单位 (人时数:人日、人周、人月、人年) ② 随单位时间的改变,发病密度值发生变化, 但意义不变。 如:1000 /世纪=10 /人年 =0.83 /人月 =0.192 /人周=0.027 /人日

队列研究观察期间内,由于随时增加 一些观察对象,或观察对象迁移它处,或 其他原因死亡或退出研究造成失访,造成 观察对象观察的时间不一致。这种情况下 要计算发病密度,即人年发病率。 计算发病密度时,需要计算暴露人年。 人年计算方法如下:

5)人年的计算方法 ① 小样本暴露人年的计算 1人年=1人×1年 ② 大样本暴露人年的计算 人年数=(年初人数+年末人数)/2 ③ 寿命表法计算暴露人年

 ① 小样本暴露人年计算 图2-4-3 7名观察对象随访结果 1 2 3 4 5 6 7 4.5 2.5 6.0 3.5 4.0  0 1 2 3 4 5 6 7 死于其它疾病 发病 时间(年)  发病并死亡 失访 图2-4-3 7名观察对象随访结果 暴露人年=4.5+2.5+4.5+6.0+3.5+4.5+4.0=29.5人年 发病密度=3/29.5=0.1人年 优缺点:计算精确,但费时。

② 大样本暴露人年计算 大样本暴露人年的计算原则是:观察人群 年初人口数与年末人口数之和除以 2 为当年 暴露人年数。如:某队列从1972年12月31日开始 至1981年12月31日为止共观察随访 9年。自开始 观察日起,从各工厂医务室、劳资科收集观察 对象中死亡名单、死亡日期、死因、离厂外调和 新调进厂名单及时间。每年12月31日存活人数 见下表:

优缺点:计算相对简单,但精确性相对差。 以小于45岁为例,合计暴露人年数为: 表2-4-4 男性各年龄组各年末存活人数 年龄组 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 暴露人年 <45 607 547 471 392 323 246 210 179 148 110 2875.5 45~54 598 596 604 599 603 625 598 562 538 510 5279 55~64 369 406 433 472 493 496 529 524 513 526 4303.5 ≥65 62 75 95 111 132 158 180 210 251 286 1386 合 计 1636 1624 1603 1574 1552 1525 1507 1475 1450 1432 13844 以小于45岁为例,合计暴露人年数为: (607+ 547)/2+(547+471)/2+……+(148+110)/2=2875.5人年 9年内共有3名死亡。男性45岁以下组的死亡密度为: 3÷2875.5×10万=104.3/10万人年 优缺点:计算相对简单,但精确性相对差。

 观察当年内进入队列的个人均作1/2 个人年计算;  失访或出现结局的个人也作1/2人年计算。 公式: ③ 寿命表法计算暴露人年  观察当年内进入队列的个人均作1/2 个人年计算;  失访或出现结局的个人也作1/2人年计算。 公式: 2 x W D N I L - + = ) ( 1 + Lx: x 时间的暴露人年数。 Ix: x 时间开始人数。 Nx: x时间内进入队列人数。 Dx: x时间内出现结局的人数。 Wx: x时间内失访人数。 Ix+1=Ix+ Nx- Dx- Wx(下一年开始的人数)

表2-4-5 应用寿命表法计算人年数 ID=37/13336.5=2.77‰人年 观察 年初 年内进 年内发 年内失 暴 露 表2-4-5 应用寿命表法计算人年数 观察 年初 年内进 年内发 年内失 暴 露 年数 人数 入人数 病人数 访人数 人年数 X Ix Nx Dx Wx Lx (1) (2) (3) (4) (5) (6) 1 1403 79 4 30 1425.5 2 1448 45 2 11 1464.0 3 1480 60 3 8 1504.5 4 1529 5 2 19 1521.0 5 1513 10 7 25 1502.0 6 1491 18 8 29 1481.5 7 1472 13 3 73 1440.5 8 1409 12 5 74 1375.5 9 1342 9 2 467 1112.0 10 882 3 1 819 473.5 11 65 0 0 57 36.5 合计 14034 254 37 1612 13336.5 人年 ID=37/13336.5=2.77‰人年

(2)累积发病率(cumulative incidence, CI) (累积死亡率) 1)定义 一定期间内,在固定的人群中,从 未患某种疾病变为患这种疾病的人 所占的比率。 I 2)公式 CI= ×100% P I 为观察期间发生的新病例数。 P 为暴露人口数。

3)适用条件 ① 观察人数足够多 ② 观察人口固定(固定队列) ③ 资料整齐 4)注意点 ① 无时间单位(概率) ② 应考虑、注意观察时间 比较累积发病率时,一定要注意观察期期间。 如:某病的累积发病率为3%,若观察期间为40年, 这个累积发病率较低,如果观察期间为40天,这个 累积发病率较高。

5)举例:1960年美国Georgia州、Evans县、Cassel 研究对象:40~70岁 白人男性、无冠心病者609人 研究因素:血液中儿茶酚胺水平 研究结果:见表2-4-6: 表2-4-6 追踪观察(随访)7年结果 冠心病+ 冠心病– 合计 CI(%)年发病率(%) E 27 95 122 22.1 3.16 E 44 443 487 9.0 1.29 合计 71 538 609 CI1 = 27/122×100% = 22.1% CI0 = 44/487×100% = 9.0% ↑暴 露 组 122名 ↓非暴露组 487名

(1)相对危险度(Relative risk, RR) 1)定义 2.暴露因素致病效应指标的测量 (1)相对危险度(Relative risk, RR) 1)定义 指暴露组发病(死亡)密度与非暴露组的 发病(死亡)密度之比,又称率比(rate ratio, RR)。或暴露组的累积发病率(死亡率)与 非暴露组的累积发病率(死亡率)之比,又称 危险比(risk ratio,RR)

ID1为暴露组的发病(死亡)密度, = CI1/ CI0 CI1为暴露组的累积发病(死亡)率, 已知当该病的累积发病率较低和观察时间 ID 2)公式: RR=〔a/(a+b)〕/〔c/(c+d)〕 = ID1/ ID0 ID1为暴露组的发病(死亡)密度, ID0为非暴露组发病(死亡)密度。 = CI1/ CI0 CI1为暴露组的累积发病(死亡)率, CI0非暴露组的累积发病(死亡)率。 已知当该病的累积发病率较低和观察时间 较短时 ID · t 1 CI RR = D 注意:临床研究RR值的解释要结合研究实际。

3)联系强度 相对危险度表示了暴露组发病或死亡危险 是非暴露组的多少倍,说明了假设因素与疾病 的联系强度。 ID1= ID0或Cl1= Cl0时, RR=1,无联系。 ID1>ID0或CI1>CI0时, RR>1,危险因素或有害因素。 ID1< ID0或CI1<CI0时, RR<l,保护因素或有益因素。

表2-4-7 相对危险度的联系强度 相对危险度 联系强度 0.9 ~ 1.0 1.0 ~ 1.1 无 0.7 ~ 0.8 1.2 ~ 1.4 弱 0.4 ~ 0.6 1.5 ~ 2.9 中等 0.1 ~ 0.3 3.0 ~ 9.0 强 < 0.1 > 10.0 很强

例:某项研究获得下列肺癌死亡率资料 1)吸烟者肺癌死亡率0.96‰/人年。 2)非吸烟者肺癌死亡率0.07‰/人年。 3)人群中肺癌死亡率0.56‰/人年。 4)人群中吸烟者比例为55%。 吸烟与肺癌的相对危险度为: RR=0.96‰人年/0.07‰人年 =13.7 结果说明:吸烟者死于肺癌危险性为 非吸烟者13.7倍。

var(LnRR)=1/ a +1/ b +1/ c +1/ d Miettinen法: ORL,ORU=OR(1±1.96/√χ ) 保护因素应强调上限<1。 RR值95%可信区间 = LnRR±1.96√var(LnRR) 的反自然对数。 var(LnRR)=1/ a +1/ b +1/ c +1/ d Miettinen法: ORL,ORU=OR(1±1.96/√χ ) 2

(2)归因危险度(Attributable risk,AR; 特意危险度;率差) 1)定义 暴露组与非暴露组发病(死亡)密度(ID1、ID0) 之差或暴露组累积发病(死亡)率与非暴露组 累积发病(死亡)率( CI1、CI0)之差。 2)公式 AR= ID1–ID0 = ID0(RR –1) =CI1–CI0 = CI0(RR –1)

AR 指发病(死亡)的危险特意归因于 暴露因素的程度,即完全由暴露因素引起的 发病或死亡多高,评价暴露危险更直接真实。 上例资料,吸烟与肺癌的归因危险度为: AR= 0.96‰人年-0.07‰人年 = 0.89‰人年 结果说明,吸烟者中由于吸烟所致的 肺癌死亡率为0.89 ‰/人年。 估计和评价归因危险度时要注意: 如果暴露因素与疾病之间无因果联系, 所估计的归因危险度是没有根据和意义的。

3)RR与AR意义的异同点 RR与AR都是描述暴露因素致病效应指标。 RR:说明暴露对于个体而言,使其能比未暴露 情况下增加相应疾病的多少倍。 具有病因学意义。 AR:对于人群而言暴露能比未暴露情况下增加 超额疾病的数量。若该暴露因素消除,可 减少这超额数量病例的发生。 具有疾病预防和公共卫生学的意义。

Etiologic fraction, EF;特异危险度百分比) 1)定义 (3)归因危险度百分比(AR%;病因分值 Etiologic fraction, EF;特异危险度百分比) 1)定义 在暴露人群中由于暴露因素而导致的发病(死亡) 占暴露者的发病(死亡)的百分比。 说明在暴露人群中有百分之多少病例可通过阻止 或减少暴露于该因素来预防此疾病的发生。 2)公式 AR%=〔(ID1–ID0) / ID1 〕×100% =〔(CI1–CI0) / CI1 〕×100% =〔(RR – 1)/RR 〕×100%

上例资料,吸烟与肺癌的归因危险度 百分比为: 0.96‰人年-0.07‰人年 AR%= ×100% 0.96‰人年 =92.7% 结果表明,吸烟者中92.7%的肺癌死亡 是由吸烟引起的。

探讨X光射线与乳腺癌间的联系,Boice等人选择了 3.密度资料的分析 探讨X光射线与乳腺癌间的联系,Boice等人选择了 因患肺结核反复接受X光透视检查的妇女为暴露组。 选择患肺结核但接受X光透视很少的妇女为非暴露组, 然后追踪观察。结果见下表: 表2-4-7 暴露组与非暴露的乳腺癌发病密度比较 47027(T) 19017(N0) 28010(N1) 人年数(随访人年数) 56(M1) 15(b) 41(a) 乳腺癌(随访中发病) 合计 非暴露组 暴露组 (Boice and Monson,1977)

(1)发病密度的计算 暴露组乳腺癌ID1 = I/PT = 41/28010 (2)相对危险度的计算 = 1.46‰/人年 非暴露组乳腺癌ID0 = I/PT = 15/19017 = 0.79‰/人年 (2)相对危险度的计算 RR=ID1 / ID0 =1.46‰÷0.79‰ =1.85

(3)X光射线与乳腺癌之间联系的显著性检验 H0:RR=1 56 41 - 28010 ( ) a - N M / T 47027 χ = 1 1 = = 2 . 08 score 2 T N M 1 ) 47027 ( 19017 28010 56 2 × 从标准正态分布表查χ =2.08,P=0.019 结果说明X光线与乳腺癌之间有显著性联系。 score

(4)95%可信区间的估计 = = 1.86 RRL, RRU RR RRU=1.86 =3.34 RRL=1.86 =1.08 ( 1±Z / χ ) = 1.86 ( 1 ± 1 . 96 /2.08 ) RRL, RRU RR RRU=1.86 =3.34 (1+1.96/ 2.08 ) (1-1.96/ 2.08 ) RRL=1.86 =1.08 结果表明,其95%可信区间: RR上限为3.34,下限为1.08。总体相对 危险度有95%可能在1.08 ~3.34之间。

4.累积发病率资料的分析 以表2-4-6为例,累积发病率资料分析如下: (1)累积发病率的计算 暴露组(高儿茶酚胺组)的累积发病率: CI1=27÷122×100%=22.1% 非暴露组(低儿茶酚胺组)的累积发病率: CI0=44÷487×100%=9.0% (2)相对危险度的计算 RR=22.1%÷9.0%=2.44

(3)儿茶酚胺与冠心病之间联系的显著性检验 H0:RR=1 (儿茶酚胺与冠心病之间无联系) H1:RR≠1 (儿茶酚胺与冠心病之间有联系) 22 . 71 ) 27 2 ( × 443 - 44 × 95 × 609 χ 2 = = 16 (P<0.01) 122 × 487 × × 538 结果表明,儿茶酚胺与冠心病之间有高度 显著的联系。

(4)95%可信区间的估计 2.44 RRL,RRU = RR = 2.44 RRU = 77 . 3 = = 2.44 RRL 58 . (1±1.96/√16.22) RRL,RRU = RR ( 1 ± Z / √ χ 2 ) = 2.44 (1+1.96/√16.22) RRU = 77 . 3 = = 2.44 (1-1.96/√16.22) RRL 58 . 1 = 结果表明,其95%可信区间: RR上限为3.77,下限为1.58。总体相对危险度 有95%可能在1.58 ~3.77之间。

5.队列研究的多因素分析 (1)控制混杂因素 分层分析 Logistic 模型 Cox 模型 (2)发病密度资料 (3)累积发病率资料

五、队列研究的偏倚及其控制 1.常见偏倚 (1)选择性偏倚 (2)失访偏倚 (3)测量偏倚 (4)混杂偏倚 研究对象:有人拒绝参加,志愿者组成; 历史性队:列档案丢失或记录不全等。 (2)失访偏倚 迁移、死于其他疾病、因某种原因退出等 (3)测量偏倚 判断暴露为无暴露或判断无暴露为暴露; 误诊、漏诊等。 (4)混杂偏倚

2. 控制方法 (1)严格按入选标准选择观察对象及分组。 (2)了解志愿者与非志愿者的不同特点, 有助于全面解释研究结果。 (3)提高观察对象的依从性。 (4)尽最大可能了解失访者的结局,并与 随访者结果进行比较。

六、队列究的优势与局限 1. 优势 (1)可以计算事件发生率 队列研究结果可计算疾病发生、结局或药物 不良反应的发生率,可精确评估疾病、治疗 1. 优势 (1)可以计算事件发生率     队列研究结果可计算疾病发生、结局或药物 不良反应的发生率,可精确评估疾病、治疗 效果或药物不良反应发生的危险程度。队列 研究是评价药物不良反应的最佳设计,可以 对多种药物不良反应结果进行研究,预测从 暴露到事件发生的时间。

(2)可直接分析因果关系 队列研究是由因及果的方法,可直接得到 各组的发病率或死亡率等,计算出RR和 AR等指标,故可直接分析暴露因素与 疾病发生或结局之间的因果关系;

(3)结果相对可靠 虽然观察性方法有其局限性,但队列研究对 个体及其暴露(治疗)情况进行了长期随访, 并获得客观结局的发生信息。在控制选择性 (3)结果相对可靠     虽然观察性方法有其局限性,但队列研究对 个体及其暴露(治疗)情况进行了长期随访, 并获得客观结局的发生信息。在控制选择性 偏倚和减少失访前提下,其结果具有较高的 可信度,常常成为医疗卫生服务、政策制定 和诊疗措施评价的重要证据来源。 队列研究结果还可以进行Meta-分析,获得 大样本、不同人群观察结果的汇总效应。

(4)循证医学证据级别仅次于RCT 队列研究使用前瞻性研究设计,研究者可以 决定纳入标准、测量指标及如何最佳测量等   队列研究使用前瞻性研究设计,研究者可以 决定纳入标准、测量指标及如何最佳测量等 问题;可观察到由暴露(治疗)引起的结果; 收集资料可以采用客观、统一的方式(如: 数据库),有利于正确收集资料,是回顾性 研究通常不易做到的。

队列研究的数据可以是来自常规收集的数据, (5)相对容易完成     队列研究的数据可以是来自常规收集的数据, 也可以是专门为研究而收集的数据或二者的 结合,相对容易完成,其研究成本较RCT低。 如:对某疾病预后的研究可以从患者历年的 住院病历中获得,也可从长期随访的数据库 中获取。 (6)有助于了解疾病自然史   

总之,队列研究资料和结果是观察获得的,对 常规临床医疗无人为干预,其研究结果更符合实际, 推广运用价值较RCT大;可以直接估计观察对象的 发病率或病死率等疾病结局;可比较不同地区人群; 可直接估计暴露(治疗)与结局的关联程度,推断 因果关联,直接计算相RR或AR;较适合于常见病 的研究;观察同期进行,可严格控制沾染与干扰, 可使潜在的混杂因素减小到最低限度。

2. 局限 (1)研究周期长 (2)需较大样本量 发生率不高或潜伏期短的疾病或不良反应, 队列研究花费时间长,研究成本较高。 2. 局限 (1)研究周期长     发生率不高或潜伏期短的疾病或不良反应, 队列研究花费时间长,研究成本较高。 (2)需较大样本量   队列研究需大量样本,但很难收集到足够 病例,尤其是观察罕见或不常见的疾病时, 很难找到足够的病人来获得暴露与非暴露 之间临床上或统计学上的显著差异。

(3)易失访 (4)产生偏倚 研究时间过长,不可避免增加病人失访率,致使 资料收集不完整、不充分;   研究时间过长,不可避免增加病人失访率,致使 资料收集不完整、不充分; (4)产生偏倚 1)研究时间长可能改变各组对象的行为方式而造成 错误分组偏倚; 2)若进行历史性队列研究,信息仅从现有数据库的 历史资料中获得,如:医院的病案记录,病例的 诊断标准和暴露标准可能会不一致,且病历多为 主观性描述,使得解释测量方法或结果可能产生 偏倚,可靠程度受到质疑。

1)队列研究不适用于评估治疗主观结局的效果, (5)不适用于某些结局    1)队列研究不适用于评估治疗主观结局的效果, 如:症状改善;研究结果有时难以被重复。 2)不适于发病率很低疾病的病因研究。 The end

Thank you !