第十二章 队列研究 邹焰
第一节 概念 一、概念 队列研究(cohort study)是选定暴露于某因素及末暴露于该因素的两组或不同暴露水平的人群,追踪观察一定的时间,比较各组人群疾病结局发生率的差异,从而判断所研究因素与疾病之间有无因果关联及关联强弱的一种观察性研究方法。
队列(Cohort)是指共同暴露于 (或未暴露于)某一因素 、某一环境,或者具有 (或不具有)某种共同特征的一组人群。 暴露(exposure)是指研究对象接触过某物质,具有某特征或行为,或处于某种状态。这些因素、特征或状态即为暴露因素。 暴露因素可以是机体的特征,也可是体外的;可是先天的、人体固有的,也可是后天获得的;暴露因素对人体可以是有害的,也可以是有益的。
在队列研究中研究对象必须是末患所研 究结局疾病的人群。 暴露于某研究因素的研究对象称为暴露组,末暴露于该因素的研究对象称为非暴露组。 两个组除暴露情况有差别外,其余各方面条件应基本相似,即要求两组具可比性,两个组所有观察对象都被同样地追踪一个时期,观察并记录其疾病结局的发生情况。
二、特点 1、属于观察法 暴露情况不是人为决定的,而是客观存在。 2、设立对照组 设立专门的非暴露人群用于对照比较。非暴露组(对照组)与暴露组可来自同一或不同的人群,但应具有可比性。 3、是由‘因“及 ”果“的研究 队列研究是先确定原因再前瞻观察其结果,故队列研究能明确提出暴露与疾病的时间关系,因此有很强的验证病因能力。
三、类型 按研究开始的时间不同可分为三类: 1、前瞻性队列研究(prospective cohort study) 研究对象的确定与分组是根据研究开始时的人群暴露情况确定的,随访观察一段时间后才能得到研究的结局。 前瞻性队列研究的最大优点是研究者可以直接获取暴露及结局的第一手资料,资料的偏性比较小。但如果需要观察大量人群,则花费太大;如果疾病的潜伏期很长,则需要观察的时所很长,所以进行该种队列研究难度很大。
2、历史性队列研究 (historical cohort study) 研究是现在开始的,起点是过去某个时间,研究对象的确定与分组是根据人群过去的暴露情况而定,研究的结局在研究开始时已经发生,研究暴露到结局的方向是由因到果的过程,而研究工作的性质是回顾性的。这种设计又称回顾性队列研究 。 历史性队列研究节省时间、人力和物力,出结果快,因而适宜于潜伏期长的疾病,且所研究的暴露因素有详细记录或有确凿证据可查的。但是历史性队列研究常常缺乏混杂因素的资料,以至影响可比性。
3、双向性队列研究 (ambispective cohort study) 将以上两种方法结合进行,即先进行历史性队列研究之后,继续进行前瞻性队列研究,称为双向性或混合性队列研究。这种研究具有上述两种研究的优点,在一定程度上弥补了它们各自的不足。
四、用途 1、检验病因假设 2、评价自发的预防效果 有时人群会自动发生由暴露状态改为非暴露状态,如有部分吸烟者自动戒烟,结果发现戒烟人群的肺癌发病率较吸烟人群降低,由此说明戒烟对预防肺癌有效。由于这种预防作用不是人为因素控制而是自发出现的,在队列研究中能观察到这种现象,并可以评价其预防效果,因此称为人群“自然实验"。 3、描述疾病的自然史
第二节 设计和实施 一、确定研究因素 队列研究只能确定一种或一组不同等级的暴露因素,该因素通常是在描述性研究或病例对照研究的基础上,高度怀疑与某疾病发生有关的因素。 导致疾病事件增加的暴露因素称为危险因素或致病因素,导致疾病事件降低的暴露因素则称为保护因素。 对于暴露因素必须在调查前有明确的规定,尽可能采用国内外统一的标准,最好能测量其暴露程度、接触年数、暴露是否连续等。
二、确定研究结局 结局 (outcome)亦称结局变量 (outcome variable),指研究者预期的结果事件,结局不仅限于发病,还可以是死亡或各种化验指标、生理特征的变化。 判断结局的标准应尽量采用国际或国内统一的标准,考虑到疾病的不同类型,不同的临床表现等,应详细记录观察者的症状、体征以及相关情况,以备详细分析使用。
三、研究方法的选择 (一)前瞻性队列研究的选择指征 1、要有明确的研究目的和检验假设 2、所研究疾病的发病率或死亡率一般不应太低 (>5‰)。 3、要有把握获得足够数量的观察人群和准确的暴露资料,并且能被长期随访,取得完整可靠的结局资料。 4、要有确定研究结局 (发病或死亡)的简便、可靠、可行的手段。 5、要有足够的人力、物力和财力保证研究的进行。
(二)历史性队列研究的选择指征 足够数量的完整可靠的记录或档案材料,是实施历史性队列研究最重要的前提,因为历史性队列研究完全依赖于有关暴露、疾病和生死状况的完整真实的历史记录。
四、研究对象的选择 (一)暴露人群的选择 暴露人群应该处在某种暴露因素中或已有某种特殊暴露史,并能提供可靠的暴露因素资料,且便于追踪和观察。 (1)特殊暴露人群或职业人群(特殊暴露人群指对其因素有高的暴露水平的人群) (2)一般居民 (3)有组织的人群团体
2、对照人群的选择 对照组人群选非暴露人群,与暴露组应具有可比性 。 (1)内对照:在同一研究人群中,采用没有暴露或暴露水平最低的人员作为对照即为内对照,这是最理想的对照。 (2)外对照:选与暴露人群条件接近的另一组非暴露人群作为对照组。 (3)总人口对照 (4)多重对照
五、样本含量的估计 (一)样本含量的决定因素 (1)非暴露组中所研究疾病的发病率(p0) (2)暴露组与对照组的发病率之差(d=p1-p2),或所研究因素与疾病的关联强度(p1=RR-p0) (3)统计学显著性检验水平(a) (4)效力或把握度 (power)为1一β
六、资料的收集 (一)基线资料的收集 基线资料即研究对象的基本情况,可通过以下方法得到: (1)记录或档案 (2)随访 (3)体检和实验室检查 (4) 环境调查与检测
(二)随访 1、观察终点和终止时间 研究对象出现了预期的结局,到此为止不再对该研究对象继续随访。 观察终止时间指全部观察工作的截止时间。 2、随访对象 所有被选定的研究对象。 3、随访内容和方法 包括基线资料和结局。 随访方法有询问、定期体检、环境与疾病的监测、医院病历档案、各种记录。
(三)质量控制 (1)培训调查员 (2)制定相应的规章制度 (3)盲法
第三节 资料的整理和分析 一、统计描述 二、统计推断 (一)资料整理 1、原始资料核查 2、资料编码、归纳、输入计算机
(二)率的计算 1、累积发病率 (cumulative incidence):当观察期间人群比较稳定,且能在较长一段时间内固定地维持观察,可以以观察时的人口数为分母,整个观察期内发病或死亡人数为分子计算累积发病率 (或死亡率)。
b、发病密度 (incidence density):若暴露人口不稳定,人群产生了较大的变动,应将变动的人群转变为观察人时数代替观察人数做分母,分子为观察期间发病或死亡人数,此种发病率称发病密度。观察人时数就是观察人数乘以观察时间,常用单位是暴露人年。
观察人时数的计算方法 (1)精确法 该方法是以观察个体为单位计算人时,先计算出每个人实际随访人时数,再将全部观察对象的人时数相加计算总人时数。
(2)近似法 该方法是用平均人数乘以观察时间得到总人时数。
(3)寿命表法 可用于观察人数多时,较近似法精确。
3、标准化死亡比 标准化死亡比(standardized mortality ratio,SMR)可用来衡量死亡的危险强度。
(三)率的差异显著性检验 若两组差异有统计学意义,说明暴露因素与疾病的关联不是由抽样误差造成,而是总体存在关联,则应进一步确定暴露因素与疾病的关联强度和关联方向。 (四)估计暴露与发病的关联强度 1、相对危险度(relative risk,RR) RR又称危险比或率比。指暴露组的发病率(或死亡率)与非暴露组发病率(或死亡率)的比值,是反映暴露与发病或死亡的关联强度指标。
2、归因危险度(attributable risk,AR)
3、人群归因危险度(population attributable risk,PAR)
4、全人群归因危险度百分比(PAR%) PAR%也称病因分值(PEF),是指总人群因暴露于某因素而导致的某病发病或死亡占总人群该病全部发病或死亡的百分比。
RR和AR同为估计暴露与疾病关联强度的指标,彼此关系密切,但其意义不同。 AR是对于暴露人群来说,在暴露情况下比非暴露情况下增加所致疾病的数量,消除暴露因素,就可以减少这一数量的疾病,具有疾病预防和公共卫生学意义。PAR和PAR%同样具有预防和公共卫生学意义。
第四节 队列研究的优缺点 一、队列研究的优点 1、比较适用于常见病 2、可以直接估计暴露因素与发病的关联强度 第四节 队列研究的优缺点 一、队列研究的优点 1、比较适用于常见病 2、可以直接估计暴露因素与发病的关联强度 3、研究是由“因”及“果”的观察,符合因果关系的时间顺序,检验病因假说的能力较强 4、一次调查可观察多种结局,即可调查一“因”多“果”
二、队列研究的缺点 1、不适于发病率很低疾病的病因研究,因为需要较大的人群,研究实施有一定困难 2、由于长期的研究与随访,因为死亡、退出、搬迁等造成的失访难以避免 3、研究费时间、费人力、花费高 4、每次研究只能研究一个或一组暴露因素