队 列 研 究 前瞻性研究(prospective study)、 发生率研究(incidence study)、 随访研究(follow-up study)、 纵向研究(longitudinal study)、 是分析流行病学研究中的重要方法,检验病因假设的效能优于病例对照研究。在病因流行病学研究中应用广泛。
第一节 概 述 一、概 念 二、基本原理 三、研究目的 四、研究类型
一、概念 队列研究的定义 暴露 危险因素 出生队列 暴露队列或队列 固定队列 动态人群
队列研究的定义 是将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。
暴露 是指研究对象接触过某种待研究的物质(如氟化物)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。暴露可以是有害的或有益的。
危险因素 危险因子,泛指能引起某特定结局(outcome)(如疾病)发生,或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。
队列(cohort) 的两种情况 1)出生队列(birth cohort): 是指特定时期内出生的一组人群。 2)队列或暴露队列:泛指具有某种共同暴露或特征的一组人群。如中国医大86期学生,有共同的入学时间。
队列的类别 根据人群进出队列的时间不同,队列分两种: 1)固定队列(fixed cohort):是指人群都在某一固定时间或一个短时间之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有无故退出,也不再加入新的成员,即在观察期内保持队列的相对固定。
2)动态人群(dynamic population): 在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。
图4-1 随访队列示意图 “I”进入队列;“x”无故退出队列;“0”出现终点结局 1990 2000 年 选定队列 随访终止 开始观察 图4-1 随访队列示意图 “I”进入队列;“x”无故退出队列;“0”出现终点结局
二、基本原理 在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
图4-2 队列研究的结构模式图
队列研究的基本特点: 1. 属于观察法:暴露不是人为给予的,是在研究之前已客观存在的,这是与实验研究的重要区别点。 2. 设立对照组:对照组可与暴露组来自同一人群,也可以来自来自不同的人群。
3. 由“因”及“果”:一开始(疾病发生之前)就确立了研究对象的暴露状况,而后探求暴露因素与疾病的关系,即先确知其因,再纵向前瞻观察而究其果,这一点与实验研究方法一致。 4. 能确证暴露与结局的因果联系。
三、研究目的 1、检验病因假设 2、评价预防效果: “人群的自然实验”:大量的蔬菜摄入可预防肠癌的发生。 3、研究疾病自然史
四、研究类型 1. 前瞻性(prospective) 即时性(concurrent) 2. 历史性(historical) 非即时性(non-concurrent) 3. 双向性(ambispective) 混合型(combined) 队列研究
暴露组 非暴露组 回顾性地收集 已有的历史资料 前瞻性 收集资料 历史性 队列研究 继续 双向性 过去 某时点 现在 将来 图4-3 队列研究类型示意图
又称即时性(concurrent) 队列研究 (一)前瞻性队列研究 又称即时性(concurrent) 队列研究 研究对象的分组是根据研究开始时(现时)研究对象的暴露状况而定的。此时,研究的结局还没有出现,还需要前瞻观察一段时间才能得到,这种设计模式称~。 优点:资料的偏倚较小,结果可信。 缺点:所需样本量很大,观察时间长、花费大,可行性比较差。
进行前瞻性队列研究需考虑 1. 应有明确的检验假设,检验的因素必须找准; 2. 所研究疾病的发病率或死亡率应较高,不低于千分之五; 3. 应明确规定暴露因素,并且应有把握获得观察人群的暴露资料;
4. 应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段; 5. 应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组; 6. 大部分观察人群应能被长期随访下去,并取得完整可靠的资料。应有足够的人、财、物力支持该工作。
(二)历史性(historical)队列研究 非即时性(non-concurrent)队列研究 研究对象的分组是根据研究开始时研究者已经掌握的有关研究对象在过去某个时点暴露状况的历史材料做出的;研究开始时研究的结局已经出现,其资料可从历史资料中获得,不需要前瞻性观察,这种设计模式称为~。 特点:省时、省力、出结果快。 缺点:因资料积累时未受到研究者的控制,所以,内容未必符合要求。
进行历史性队列研究时需考虑 1.应有明确的检验假设,检验的因素必须找准; 2.所研究疾病的发病率或死亡率应较高,不低于千分之五; 3.应明确规定暴露因素,并且应有把握获得观察人群的暴露资料;
4.应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段; 5.应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组; 6.是否有足够数量的完整可靠的在过去某段时间内有关研究对象的暴露和结局的历史记录或档案材料。如,医院的病历、个人的医疗档案、工厂和车间的各种记录等。
(三)双向性队列研究 混合型队列研究 在历史性队列研究之后,继续前瞻性观察一段时间,它是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式。 兼有上述两类的优点,且相对地在一定程度上弥补了相互的不足。
第二节 队列研究的实例 (课堂讨论) 一、确定研究因素 二、确定研究结局 三、确定研究现场和研究人群 四、资料收集 五、资料整理与分析 第二节 队列研究的实例 (课堂讨论) 一、确定研究因素 二、确定研究结局 三、确定研究现场和研究人群 四、资料收集 五、资料整理与分析 六、结论
第三节 队列研究的设计与实施 一、确定研究因素 二、确定研究结局 三、确定研究现场与研究人群 四、确定队列大小 五、资料收集与随访 六、质量控制
一、确定研究因素 队列研究费时、费力、费钱、一次只能研究一个因素,因此,队列研究中研究因素的确定是至关重要的。 暴露因素是在描述性研究和病例对照研究的基础上确定的。应当对暴露因素进行定量,包括暴露水平和暴露时间,以估计累积暴露剂量。 要考虑暴露方式:间歇暴露或连续暴露、直接暴露或间接暴露、一次暴露或长期暴露等。 。
还应确定需同时收集的其他资料,如各种可疑的混杂因素及研究对象的人口学特征
二、确定研究结局 结局变量(outcome variable)、结果变量,简称结局:指随访观察中将出现的预期结果事件。是队列研究观察的自然终点,与观察期的终止不是一个概念。
结局举例:发病、死亡、健康状况和生命质量的变化、分子或血清的变化、血清抗体滴度、尿糖、血脂等。 除确定主要研究结局外,可考虑同时收集多种可能与暴露有关的结局。
三、确定研究现场与研究人群 (一)研究现场 三、确定研究现场与研究人群 (一)研究现场 对现场的要求:有足够数量的符合条件的研究对象;当地的领导重视,群众理解和支持,最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。也要看现场的代表性。
(二)研究人群 1、暴露人群的选择 2、对照人群的选择
1、暴露人群的选择 (1)职业人群:暴露史记录较为全面真实可靠,常用于历史性队列研究。 (2)特殊暴露人群:是研究某些罕见的特殊暴露的唯一选择,如A-Bom的受害者。
3)一般人群:局部区域内的全体人群。优点是有详细可靠的医疗与保健记录,有利于追踪观察。 (4)有组织的人群团体:一般人群的特殊形式。好处:利用组织系统有效地收集随访资料;职业和经历往往是相同的,可增加其可比性。
2、对照人群的选择 基本要求: 对照人群除未暴露于所研究的因素外,其它各种影响因素或人群特征(年龄、性别、民族、职业、文化程度等)都应尽可能地与暴露组相同,即具有可比性。
1.内对照:选择一组研究人群A,将A中有E的作暴露组,A中无E的则为非暴露组(内对照)。当E为定量变量时,所划分的最低档次暴露的人群为对照组。 好处:省事、从总体上了解研究对象的发病率情况。 2.特设对照(外对照):职业人群或特殊暴露人群需在其外去寻找对照组。
3.总人口对照:不设对照,是利用整个地区的现成的发病或死亡统计资料,即以全人口率为对照。 优点:对比资料容易得到。 缺点:资料比较粗糙,可比性差,比较项目的精细程度低,对照中可能包含有暴露人群。 4.多重(种)对照:用上述两种或两种以上的形式选择的人群同时作对照,以减少只用一种对照所带来的偏倚,增强结果的可靠性。
关于对照 应尽量选用与暴露组在时间、地区及人群构成上相近的总人群作对照,以减少偏倚。 总人口对照的研究实际中不以粗率直接比较,应采用标化的方法,如计算标准化死亡率比;
特殊暴露人群或职业人群做暴露组时,计算标化比更为便捷,且意义明显。比值大于1,说明暴露导致或促进了结局的发生;比值小于1,说明暴露预防或减少了结局的发生;比值等于1,则暴露与疾病没有关系。
四、确定队列大小 (一)确定队列大小时需考虑的几个 问题 (二)影响队列大小的几个因素 (三)队列大小的计算
(一)需考虑的几个问题 1. 抽样方法:同现况研究 2. 暴露组与非暴露组的比例:一般,非暴露组的样本量不宜少于暴露组的样本量。常用:等量。 3. 失访率:常假设为10%,故按计算出来的样本量再加10%作实际样本。
(二)影响队列大小的几个因素 1.一般人群(对照人群)中目标疾病的发病率p0: n∝p0q0; 其中q0=1 - p0 。 p0→0.5,p0q0→Max,n→Min 2.暴露组与对照组发病率之差(d=p1 - p0): d→↑,n→↓。
3.要求的显著性水平α值: 要求的α→↑,n→↓。常取α =0.05或0.01。 4.检验效能(power of test)或把握度 1-β: 若要(1-β)→↑,β→↓,则n→↑。常取β=0.10,有时用0.20。
(三)队列大小的计算 暴露组与对照组样本量相等的情况: 式中 暴露组与对照组的预期发病率 p 两个发病率的平均值,q=l-p, 式中 暴露组与对照组的预期发病率 p 两个发病率的平均值,q=l-p, 和 为标准正态分布下双(单) 侧尾部面积 考虑失访可能,需增加10%样本量。 不是单纯随机抽样时,还需适当增加样本。 查表法:可查参考书。
五、资料收集与随访 (一)基线资料的收集 (二)随访
(一)基线资料的收集 基线资料的概念 基线资料(baseline information):又称基线信息,指每个研究对象在研究开始时的基本情况,包括暴露的资料及个体的其他信息。
基线资料具体包括:对待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。
基线资料收集方法 (1)查阅医院、工厂、单位及个人健康保险的记录或档案; (2)访问研究对象或其它能够提供信息的人; (3)对研究对象进行体格检查和实验室检查; (4)环境调查与检测。
(二) 随 访 1.随访对象:暴露组和对照组观察/研究对象; (二) 随 访 1.随访对象:暴露组和对照组观察/研究对象; 2.随访方法:面对面访问、电话访问、自填问卷、定期体检、环境与疾病的监测、医院医疗与工作单位的出勤记录的收集等。对暴露组和对照组采用相同的方法同等随访,追踪至观察终止期。对失访者补访。失访原因分析。比较失访者与继续观察者基线资料,估计有无偏差。
3.随访内容:制成调查表;同基线资料,重点是结局变量。 4.观察终点(end-point):指研究对象出现了预期结果(疾病、死亡、某些指标的变化),不再对其继续随访。预期结果是冠心病,而患了高血压,不是观察终点,应继续观察;如猝死于脑卒中,也不是观察终点,应记为失访。 慢性病的随访间隔期一般为1-2年。
六、质量控制 1.调查员的选择: 具有高中或大学文凭的30~40岁女性较佳。 2.调查员培训: 统一方法和技巧,进行考核。 3.制定调查员手册: 列出全部操作程序、注意事项及调查问卷的完整说明。 4.常规监督措施:
六、质量控制 常规监督措施 (1)由另一名调查员作抽样重复调查; (2)人工或用计算机及时进行数值检查或逻辑检错; 六、质量控制 常规监督措施 (1)由另一名调查员作抽样重复调查; (2)人工或用计算机及时进行数值检查或逻辑检错; (3)定期观察每个调查员的工作;
(4)对不同调查员所收集的变量分布 进行比较; (5)对变量的时间趁势进行分析; (6)在访谈时使用录音机录音等。
第四节 队列研究的资料整理 与分析 资料整理与分析程序 一、基本整理表 二、人时的计算 三、率的计算 四、效应的估计
资料整理与分析程序 1)随访结束后,审查资料,有明显错误的资料应重新调查修正或剔除;补齐不完整的资料。 2)描述性统计:研究对象的组成、人口学特征、随访时间及失访情况等;分析两组的可比性及资料的可靠性; 3)推断性分析:分析两组率的差异,推断暴露的效应及其大小。
一、基本整理表 表4-3 队列研究资料归纳整理表 病例 非病例 合计 发病率 暴露组 a b a+b=n1 a/n1 非暴露组 c d c+d=n0 c/n0 a+c=m1 b+d=m0 a+b+c+d=t
二、人时的计算 常用的人时单位:人年。 常用的人年计算方法:3种 1. 精确法 2.用近似法计算暴露人年 3.用寿命表法计算人年 计算率时,分母中加入时间因素,计算各组的观察人时数。 常用的人时单位:人年。 常用的人年计算方法:3种 1. 精确法 2.用近似法计算暴露人年 3.用寿命表法计算人年
1.精确法 以个人为单位计算暴露人年, 计量精确,工作量大,适于小样本。
2、用近似法计算暴露人年 用平均人数乘以观察年数得到总人年数,平均人数一般取相邻两年的年初人口的平均数或年中人口数。 该法计算简单,但精确性较差。
3、用寿命表法计算人年 当观察对象人数较多,难以用精确法计算暴露人年,但又要求有一定的精度时,可利用简易寿命表的方法。 常用计算方法是:规定观察当年内进入队列的个人均作l/2个人年计算,失访或出现终点结局的个人也作l/2个人年计算。
式中Lx为x时间内的暴露人年数,Ix为x时间开始时的观察人数,Nx为x时间内进入队列的人数,Dx为x时间内出现终点结局的人数,Wx为x时间内失访的人数。
表4-7 寿命表法计算人年实例
三、率的计算 (一)常用指标 1、累积发病率(cumulative incidence) 2.发病密度 (incidence density) 3.标化比 (二) 显著性检验 1、U检验: 2.其他检验方法
(一)常用指标 1.累积发病率(cumulative incidence) : 当研究人群的数量较多,人口较稳定,资料较整齐时,可用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率 累积发病率的量值变化范围为0~l。
2.发病密度 (incidence density) 当队列研究需长时间进行,退出/失访的人口增加,无法形成固定队列。 对动态人群每个对象被观察的时间不一样,计算累积发病率的资料很不整齐。不能以总人数为单位计算发病(死亡)率。
用人时为单位计算出来的率带有瞬时频率性质称为发病密度。 最常用的人时单位是:人年,以此求出人年发病(死亡)率。 发病密度又称发病力,其数量变化范围是从0到无穷大。
3.标化比 当研究对象数目较少,结局事件的发生率比较低时,无论观察的时间长或短,都不宜直接计算率。应以全人口发病(死亡)率作为标准,计算该观察人群的理论发病(死亡)人数(预期发病/死亡人数),再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。
最常用的指标: 标化死亡比(standardized mortality ratio,SMR):职业病流行病学研究中常用。 标化比实际上不是率,而是以全人口的发病(死亡)率作为对照组而计算出来的比,是一个率的替代指标。
SMR的公式与实例
实 例 某厂30~40岁组工人有500名,某年内有2人死于肺癌,已知该年全人口30~40岁组肺癌的死亡率2‰,求其SMR。 实 例 某厂30~40岁组工人有500名,某年内有2人死于肺癌,已知该年全人口30~40岁组肺癌的死亡率2‰,求其SMR。 已知O=2,E=500×2‰=1,SMR=2/1=2。 即某厂30~40岁年龄组工人死于肺癌的危险达到相应一般人群的2倍。
SPMR的公式与实例 标化比例死亡比(standardized proportional mortality ratio) 计算方法:以全人口中某病因死亡占全部死亡之比,乘以某单位实际全部死亡数,得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。
队列研究多为抽样研究,存在抽样误差,需进行统计学显著性检验。 (二) 显著性检验 1、U检验 队列研究多为抽样研究,存在抽样误差,需进行统计学显著性检验。 当n较大,p和1-p都不太小[np和n(1-p)>5],应用正态分布的原理检验率的差异(U检验法)是否有显著性。
式中 p1 暴露组的率,p0 对照组的率,n1 暴露组观察人数,n0 对照组的观察人数,pc 合并样本率, 其中X1和X0分别为暴露组和对照组结局事件的发生数。求出u值后,查u界值表得P值,按所取的检验水准即可作出判断。
2.其他检验方法 如果率比较低,样本较小时,可改用直接概率法、二项分布检验或泊松 (Poisson)分布检验; 率差的显著性检验可利用四格表资料的卡方检验; 对SMR或SPMR的检验,实际是所得结果值偏离1的检验,其检验方法可用x2检验或计分检验(score test),详细方法可参阅有关书籍。
四、效应的估计 1.相对危险度(relative risk,RR), 率比(rate ratio)又称危险比(risk ratio) 2.归因危险度(attributable risk,AR),率差(rate difference,RD)又称特异危险度,超额危险度(excess risk)
3.归因危险度百分比(AR%),病因分值(etiologic fraction,EF) 4.人群归因危险度(population attributable risk, PAR) 5.人群归因危险度百分比(PAR%) 6.剂量反应关系的分析(Dose-response Analysis)
队列研究的最大优点 可以直接计算出研究对象的结局的发生率,因而也就能够直接计算出暴露组与对照组之间的率比和率差,即相对危险度RR(relative risk)与归因危险度AR (attributable risk),从而可直接准确地评价暴露的效应。
1.相对危险度(relative risk) 反映暴露与发病(死亡)关联强度的最有用的指标 式中 Ie:暴露组的发病(死亡)率; I0:非暴露组的率。
RR:表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。
表4-8 相对危险度与关联 的强度
相对危险度的95%可信区间 计算RR95%可信区间的方法很多,常用的有Woolf法和Miettinen法,此处主张用Woolf法计算。 Woolf法是建立在RR方差基础上的简单易行的方法。
其反自然对数即为RR的95%可信区间。
2.归因危险度 是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。 由于 所以
RR与AR公共卫生意义 RR:说明暴露者与非暴露者比较,增加相应疾病危险的倍数;具有病因学的意义 二者都为表示关联强度的重要指标,彼此密切相关(都说明暴露的生物学效应,即暴露的致病作用有多大),但其公共卫生意义却不同。 RR:说明暴露者与非暴露者比较,增加相应疾病危险的倍数;具有病因学的意义
AR:一般是对人群而言,暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生。更具有疾病预防和公共卫生学上的意义。
实例 RR、AR两者的区别 从RR看,吸烟对肺癌的作用较大,病因联系较强; 从AR看,吸烟对心血管疾病的作用较大,预防所取得 的社会效果将更大。 实例
3.归因危险度百分比 指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。 说明吸烟者中发生的肺癌有90.6%归因于吸烟。 以表4-9为例计算肺癌的 说明吸烟者中发生的肺癌有90.6%归因于吸烟。
4.人群归因危险度 人群归因危险度(population attributable risk, PAR):是指总人群发病率中归因于暴露的部分。计算公式如下: It:全人群的率, I0:非暴露组的率
5.人群归因危险度百分比 PAR%:是指PAR占总人群全部发病(或死亡)的百分比。 It:全人群的率, I0:非暴露组的率
式中Pe表示人群中有某种暴露者的比例,从该式可看出PAR%与相对危险度及人群中暴露者的比例的关系
RR和AR都说明暴露的生物学效应(暴露的致病作用有多大); PAR和PAR%则说明暴露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度,它既与RR和AR有关,又与人群中暴露者的比例有关。除非研究对象两组的暴露比例与人群中的恰好一致,否则,计算出来的AR、AR%与PAR和PAR%是不一致的。
5.剂量反应关系的分析 作暴露剂量—效应关系的目的在于当暴露的剂量越大其效应越大时,则该种暴露作为病因的可能性就增大。 方法:1)列出不同暴露水平下的发病率; 2)以最低暴露水平组为对照,计算 各暴露水平的相对危险度和率差 3)必要时,作率的趋势性检验。
第五节 队列研究的偏倚及其防止 一、常见偏倚的种类 二、常见偏倚的预防 三、常见偏倚的估计与处理
一、常见偏倚的种类 1.选择偏倚 (selection bias) 2.失访偏倚 (lost to follow-up):一项研究的失访率最好不超过10%,否则应慎重考虑结果的解释和推论。
3.信息偏倚 (information bias), 错分偏倚(misclassification bias):非特异性 错分和特异性错分。 4.混杂偏倚 (confounding bias):它是疾病的一个危险因子,又与所研究的因素有联系,它在暴露组与对照组的分布是不均衡的。在流行病学研究中,性别、年龄是最常见的混杂因素。
二、常见偏倚的预防 1.预防选择偏倚首先要用正确抽样方法,即严格遵守随机化的原则;严格按规定的标准选择对象;不轻易放弃随访;新加入或退出者的基本情况与正常选择参加的人群进行应一致。 2.防止失访偏倚主要靠尽可能提高研究对象的依从性,失访率达应低于20%。在研究开始时就要考虑此问题,并做好宣传解释工作。尽量了解失访者最后的结局,对其和已随访者的特征做比较分析。
3.选择精确稳定的测量方法、调准仪器、严格实验操作规程、同等地对待每个研究对象、提高临床诊断技术、明确各项标准、严格按规定执行是防止信息偏倚的重要措施。此外,调查员培训、调查技巧、统一标准、责任心等措施也有效。 4.设计时对研究对象作某种限制,以获得同质的研究样本;对照选择时以匹配的办法保证两组在一些重要变量上的可比性;抽样时严格遵守随机化的原则等措施,来防止混杂偏倚的产生。
三、常见偏倚的估计与处理 1.选择偏倚与失访偏倚通过审查研究对象的选择方法、调查研究对象的依从率、比较失访及退出研究者与继续研究者的基本特征等,可估计选择偏倚与失访偏倚产生的可能性。精确估计是困难的,目前亦缺乏有效的处理办法。
2.信息偏倚信息偏倚一旦产生,既难发现,也难估计与处理。通过对一个随机样本进行重复的调查与检测,将两次检测的结果进行比较可以估计此类偏倚的可能性与大小。 3.根据混杂的判断标准来判断混杂存在的可能性,比较分层调整前后的两个效应测量值的大小以估计混杂作用的大小。有关混杂偏倚的处理一般可采用分层分析、标准化或多因素分析的方法。
第六节 队列研究的优缺点 1.优点 (2)直接计算出RR等反映疾病危险关联的指标。 (3)检验病因假说的能力强,可证实病因联系。 第六节 队列研究的优缺点 1.优点 (1) 一般不存在回忆偏倚。 (2)直接计算出RR等反映疾病危险关联的指标。 (3)检验病因假说的能力强,可证实病因联系。 (4)有助于了解人群疾病的自然史。 (5)样本量大,结果比较稳定。
2.缺点 (1)不适于发病率很低的疾病的病因研究。 (2)容易产生各种各样的失访偏倚。 (3)研究耗费的人力、物力、财力和时间较多,其组织与后勤工作亦相当艰巨。
(4)由于消耗太大,故对研究设计的要求更严密,资料的收集和分析也增加了一定的难度,特别是暴露人年的计算较繁重。 (5)在随访过程中,未知变量引入人群,或人群中已知变量的变化等,都可使结局受到影响,使分析复杂化。