流行病学研究中的偏倚及其控制
一、 研究结果的变异性 (一)变异性概述 研究结果包括描述性和分析性数据(指标)的变动或波动,称为研究结果的变异性(variability)。它可存在于不同的水平,包括个体水平、群体水平和样本(研究)水平。
变异的来源可以分为两个层次: 1.生物学(真实)变异和测量变异:生物学变异反映真实的客观变异,测量的变异反映测量过程的误差。例如,在个体水平上,某病人的血压真值在一段时间内本身存在波动(生物学变化);同时在血压的测量过程中,又存在一定的测量误差(测量变异)。该病人的血压值的总变异就包含生物学变异和测量变异。 2.随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。系统变异(误差)的绝对值和方向保持恒定。上述的测量误差,就可以再分出随机误差和系统误差。
(二)个体水平的变异性 个体水平的变异性是指某个体特征测得值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。个体水平测得值的变异来源归纳于表8-2。
(三)群体水平的变异性 1.群体水平的变异性可以看成是各个体的累计变异,因为构成群体的各个个体具有不同的遗传素质并受到不同的环境影响。 2.群体的变异程度常常大于个体的变异。一般可根据群体的变异范围来确定“正常值”范围,用于判定个体测得值是否“正常”。如某病人的血清总胆固醇得到一个确定的测得值,可以根据群体血清总胆固醇的变异范围,判定该病人的总胆固醇是否处于“正常”水平。 3.群体水平的变异性也受到测量误差的影响。
(四)样本水平的变异性 样本(研究)水平的变异性是指通过不同样本的研究所得结果的差异性。为什么高水平的血清总胆固醇是不利的或不健康的?这可以在关于血清总胆固醇与心血管死亡风险呈正相关的研究中找到答案,如Framingham心脏研究。 但是,研究通常不能针对整个总体人群来进行,而是通过样本人群来进行,这就引入了抽样变异(误差)。通过不同样本的研究所得的关于总体结果的估计值会有不同,如果排除测量误差,这些样本的估计值与总体真实值(用各样本估计值的均值代表)的差异,就是抽样误差。当样本含量增大时,抽样误差就会减少。
1.描述性结果的样本变异性 可以示例如图8-1。
在图8-1的示例中,源群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。如果增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。
2.分析性结果的样本变异性 可以示例如图8-2。
在图8-2的示例中,研究A和研究B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,从而发生重叠,统计检验无显著性差异 。研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%可信限较小,从而未发生重叠,统计检验有显著性差异。一般而言,研究样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。如果研究样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。
二、 研究的真实性 (一)真实性概述 研究的真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。如果研究结果与客观实际存在不符合的地方,这就是研究误差,它是研究真实性的反面。 研究误差可以分为系统误差和随机误差两部分:系统误差是指有固定方向和固定大小的误差,来自于对象选取、测量和统计分析等的方法学缺陷;而随机误差没有固定方向和固定大小,一般呈正态分布,来自于随机抽样变异和测量随机变异等。 研究真实性的反面应当包括系统误差和随机误差两部分。
研究误差中的系统误差部分,称为偏倚(bias)。研究的可靠性或信度(reliability)亦称精密度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。 随机抽样误差可以用统计学方法来估计,并且可以通过增大样本含量来减少。测量数据的真实性可用真实性指数(index of validity, IV),或某方面的真实性指标如灵敏度或特异度等来表示。 变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。
(二)内部真实性 内部真实性(internal validity)是指研究结果与实际研究对象真实情况的符合程度。它回答一个研究本身是否真实或有效。如果一个研究针对实际研究对象提供了真实的描述频率或效应估计值,即随机误差和系统误差较小,则该研究是真实或有效的。如果一个研究本身是不真实或无效的,则很难再应用到其他人群。 改善内部真实性的措施有:限制研究对象的类型和研究的环境条件。因为这样可以降低群体水平的变异性,或者使因果机制趋于一致等。这些措施可能限制研究结果应用到其他人群,也就是使下述的外部真实性受限。
三、外部真实性 外部真实性(external validity)是指研究结果与推论对象真实情况的符合程度,外部真实性又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。如果研究对象对于推论对象的代表性不好,尽管它的内部真实性可能好,但它的外部真实性则肯定差。 增加研究对象的同质性,如限制类型如年龄、职业、体质特征或疾病分型等,可以改善内部真实性;而增加研究对象的异质性,使得研究对象的代表性范围扩大,则可以改善外部真实性。在实际研究确定对象时,需要综合平衡考虑研究对象的同质性和异质性问题。
第一节 真实性、偏倚和机遇
三、 研究的偏倚 研究误差中的系统误差部分,称为偏倚(bias)。最著名的早期偏倚研究是Berkson做的,他在1946年证实了采用医院病人对象的病例对照研究容易遭受潜在的选择偏倚,这种偏倚来自于病人入院风险同病人的多种状况有关,又称为Berkson偏倚。 1976年Miettinen详细讨论了偏倚的定义,并给出了分类框架,这就是被广泛接受的选择偏倚、信息偏倚和混杂偏倚三分类。
四、选择偏倚 (一)选择偏倚(selection bias)的定义 指被选定的研究对象与未被抽取的人群在某些特征上存在系统差异而出现的误差。 主要发生在设计阶段,也产生于资料收集阶段的失访、无应答等。 以在病例对照研究与现况研究中为常见。
(二)选择性偏倚的种类 1.入院率偏倚(admission rate bias) 亦称伯克森偏倚(Berkson’s bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。 A、B病患者及其与因素X的关系 疾病 暴露于X 非暴露X 合计 X暴露率 A:对照 200 800 1000 20% B:病例 200 800 1000 20% 合计 400 1600 2000 20% OR=1.00 P>0.05
因A入院(50%) 100人 A病(X+) 140人 (200人) 因X入院(40%) 40人 A病(1000人) A病(X-) 因A入院(50%) 400人 (800人) 因B入院(20%) 40人 B病(X+) 104人 (200人) 因X入院(40%) 64人 B病(1000人) B病(X-) 因B入院(20%) 160人
因不同住院率而住院的A、B病患者及其与因素X的关系 疾病 暴露于X 非暴露X 合计 X暴露率 A:对照 140 400 540 25.9% B:病例 104 160 264 39.4% 合计 244 560 804 30.4% OR=1.86 x2=15.215 P<0.001
2.现患-新发病例偏倚(prevalence-incidence bias) 也称奈曼偏倚(Neyman bias)。 研究病例一般是现患病人,不包括死亡病例和那些病程短、轻型、不典型的病例。 某些病人在患病后,有可能会改变其原来的某些因素的暴露状况。 这样用于研究的病例类型(现患病例)与队列研究或实验研究的病例不同,它们多用新病例,由此而产生的偏倚即为现患病例-新病例偏倚。
美国弗明汉地区居民血胆固醇水平与冠心病关系研究 胆固醇百分位 队列研究(第6次) 病例对照研究(第6次) 冠心病 非冠心病 合计 >75 85 462 547 38 34 72 ≤75 116 1511 1627 113 117 230 201 1973 2174 151 302 RR=2.40 OR=1.16
3.检出偏倚 或称检出症候偏倚(detection signal bias),指某因素与某疾病在病因学上虽无 关联,但由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该疾病相关联的错误结论。 在对一些慢性疾病如肿瘤、动脉硬化、结石等进行病因研究时,这种偏倚的意义特别重要。
例如:研究绝经期妇女服用雌激素与子宫内膜癌的关系,初步结果显示服用雌激素可使子宫内膜癌发生增多,两者有相关关系,或认为服用雌激素是子宫内膜癌的危险因素。但经仔细分析,特别对子宫内膜癌的发现进行观察,揭示出服用雌激素会导致绝经期妇女不规则的子宫出血,而子宫出血作为一种诊断信息,使她们及时就诊寻求原因,从而大大增加了子宫内膜癌的发现机会。末服用雌激素的妇女中,一旦发生子宫内膜癌,常无明显症状,而未能及时就诊,以致发现较晚。从而高估了雌激素与子宫内膜癌的关系。
4.易感性偏倚(susceptibility bias) 有些因素可能直接或间接地影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此而产生的偏倚称为易感性偏倚。 如职业性疾病研究中的健康工人效应(healthy worker effect)。
在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。 5.排除偏倚(exclusive bias) 在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。 例如:在研究吸烟与肺癌的关系时,把与吸烟有关的疾病(支气管炎、冠心病等)病人作为对照,可以低估吸烟与肺癌之间的相关关系,甚至出现假阴性的结果。
6.无应答偏倚(non-respondent bias) 是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。某个特定样本中的无应答者的患病状况,以及对某一或某些研究因素的暴露情况与应答者可能不同,由此而产生的偏简称为无应答偏倚。 无应答偏倚在观察性研究或实验性研究中均可发生。
7.失访偏倚(loss to follow up bias) 由于失访而引起的偏倚称为失访偏倚。 为一种特殊的无应答形式,主要发生在前瞻性性研究及临床试验中。 失访:是指在追踪观察的过程中,某些对象由于种种原因而脱离了观察(迁走、与本病无关的死亡及本人退出实验等),观察者无法了解到他们的结局。 有两种形式: 失访:指观察期限短于规定的观察危险期者。 退出:指在随访过程中因种种原因拒绝继续留在观察组中。
8.志愿者偏倚(volunteer bias) 志愿参加观察者同非志愿者在关心健康、注意饮食及营养食疗、禁烟、禁酒、坚持体育锻炼等方面有系统差异,因支援志愿者被入选为观察对象,而非志愿者落选,由此产生的选择性偏倚,称为志愿者偏倚。 例如:美国曾采用邮寄问卷的形式,调查美国退伍军人的吸烟习惯。30天后总结收集的回复,并进行核实发现,不吸烟者有85%回复了问卷,而抽烟者仅67%。这必然导致低估了吸烟与所研究疾病的关系。
(三)选择性偏倚的测量
总人群比值比 OR=AD/BC 样本比值比 OR0=A0D0/B0C0 根据选择概率 OR0=OR×(αδ/βγ) 选择偏倚的大小和方向用下式: 选择偏倚= (OR0-OR)/OR 或αδ/βγ-1 若得值=0,即αδ/βγ=1,则不存在选择偏倚。 若得值>0,即αδ/βγ>1,则存在选择偏倚,此时 OR0 > OR。 若得值<0,即αδ/βγ<1,则存在选择偏倚,此时 OR0 < OR。
患B病且暴露于因素X的选择概率: α=104/200=0.52 患A病且暴露于因素X的选择概率: γ=140/200=0.70 患A病但末暴露于因素X的选择概率:δ=400/800=0.50 人群中 OR=l,住院病人 OR=1.86 选择偏倚=(1.86-1)/1=0.52*0.50/(0.20*0.70)=0.86 得值0.86>0,表明由于入院率的不同,导致了选择偏倚的产生,使由医院选择研究对象进行研究所得的OR值高估,是人群OR值的1.86倍。
(四)选择偏倚的控制 ◆首先研究者对在整个研究中可能会出现的各种选 择偏倚应有充分的了解、掌握。 ◆严格掌握研究对象纳入与排除的标准。 对照的入选原则为:不患所研究的疾病且有暴露于研究因素的可能;不患有与研究因素有关的其他病;在某些方面与病例组的可比等。
(四)选择偏倚的控制 ◆在研究中采取相应措施,尽量取得研究对象的合 作,以获得尽可能高的应答率,减少无应答率及 队列研究中的失访和实验性研究中的中途退出等。 ◆尽量采用多种对照如在病例对照研究中,理想的 研究对象应是人群中的全体病例和非该病病例及 正常人,或其有代表性的样本,但往往很难做到。
五、信息偏倚 (一)概述 信息偏倚(information bias): 又称观察偏倚(observational bias),是指在研究的实施阶段从研究对象获取研究所需的信息时所产生的系统误差。 信息偏倚可来自于研究对象、研究者本身,也可来自用于测量的仪器、设备、方法等。 信息偏倚的表现是使研究对象的某种特征被错误分类(misclassification)。
(二)信息偏倚的种类 1.回忆偏倚(recall bias) 指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。 回忆偏倚在病例对照研究中最常见。 产生的原因: ◆调查的事件或因素发生的频率甚低,未给研究对象留下深刻印象而被遗忘; ◆调查事件是很久以前发生的事情,研究对象记忆不清; ◆研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异。
2.报告偏倚(reporting bias) 指由研究对象有意的夸大或缩小某些信息而导致的偏倚,因此亦被称作说谎偏倚。 3.诊断怀疑偏倚(diagnostic suspicion bias) 由于研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患某病,或主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于自己的判断。由此而造成的偏倚称为诊断怀疑偏倚。 诊断怀疑偏倚多见于临床试验和队列研究,在病例对照研究中也可产生, 亦可发生于研究对象。
4.暴露怀疑偏倚(exposure suspicion bias) 研究者若事先了解研究对象的患病情况或某种结局,可能会对其以与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认真地调查和询问病例组某因素的暴露史,而漫不经心地调查和询问对照组,从而导致错误结论,此即暴露怀疑偏倚。
5.测量偏倚(detection bias) 测量偏倚指对研究所需指标或数据进行测定或测量时产生的偏差。 所用仪器、设备校正不准确,试剂不符合要求,使用方法的标准或程序不统一,分析、测试条件不一致,以及操作人员的技术问题等等,均可导致测量结果的不正确,使测量结果偏离真值。所用调查表设计的科学性,记录是否完整,调查人员对工作的认真程度以及访问方式、态度等等,亦均可导致不准确的信息,产生测量偏倚。
(二)信息偏倚的种类 不应答偏倚 回忆偏倚 报告偏倚(说谎偏倚) 社会期望偏倚 诊断怀疑偏倚 暴露怀疑偏倚 测量偏倚 来自于被调查者 来自于调查者 来自于测量仪器
(三)信息偏倚的测量 一项研究资料是否存在信息偏倚以及偏倚的方向与大小,可通过比较、分析在一定研究对象中调查所得到的信息与实际信息(如客观检查、记录等)予以测量。
病例组:灵敏度=54/60=0.90 特异度=28/40=0.70 对照组:灵敏度=27/30=0.90 特异度=40/70=0.70 这种由于信息偏倚所导致的错误分类等同地发生在两组,称为无差异错误分类(非特异性错分)(nondifferential misclassfication)。发生无差异错误分类时,资料的效应估计值(OR或RR)低于实际值,使效应估计值趋于无效值,低估研究因素与疾病之间的联系。
信息偏倚=(ORx-OR)/OR 若得值=0,则不存在信息偏倚; 若得值>0,则存在信息偏倚,此时ORx>OR; 若得值<0,则存在信息偏倚,此时ORx<OR。 OR=(60×70)/(30×40)=3.5 ORx=(66×52)/(34×48)=2.1 信息偏倚=(ORx-OR)/OR=(2.1-3.5)/3.5=-0.40
如计算所得两组的灵敏度与特异度不同,称为有差异错误分类(特异性错分)(differential misclassffication)。当发生有差异错误分类时,资料的效应估计值高于或低于实际值。即可能高估也可能低估因素与疾病之间的联系。
信息偏倚=(ORx-OR)/OR 若得值=0,则不存在信息偏倚; 若得值>0,则存在信息偏倚,此时ORx>OR; 若得值<0,则存在信息偏倚,此时ORx<OR。 OR=(600×700)/(300×400)=3.5 ORx=(660×750)/(340×250)=5.8 信息偏倚=(ORx-OR)/OR=(5.8-3.5)/3.5=0.66
(四)信息偏倚的控制 1.研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法 2.尽可能采用‘盲法’收集资料 3.尽量采用客观指标的信息 4.回忆偏倚:可通过一定的调查技巧加以避免,如可选择一个与暴露史有联系的鲜明的记忆目标帮助其联想回忆等等。此外对在条件允许时询问到的暴露史,尽可能的与客观记录核实。 敏感问题:可通过调查知情人或相应的调查技术获取正确的信息。
调查所得病例组与对照组研究因素的暴露情况 (五)资料的校正方法 调查所得病例组与对照组研究因素的暴露情况 因素 病例 对照 合计 + 66(a) 48(b) 114 - 34(C) 52(d) 86 100(n1) 100(n2) 200
A=(Sp×n1-c)/(Sp+Se-1) C=n1-A D=n2-B A、B、C、D分别为校正后的a、b、c、d;Sp:特异度; Se:灵敏度。 A=(0.7×100-34)/(0.7+0.9-1)=60 B=(0.7+100-52)/(0.7+0.9-l)=30 C= 100-60=40 D=100-30=70 校正后的OR=AD/BC=60×70/(30×40)=3.5
六、混杂偏倚 (一)混杂偏倚的定义 混杂偏倚或称混杂(confounding),是指在流行病学研究中,由于一个或多个潜在的混杂因素(confounding factor)的影响,掩盖或夸大了研究因素与疾病(或事件)之间的联系,从而使两者之间的真正联系被错误地估计。
(二)混杂因素的定义与特点 1.定义 亦称混杂因子或外来因素(extraneous factor),是指与研究因素和研究疾病均有关,若在比较的人群组中分布不均,可以歪曲(掩盖或夸大)因素与疾病之间真正联系的因素。 2.特点 ◆必须是所研究疾病的独立危险因子; ◆必须与研究因素(暴露因素)有关联(有统计学 联系); ◆一定不是研究因素与研究疾病因果链上的中间变量。
(三)混杂偏倚的测量 1.测量的方法 可通过比较含有该因素时研究因素与疾病的效应估计值,(如RR,OR),与排除该因素后的效应估计值来实现。 设含有某可疑混杂因素(f)时,研究因素与研究疾病的效应估计值为cRR或cOR,称作粗RR或粗OR; 按该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作用后的效应估计值为aRR(f)或aOR(f),称作调整RR或调整OR(可用Mantel-Haenszel分层分析方法计算)
A.若cRR=aRR(f),则f无混杂作用,cRR不存在f的混杂偏倚。 B.若cRR≠aRR(f),则f有混杂作用,cRR存在f的混杂偏倚。 C.若cRR>aRR(f),为正混杂(positive confounding),亦称阳性混杂,即由于f的混杂作用,使cRR高估了研究因素与研究疾病之间的联系。 D.若cRR<aRR(f),为负混杂(negative confounding),亦称阴性混杂,即由于f的混杂作用,使cRR低估了因素与研究疾病之间的联系。 混杂偏倚=[cRR-aRR(f)]/aRR(f)
口服避孕药(OC)与心肌梗死(MI)关系的病例对照研究结果 合计 服OC 39 24 63 未服OC 114 154 268 153 178 331 cOR=2.20(1.26-3.84)(x2=7.70, P<0.01)
按年龄分层的结果 <40岁 ≥40岁 OR1=2.80 OR2=2.78 服OC 未服OC 合计 病例 21 (a1) 26 (b1) 47 (m11) 18 (a2) 88 (b2) 106 (m12) 对照 17 (c1) 59 (d1) 76 (m01) 7 (c2) 95 (d2) 102 (m02) 38 (n11) 85 (n01) 123 (t1) 25 (n12) 183 (n02) 208 (t2) OR1=2.80 OR2=2.78
年龄与MI的关联 年龄与OC的关联 <40岁 ≥ 40岁 MI 26 88 OC 17 7 对照 59 95 OR=0.48, x2=7.27 OR=3.91, x2=8.89
ORMH= ∑(aidi/ti)/∑(bici/ti) x2MH=[∑ai-∑E(ai)]2/∑V(ai) ∑E(ai)=∑m1in1i/ti I ∑V(ai)=∑m1im0in1in0i/t2i(ti-1) i=1 x2MH=11.79
(四)混杂偏倚的控制 1.限制(restriction) 针对某一或某些可能的混杂因素,在设计时对研究对象的入选条件予以限制。 2.匹配 匹配是指在为指示研究对象选择对照时,使其针对一个或多个潜在的混杂因素与指示研究对象相同或接近,从而消除混杂因素对研究结果的影响。 3.随机化(randomization) 指以随机化原则使研究对象以等同的机率被分配在各处理组中,从而使潜在的混杂因素在各组间分布均衡。 4.统计处理 混杂偏倚在资料分析阶段也可以通过一定的统计处理方法予以控制。