第九章 偏倚及其控制 Biases and Their Control 1、研究结果的变异性 2、研究的真实性 3、研究的偏倚
第一节 研究结果的变异性 一、概述 变异性(variability):研究结果的变动或波动叫研究结果的变异性 1、生物学变异和测量变异:主要来自个体(个体生物学变异;测量误差)、群体(个体遗传学变异、环境变异测量误差)和样本(抽样方式、样本大小和测量误差) 2、随机变异和系统变异:前者成正态分布;后者的绝对值和方向保持恒定。 测量误差包括随机误差和系统误差
二、个体水平差异 变异来源 特 点 个体状态 日间变异,年龄、膳食或运动改变,环境因素 测量误差 仪器标度差,精密度差,读数或记录错误
三、群体水平的变异性 是各个体变异的累积,群体变异常大于个体 可根据群体变异来确定正常值的范围 也受到测量误差的影响
四、样本水平的变异性 1、描述性结果样本变异:图8-1 2、分析性结果样本变异:图8-2
第二节 研究的真实性 一、概述 真实性(效度;validity):研究收集的数据、分析结果和所得结论与客观实际的符合程度。用真实性指数(index of validity, IV)或灵敏度等表示。 研究误差:研究结果与客观实际不符合的地方。分为系统误差(偏异;bias)和随机误差 可靠性(信度;reliability;精密度;precision):指研究中随机误差的大小程度
二、内部真实性(internal validity) 指研究结果与实际研究对象真实情况的符合程度,指研究本身是否真实 真实性高,则系统误差和随机误差小 研究结果真实性差,不能应用于其他人群
三、外部真实性(external validity) 研究结果与推论对象真实情况的符合程度 增加研究对象的同质性,能改善内部真实性; 增加研究对象的异质性,能改善外部真实性; 应综合考虑研究对象的异质性和同质性
第三节 研究的偏倚 一、选择偏倚 定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。 第三节 研究的偏倚 一、选择偏倚 定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。 描述性研究的选择偏倚:体现在样本对总体的代表性上 分析性研究的选择偏倚:体现在研究对象进入、排除、不参与、失访等
二、信息偏倚 定义:在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类(misclassification)。 同样存在描述性研究和分析性研究的中 无差异性错误分类(nondifferential misclassification):暴露或疾病的错误分类与研究分组无关;大多数情况下,模糊了组间差异,低估了研究效应 差异性错误分类(differential misclassification):暴露或疾病的错误分类与研究分组有关,由于其差异偏向不同,可高估或低估研究效应
60 40 48 52 32 68 60 40 60 40 32 68 差异分类错误 无差异分类错误 高脂肪膳食 低脂肪膳食 心肌梗死 对照 研究真实数据 错误分类数据 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 高脂肪膳食 低脂肪膳食 心肌梗死 48 52 对照 32 68 OR=2.3 OR=2.0 差异分类错误 研究真实数据 错误分类数据 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 32 68 OR=2.3 OR=3.2
三、 混杂偏倚 定义:在研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫混杂(confounding),其所带来的偏倚叫混杂偏倚(confounding bias),该外来因素叫混杂因素(confounding factor) 。 特点:(1)必须是所研究疾病的独立危险因子 (2)必须与研究因素(暴露因素)有关 (3)必须不是研究因素与研究疾病因果链上中间变量
由统计学关联到因果关联 (一)统计学关联(association) (二)因果关联(causal association) 偶然关联 选择偏倚 提出 验证 关 非因果关联 观察偏倚 假设 假设 联 混杂等 统计学关联 间接因果关联 因果关联 直接因果关联 (二)因果关联(causal association) 黄色瘤(E) 静脉吸毒(E) 1、继发 2、直接 关联 高血清胆 ? 关联 性乱(F) ? 胆固醇(C) 歪曲 冠心病(D) HIV感染(D) 病因推断
M-H(Mantel-Haenszel)分层分析方法的步骤 四、混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近 得到控制混杂后的调整RR或OR 再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较
1.队列研究 (1) 累计发病率资料 表8-4
(2) 发病密度资料 表8-5
2.病例对照研究 表8-6
(1)按可能的混杂因素吸烟分层 表8-7 ai bi m1i ci di m0i ni n0 ti 表8-8
(2) 判定层间关联效应水平是否同质 按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验)的,可以应用M-H方法计算综合OR
(3) 计算综合或调整OR,并与粗OR比较 P >0.25
(4) 结论 吸烟对饮酒与肺癌的关联(cOR = 3.69)有混杂作用(cOR ≠ ORMH) 控制吸烟的混杂作用后,饮酒与肺癌无关联(= 0.6509, P>0.25) 注意针对ORMH的2检验是在排除了混杂偏倚的基础上再排除随机误差,而针对cOR的2检验是建立在没有排除混杂偏倚的基础上的