流行病学研究中的偏倚 许锬
研究结果的变异性 个体水平的变异性 群体水平的变异性 样本水平的变异性
概 述 变异性(variability) 研究结果包括描述性和分析性数据(指标)的变动或波动。
变异的来源分为两个层次 生物学(真实)变异和测量变异 生物学变异 真实的客观变异 测量变异 测量过程的误差 随机变异和系统变异 生物学变异 真实的客观变异 测量变异 测量过程的误差 随机变异和系统变异 随机变异 绝对值和方向交错变化,正态分布 系统变异 绝对值和方向保持恒定
个体水平的变异性 某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。
个体状态 测量误差 日间变异 年龄 膳食运动 环境 仪器标度差 仪器精密度差 读数或记录错误
群体水平的变异性 个体的累计变异 群体中的个体具有不同的遗传素质并受环境影响 常大于个体变异 根据群体的变异范围确定“正常值”范围,用于判定个体测得值是否“正常” 群体水平的变异性受测量误差影响
样本水平的变异性 通过不同样本研究所得结果的差异性 为什么高水平的血清总胆固醇是不利的或不健康的? 这可以在关于血清总胆固醇与心血管死亡风险呈正相关的研究中找到答案。 如Framingham心脏研究。
描述性结果的样本变异性 样本A 样本B 样本C
在上图中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。 增大样本含量,样本的变异性会减少。
分析性结果的样本变异性 研究A(研究对象200人,随机分配到两组) 膳食改良组 降低胆固醇药物组 膳食改良组 降低胆固醇药物组
研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,发生重叠,无显著性差异。 如图8-2,研究A和B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。 研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,发生重叠,无显著性差异。 研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%CI较小,未发生重叠,有显著性差异。
样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。 样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。
研究的真实性 概 述 真实性(效度) 定义 指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
内部真实性 内部真实性(internal validity) 定义 研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。 改善措施 限制研究对象的类型和研究的环境条件。
外部真实性 外部真实性(external validity) 定义 研究结果与推论对象真实情况的符合 程度,又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。 改善措施 增加研究对象的异质性,使得研究对象的代表性范围扩大。
研究误差 研究误差是真实性的反面,变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。
研究误差的两种常见类型 系统误差:因研究设计或实施过程不恰当、或结果分析错误所致,也称为偏倚。来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差 。 随机误差:常来源于研究对象的选择过程,即抽样过程。可用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。
举例:用动脉血压计测量某人群舒张压 真值均值 测量均值 血压计法测量某人舒张压值的分布 发生频次 80 100 偏倚 随机误差 舒张压( mmHg ) 80 100 血压计法测量某人舒张压值的分布
临床科学研究中的误差与样本的关系 误差 随机误差 (机遇) 系统误差 (偏倚) 研究样本 (来源: Rothman, 2002)
偏倚 偏倚是指在调查研究设计或实施阶段,由于某种或某些因素的影响,使得研究或推论结果与真实情况存在系统误差,或者指在研究或推论过程中所获得的结果系统地偏离其真实值,属于系统误差。
偏倚的方向 偏倚的方向是指对事物所产生的效应的估计值是大于或小于效应真值所做出的一种定性判断,不涉及偏倚的大小。
效应值为危险效应 正偏倚与负偏倚 正偏倚 负偏倚 RR=1 Null value RR>1
效应值为保护效应 负偏倚 正偏倚 RR<1 RR=1 Null value
颠倒偏倚 RR>1 RR=1 Null value RR=1 Null value RR>1
常见偏倚 选择偏倚 (selection bias) 信息偏倚 (information bias) 混杂偏倚 (confounding bias)
指由于入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的误差。这种偏倚常发生在设计阶段。 选择偏倚 (Selection Bias) 指由于入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的误差。这种偏倚常发生在设计阶段。
无偏抽样
选择偏倚
选择偏倚 入院率偏倚 (admission rate) / Berkson偏倚 现患病例-新发病例偏倚 (prevalence-incidence bias) / Neyman偏倚 检出征候偏倚 (detection signal bias) / 暴露偏倚 (unmasking bias) 时间效应偏倚 (time effect bias) 读书
入院率偏倚 (admission rate) / Berkson偏倚 利用医院就诊或住院病例为研究对象,由于入院率不同而导致偏差。
入院率偏倚 (admission rate) / Berkson偏倚 病例组与对照组(其他疾病的患者)入院率不同 入选的与不入选的暴露率不同 疾病严重程度、患者经济状况、就诊方便与否都会影响入院率 解决办法:不同类型的多家医院 入院病人
入院率不同的原因 特别是用住院病人进行研究时,很容易产 生这种偏倚,主要是因为住院病人作为研究对 象时可能没有包括: (1)抢救不及时而死亡的病例 (2)距离医院远的病例 (3)无钱住院的病例 (4)病情轻的病例 (5)此外不同医院的技术专长、专业水平也会 造成不同疾病在不同的医院的就诊断或住院率 的差别。
例如:在一般人群和住院病人中研究骨和运动器官疾 病与呼吸道疾病之间的关系。 一般人群 住院病人 + – 合计 + – 合计 一般人群 住院病人 + – 合计 + – 合计 + 17 207 224 5 15 20 – 184 2376 2560 18 219 237 合计 201 2583 2784 23 234 257 OR 1.06 4.06 呼吸道疾病
例:以糖尿病为对照研究肝癌与高血压的关系,假如人群中糖尿病和肝癌患者各1000人,两种病人暴露于高血压者各200人,暴露率为20%,计算结果如下: 高血压 肝癌 糖尿病 合计 + 200 200 400 – 800 800 1600 合计 1000 1000 2000 OR=ad/bc=200×800/200 ×800=1 说明肝癌的发生与高血压无关
肝癌合并高血压者200*20%+(200-40)*40%=104 肝癌(无高血压者)=800*20%=160 假定肝癌、糖尿病、高血压患者的入院率分别为 20%,50%和40%,计算结果如下: 肝癌合并高血压者200*20%+(200-40)*40%=104 肝癌(无高血压者)=800*20%=160 糖尿病合并高血压者200*50%+(200-100)*40%=140 糖尿病(无高血压者)=800*50%=400
假定肝癌、糖尿病、高血压患者的住院率分别为 20%,50%和40%,计算结果如下: 高血压 肝癌 糖尿病 合计 + 104 140 244 – 160 400 560 合计 264 540 804 OR=ad/bc=104 ×400/160 ×140=1.86 说明两者有联系
社会阶层与颈椎病 假定某人群中有6000人患颈椎病,6000人患冠心病,并且在患这两种疾病的人中各有20%的人属于上等社会阶层。 这两种疾病的病人社会阶层情况: 1.患冠心病并属上等阶层:1200人 2.患颈椎病并属上等阶层:1200人 3.患冠心病不属上等阶层:4800人 2.患颈椎病不属上等阶层:4800人
OR=1200×4800/1200×4800=1 χ2=1 , P>0.05
又假定患冠心病者入院率为60%,颈椎病为25%,上等阶层者因接受保健检查的入院率为40%。那么实际入院人数为: 1.患冠心病并属上等阶层:共1200人, 正常入院:1200×60%=720人 接受保健检查入院:480×40%=192人 实际入院人数:720+192=912人 2.患冠心病不属上等阶层:共4800人 正常入院:4800×60%=2880 实际入院人数: 2880
3.患颈椎病并属上等阶层:共1200人, 正常入院:1200×25%=300人 接受保健检查入院:900×40%=360人 实际入院人数:300+360=660人 4.患颈椎病不属上等阶层:共4800人 正常入院:4800×25%=1200 实际入院人数:1200
颈椎病与社会地位的关系: OR=660×2880/912×1200=1.73(P<0.001)
现患病例—新发病例偏倚 用于病例对照研究或现况研究的病例一般是研究期间的现患病例,而不包括死亡病例和病程短、轻型、不典型的病例。 存活病例中又有新发和现患病例。存活同死亡病例在所研究的因素方而有系统差异。新发同现患病例间也有系统差异; 某些病人患病后,可能会改变原来的某些暴露因素,这种用于研究的病例类型(现患病例)显然会与队列研究或实验研究不同(多用新发病例),其产生的偏倚即为现患病例—新发病例偏倚。
现患-新发病例偏倚 (prevalence-incidence bias) / Neyman偏倚 入选的为现患或存活病例 不包括死亡病例、病程短的病例 解决办法:新发病例
例如:Friedman等人在美国弗明汉地区对胆固醇与冠心病的关系中发现,男性居民在队列研究和病例对照研究中RR和OR分别为2.4和1.16, 原因:冠心病病人在确诊后,改变了原来的生活习惯或嗜好,从而使血中胆固醇水平降低或与正常人相比血中胆固醇水平增长速度较慢所致。
血胆固醇与冠心病的关系 队列研究 病例对照研究 病例 对照 合计 病例 对照 合计 >75 85 462 547 38 34 72 队列研究 病例对照研究 病例 对照 合计 病例 对照 合计 >75 85 462 547 38 34 72 <75 116 1511 1627 113 117 230 合计 201 1973 2174 151 151 302 RR=2.40 OR=1.16 胆固醇水平
以医院中心肌梗死病人为病例进行病例对照研究,得到结论:大量饮用咖啡与心肌梗死无关。 而队列研究表明:大量饮用咖啡者心肌梗死发病危险性是对照的2倍。 原因: Neyman bias 50%的心肌梗死患者入院前死亡。调查对象只是心肌梗死后的幸存者; 死亡者多是大量饮用咖啡者且时间较长; 入院的未死亡病例只是一般的饮用者;
检出征候偏倚 指在疾病和暴露之外存在一个征候因素,即一种临床或体征。这种症状或体征不是疾病的危险因素,但人们因具有这种征候去就诊,从而提高早期病例的检出率,导致过高估计暴露程度而发生系统误差,最终可能得出该疾病有联系的错误结论。
检出征候偏倚 (detection signal bias) / 暴露偏倚 (unmasking bias) 暴露者较不暴露者更易因某些症状较早较频就医检查,提高了早期病例检出率 如果入选者中早期病例较多的话,则暴露比例必然被虚假的 解决办法:早、中、晚期病例
雌激素与子宫内膜癌 1975年Ziel和Finkle用病例对照研究设计,从美国加州洛杉矾妇女中研究口服雌激素同子宫内膜癌之间的关系,结果认为两者之间存在高度关联,结论是口服雌激素是妇女患子宫内膜癌的危险因素。
1978年,Horwitz和Feinstein指出,使用雌激素可以刺激子宫内膜生长,从而使子宫容易出血。因而服用者较早、较频繁地去求医,从而有可能使医生能较多地早期发现子宫内膜癌病人。 那些不服雌激素的无症状子宫内膜癌病人.由于没有或少有子宫出血的症状,因此不会去医院,因而也就不易于被诊断出来,导致子宫内膜癌病例中服雌激素的比重人为地增加了,其结果得出子宫内膜癌与使用雌激素有关的虚假关联。
服用雌激素的子宫内膜癌病人中,79%为早期病人;而非服用雌激素的子宫内膜癌病人中,早期病人仅占55%。以上实例说明发生选择偏倚的重要原因之一是选入的研究对象在所研究的特征方面同未选人的对象有差异。
时间效应偏倚 许多慢性病(如恶性肿癌、冠心病等)自接触有效暴露(内、外环境的危险因素)之日起至出现临床症状止,其间经过一段漫长的潜隐过程,实际上是有暴露史但未出现症状,现有检测手段未能发现有症状的病人;由于无明显症状,因此被错误归人健康对照组。
时间效应偏倚 (time effect bias) 某些个体尚处于早期病变阶段、缺乏适当的检测手段,因此易被视为无病个体 入选病例组的个体中较多的为已进入临床疾病阶段、能够被检测出来的个体 解决办法:提高检测早期病例的灵敏度
二战之后西方妇女吸烟的人数迅速增加,直到20世纪70年代后才表现出妇女肺癌发生明显上升,原因在于开始暴露至发病的时间很长。 在遗传性疾病中,未到外显年龄的观察对象被分配到健康对照组,常发生结果估计过低的偏倚。 进行病例对照研究时,那些暴露后即将发生病变的人,已发生早期病变而不能检出的人,或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组。
易感性偏倚(susceptibility bias) 危险因素后不同个体的易感性可能不同,高易感性的个体又有主动避免继续暴露的倾向,而低易感性者可能并不在意暴露。 进行职业性肿瘤的前瞻性研究时,选择接触职业性毒物的工人作为观察对象,这些人很可能都是不易患肿瘤的人员,而对该毒物敏感的那些人可能一开始就不选择该职业,或者虽然选择了这一职业但因不适应很快调离去从事其他职业或早已转出而失访,这种偏倚称健康工人效应偏倚,或称易感性偏倚。
无应答偏倚(non-respondent bias) 是因为研究样本中的无答复者,即调查对象中那些没有按照研究设计对被调查的内容予以应答或不依研究设计接受治疗者,由于其身体素质、暴露状况、患病情况、嗜好等可能与应答者不同,产生的偏倚称为无应答偏倚。这里应强调的是:不应答者泛指研究设计中应予调查但因各种原因拒绝回答问题的人或失访的入。
排除偏倚(exclusive bias) 设计时应规定哪些个体不能选作研究对象,即规定排除标准。当研究对象在确定过程中,没有依照事先设计要求对等原则或标准,从观察组或对照组中排除某些研究对象,可导致因素与疾病之间的联系被错误估计,称为排除偏倚。 利血平与乳腺癌关系: 病例组含有高血压患者(部分服利血平), 对照组排除高血压患者。 高血压患者增加了病例组利血平的暴露率,可能会导致偏倚。
志愿者偏倚 (volunteer bias) 志愿参加观察的研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有差异,因志愿者常被入选为观察对象,而非志愿者常被落选,故这样的观察或研究结果肯定有选择偏倚
常见偏倚 选择偏倚 (selection bias) 信息偏倚 (information bias) 混杂偏倚 (confounding bias)
信息偏倚 信息偏倚指在研究实施阶段,在资料的观察、测量及收集方法上,诊断试验的灵敏度、特异度以及患者在提供各种有关信息的难确性方面都可能有所不足,而这种不足或缺陷在各比较组问有系统的差别或不一致,可导致研究实施阶段产生信息偏倚。 他在各种类型的流行病学研究中均可发生,可来自于研究对象、研究者本身,测量的仪器、设备、方法等。
信息偏倚 常见种类 暴露怀疑偏倚 诊断怀疑偏倚 测量偏倚 报告偏倚 回忆偏倚 归类错误偏倚 诱导偏倚
暴露怀疑偏倚( exposure suspicion bias) 研究者在收集并确定病例组的暴露比例时所具有的认真、细致、深入程度同对照组相比有重大的系统差别 Nishiyama等对儿童甲状腺癌过去放射性物质暴露史的调查发现,以常规和查阅医疗记录方法调查有暴露史者分别为28%和0%;而经过细致的询问,同一对象组的放射性物质暴露史变为47%和50%。可见不可比的调查获得的照射率有明显差异。
诊断怀疑偏倚(diagnostic suspicion bias) 研究者带有“先人之见”的主观倾向性,以一种主观偏见或愿望来左右诊断,由于研究者事先了解研究对象研究因素的暴露情况,怀疑其已患病,或在主观上倾向于应该出现某种阳性结果,因此在作出诊断或分析时,倾向于自己的判断。于是对暴露者和未暴露者在询问暴露史、疾病史和作各种检查时,采取了不可比的做法,
研究口服避孕药与妇女下肢血栓性静脉炎关系的队列研究中,观察者对口服避孕药妇女,会更加频繁和仔细地寻求静脉炎的证据,认真地检查身体,并对更多的怀疑者作进一步检查,这必然会更多地发现病例,尤其是那些病情较轻,需较复杂准确的诊断检查才能确诊的病例。相反有可能较马虎地检查未服避孕药的妇女,造成结果的偏倚。
测量偏倚(detection bias) 报告偏倚(reporting bias) 实验过程中由于实验的仪器和试剂质量及操作人员的操作误差造成的偏倚称为测量偏倚,又叫检出偏倚 报告偏倚(reporting bias) 研究对象的有意做假所造成,即有意的夸大或缩小某些信息而导致的偏倚,亦被称作说谎偏倚
回忆偏倚(recalling bias) 研究对象在回忆以往发生的事件或经历时,由于记忆失真或不完整在准确性和完整性上的差异所致的系统误差
诱导偏倚(inducement bias) 调查者的询问技术不正确,或为获得阳性结论诱使被调查者做一倾向性回答,往往表现为对病例组做诱导,而对对照组不做诱导或负诱导,由此只能作出虚假的结论
错误归类偏倚 或称错分偏倚,错误分类偏倚。每项病症所用的客观诊断试验或测定仪器都有一定的灵敏度和特异度,而灵敏度和特异度都不可能是100%,于是就会产生一定的假阳性和假阴性错误即误诊和漏诊。这就发生了错分,即本应是病人,却将他分入了对照组,而本应是健康者,将其分人了病例组。错分偏倚在病例对照研究和前瞻性研究中都可能发生。 错分偏倚在对疾病状态和暴露状态判断时也发生。混杂因素也可以导致归类错误偏倚。错分有差异性与非差异性。
暴露的非差异性错分 暴露:酗酒 调查方式:询问 解决办法:客观的指征、明确的定义
暴露的非差异性错分 暴露:被动吸烟 调查方式:询问 解决办法:客观的指征、明确的定义
暴露的非差异性错分 解决办法:客观的指征、明确的定义
暴露的差异性错分 暴露:母亲孕期暴露 疾病:新生儿先天畸形 调查方式:询问 病例比对照会报告更多的不实的暴露 对照较病例会漏掉更多的暴露
无差异性错误分类和差异性错误分类 无差异性错误分类 研究真实数据 错误分类数据 差异性错误分类 研究真实数据 错误分类数据
常见偏倚 选择偏倚 (selection bias) 信息偏倚 (information bias) 混杂偏倚 (confounding bias)
混杂偏倚 (confounding bias) 由于混杂因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,这个现象叫混杂偏倚
火柴与肺癌 Right, in a case-reference study, the measure of association of choice is an odds ratio and this 2x2 table gives the framework for calculating it. So, is he on to something, this tobacco company epidemiologist? Does exposure to matches - and all those burnt carbons- cause lung cancer? Why not?
吸烟、火柴与肺癌 OR粗 = 8.8 (7.2, 10.9) OR吸烟者 = 1.0 (0.6, 1.5) So, after stratifying by smoking status, you get 2 two-by-two tables. In each one, all subjects are homogeneous in terms of smoking. In this table, all the subjects are smokers and in this one all the subjects are non-smokers. What do we see? The effect of matches seen in the crude table is no longer seen in the smoking-specific strata. What we have formally done here is adjust for smoking and after adjustment, we no longer see an effect of matches in the development of lung cancer. OR粗 = 8.8 (7.2, 10.9) OR吸烟者 = 1.0 (0.6, 1.5) OR不吸烟者 = 1.0 (0.5, 2.0)
吸烟、火柴与肺癌 OR粗 = 21.0 (16.4, 26.9) OR携带火柴 = 21.0 (10.7, 41.3)
于是,我们关掉了Sonia房中的夜灯,开始每天在屋子里抹黑蹒跚 So, off went the nightlight and we began to stumble around her room. 于是,我们关掉了Sonia房中的夜灯,开始每天在屋子里抹黑蹒跚
These authors believed that the apparent association use of a night light and child’s myopia was likely because of confounding by parent’s myopia. These authors provided direct data that nearsightedness in parents is associated with the use of night light, probably to help the parents see better. And, there is data to suggest that myopia is inherited; ie if parents have it, their kids are more likely to have it. So, this is an example, where parenteral myopia confounds the relationship between night lights and child’s myopia and there is no real direct, or what we call independent, association between use of night lights and child’s myopia.
我们的担心没有了,于是又把夜灯打开了,皆大欢喜 So, our fears relieved about night lights. . .. on comes the night light again and everyone is happy. 我们的担心没有了,于是又把夜灯打开了,皆大欢喜
与暴露相关 什么样的因素是/不是混杂因素? 混杂因素要么是所研究的暴露因素的“因”,要么是“果”,要么为简单“相关”,而非因果关系 混杂因素与所研究的暴露因素间的关联必须独立于其与所研究的疾病间的关联,即,混杂因素与研究的暴露因素间的关联必须可见于无病个体中
什么样的因素是/不是混杂因素? 与疾病相关 研究的暴露因素与疾病因果链上的中间变量不是混杂因素 不一定是疾病的“病因”,可以只是真正病因的一个标志指标 混杂因素与所研究的疾病间的关联必须独立于其与所研究的暴露因素间的关联,即,混杂因素与所研究的疾病间的关联必须可见于无暴露个体中 如果为所研究疾病的结果,不管其与所研究暴露因素的关系,该变量都不是混杂因素 研究的暴露因素与疾病因果链上的中间变量不是混杂因素
C 混杂因素 E 暴露因素 D 疾病
与暴露相关
与暴露相关
与疾病相关
与疾病相关
病因链上的中间变量
控制混杂的方法 研究设计阶段 资料分析阶段 随机化 限制 匹配 分层分析 多变量分析 匹配后还得再分层,否则会引入混杂 或者不匹配,只分层,可以控制混杂
偏倚判定方法 专业知识 分层分析进行定量判别
偏 倚(bias) 根据专业知识判别法 1、人口统计学因素:性别、种族、职业、经济收入、文化水平等 2、研究因素以外的其他危险因素 如:饮水不卫生与食源性腹泻——营养不良 饮酒与银屑病——吸烟
M-H(Mantel-Haenszel)分层分析方法的步骤 混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近 得到控制混杂后的调整RR或OR 再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较
分层分析进行定量判别 1、含有某可疑混杂因素(f)时: 研究因素与研究疾病的效应估计值为: cRR或cOR,称为粗RR或OR 2、排除该f的可能混杂作用时: aRR或aOR,称为调整RR或OR 或aRRM-H或aORM-H表示
3、判断混杂 a 如cRR或cOR= aRRM-H或aORM-H,则f无混杂作用。cRR或cOR就不存在f的混杂偏倚 b 如cRR或cOR≠aRRM-H或aORM-H,则f有混杂作用。 cRR或cOR就存在f的混杂偏倚。 (1)、 cRR或cOR> aRRM-H或aORM-H,为正偏倚,阳性偏倚。 (2)、cRR或cOR< aRRM-H或aORM-H,为负偏倚,阴性偏倚。
分层资料的分析 队列研究 (1) 累计发病率资料
第三节 研究的偏倚 (2) 发病密度资料
第三节 研究的偏倚 病例对照研究 表8-6
举例:年龄是混杂因素? 表. 在对照组年龄与服用OC的关联 对照组 2=8.98, OR=3.91 (1.53~9.99)
SPSS-12 (Crosstabs) p97页表5-9
SPSS-12 (Crosstabs)
SPSS-12 (Crosstabs)
SPSS-12 (Crosstabs)
SPSS-12 (Crosstabs) 分层分析后,OR从2.20增加到2.79,提示因年龄的混杂作用,低估了暴露因素OC与心肌梗死间的关联,使之趋向于1
OR<40=2.80, OR40=2.78, 经检验,同质,可以计算总OR SPSS-12 (Crosstabs) OR<40=2.80, OR40=2.78, 经检验,同质,可以计算总OR
SPSS-12 (Crosstabs)
饮酒与肺癌的关系:按吸烟分层 表8-7 ai bi m1i ci di m0i ni n0 ti 表8-8
(2) 判定层间关联效应水平是否同质 按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验)的,可以应用M-H方法计算综合OR
(3) 计算综合或调整OR,并与粗OR比较 P >0.25
结论 吸烟对饮酒与肺癌的关联(cOR = 3.69)有混杂作用(cOR ≠ ORMH) 控制吸烟的混杂作用后,饮酒与肺癌无关联(= 0.6509, P>0.25) 注意针对ORMH的2检验是在排除了混杂偏倚的基础上再排除随机误差,而针对cOR的2检验是建立在没有排除混杂偏倚的基础上的