病例对照研究
概 念 比较患某病者与未患该病的对照者既往暴露于某个(或某些)可能危险因素的百分比差异,以判断这(些)因素与该病有无关联及关联程度大小的观察性研究方法。
人数 暴露 疾病 A C B D + + - 研究人群 + - -
从“果”求“因” 暴露并不限于外界因子。 调查时暴露因素可以多项。
用 途 广泛探索疾病的可疑危险因素 深入检验某个或某几个病因假设 为队列研究提供明确的病因线索
种 类 按研究目的 探索性病例对照研究 检验性病例对照研究 按配比分类 不匹配 匹配(群体匹配、个体匹配)
实 例 吸烟与肺癌 已烯雌酚激素与阴道腺癌
实例1:吸烟与肺癌 Doll和Hill于1950年报道了他们应用病例对照研究的方法研究了吸烟与肺癌的关系。 709例肺癌病例 637例肠癌病例 709例非肺癌对照病例
肺癌病例对照研究吸烟史比较 吸烟史 病例 对照 合计 吸烟 688 650 1 338 不吸烟 21 59 80 709 1 418
肺癌病例对照研究吸烟史比较(男性) 吸烟史 病例 对照 合计 吸烟 647 622 1 269 不吸烟 2 27 29 649 1 298
肺癌病例对照研究吸烟史比较(女性) 吸烟史 病例 对照 合计 吸烟 41 28 69 不吸烟 19 32 51 60 120
实例2:已烯雌酚激素与阴道腺癌 美国Boston Vincent纪念医院 1966-1969年女青年(15-20岁)阴道腺癌18例(17+1) 危险因素(阴道局部刺激史、性生活史、避孕药物、母亲妊娠期间的情况)
病例对照研究的步骤 复习文献和提出假设 提出研究计划或设计书(1-7) 执行调查研究计划 资料整理和分析 写出研究报告
病例和对照的选择 病例的选择 对照的选择
病例的选择 来源:医院、普查或抽查、发病和 死亡报告病例。 注意:选择性偏倚 疾病的诊断标准 新发病例、现患病例、死亡病例
对照的选择 来源: 最好是全人群中的无偏倚样本 注意:与病例组的可比性
病例和对照常用的选择方法 病 例 对 照 一个医院所有已诊断的病例 同个医院内患其他病的病例 一个门诊部所有已诊断的病例 病 例 对 照 一个医院所有已诊断的病例 同个医院内患其他病的病例 一个门诊部所有已诊断的病例 同个门诊部诊断的其他病例 多个医院或门诊部诊断的病例 多个医院或门诊部诊断的其他病例 以上任何一种方法选出的病例 病例所在同一街道或住宅区中的健康人 在人群中普查或抽查出的所有病例 在人群中抽查的非病例 社会团体中所有诊断的病例 社会团体中抽样的非病例 以上任何方法选出的病例 病例的配偶、同胞、同事、亲朋、同班同学等
配比病例对照研究 使对照在一些特征上与病例相同 常用配比变量 1:1, 1:2, 1:3, 1:4 配比 配比过头 (over matching)
研究因素的选择 因素的规定 调查前有明确的规定(定量、分级) 因素的收集 病例组与对照组的调查项目相同 最好有记录或材料作依据 客观指标更好
样本大小 样本大小公式: (Zα 2PQ + Zβ P0Q0 + P1Q1 )2 N= ----------------------------------------- (P1 – P0)2
例: 现设计一吸烟与肺癌关系的病例对照研究,估计对照组中有吸烟史20%,比值比约2,要求α=0.05,β=0.10,求样本大小。
病例对照研究的资料分析 资料的整理 资料的分析
资料的整理 原始资料的再核查 资料的分组、归纳或编码、输入
资料的分析 描述性统计 一般特征描述、均衡性检验 推断性统计
推断性统计 未分层资料的基本分析 分层资料的分析 暴露分级资料的分析 匹配数据的分析
未分层资料的基本分析 暴露史 病例 对照 合计 有 A B A+B=N1 无 C D C+D=N0 A+C=M1 B+D=M0 A+B+C+D=T
吸烟与肺癌关系的病例对照研究 吸烟史 病例 对照 合计 吸 烟 41(a) 28(b) 69(N1) 不吸烟 19(c) 32(d) 51(N0) 合 计 60(M1) 60(M0) 120(T)
比较两组暴露史的比例 (ad – bc)2 T χ2=------------------- N1 N0 M1 M0
计算相对危险度 比值比(odds ratio)估计 病例组有暴露史与无暴露史的概率之比 a/m1 /c/m1 比值是指事件发生的概率与不发生的概率之比 病例组有暴露史与无暴露史的概率之比 a/m1 /c/m1 对照组有暴露史与无暴露史的概率之比 b/m0 /d/m0
比值比为 ad OR= ----- bc 为什么OR能用来估计RR? 疾病的发病率或死亡率不高时
OR的可信限 Miettinen法: ORL, ORU = OR(1±1.96/χ) Woolf法: ORL, ORU = lnOR±1.96 Var(lnOR) Var(lnOR) = 1/a + 1/b + 1/c + 1/d
分层资料的分析(i为第i层的数据) 暴露史 i层 病例 对照 合计 有 ai bi N1i 无 ci di N0i M1i M0i Ti
先将各层资料按不分层资料分析方法进行比较,然后再分析分层后有关变量与疾病的总的关系。
计算总卡方值 [Σai – ΣE(ai)]2 χ2MH= ---------------------- ΣV(ai) ΣE(ai)= ΣM1i N1i/ Ti ΣV(ai)= ΣM1i M0i N1i N0i/ Ti2(Ti – 1) 校正χ2MH
计算比值比及可信限 Σai di/ Ti ORMN=----------------- Σbi ci/ Ti ORL, ORU=OR(1±1.96/χ)
饮酒与食管癌关系的病例对照研究 饮酒史 病例 对照 合计 有 171 381 552 无 29 395 424 200 776 976
饮酒与食管癌关系的病例对照研究(不吸烟者) 饮酒史 病例 对照 合计 有 69 191 260 无 9 259 266 78 448 526
饮酒与食管癌关系的病例对照研究(吸烟者) 饮酒史 病例 对照 合计 有 102 190 292 无 20 138 158 122 328 450
不分层: χ2= 84.29 OR= 6.11 分 层: χ2MH= 76.84 ORMN= 5.55
暴露分组资料的分析 将资料归纳成列联表 对列联表数据作卡方检验 计算出各暴露水平的比值比 计算总OR
吸烟与肺癌关系按性别与吸烟数归纳表 15- 5- 1- 0- 每日吸烟数 组别 5.5 4.0 1.7 1.0 SRR 4.21 3.20 0.98 1.00 OR 21 29 19 51 合计 6 10 12 32 对照 X2=11.28 df=3 P<0.001 15 7 病例 女性 17.93 11.52 8.10 638 543 88 274 (b3) 293 (b2) 55 (b1) 27 ( d ) X2=43.15 364 (a3) 250 (a2) 33 (a1) 2 ( c ) 男性 15- 5- 1- 0- 每日吸烟数 组别
行×列表理论数合并整理表 合计 对照组 病例组 15- 5- 1- 0- 每日吸纸烟数 分 组 659(659.00) 572(572.00) 107(107.00) 80(80.00) 合计 280(329.5) 303(286) 67(53.50) 59(40.00) 对照组 379(329.5) 269(286) 40(53.50) 21(40.00) 病例组 15- 5- 1- 0- 每日吸纸烟数 分 组
计算总的比值比 由于男女的比值比不同,故不宜求总OR,以SRR来说明其总的比值比。 (Σai di/ bi) SRRi=----------------- (Σci)
配对数据的分析(1:1) 对 照 病 例 有暴露史 无暴露史 合计 a b a+b c d c+d a+c b+d a+b+c+d
配对数据的分析(1:1) (续) 两组暴露史比较 χ2=----------- 校正χ2= -------------- b+c b+c 配对数据的分析(1:1) (续) 两组暴露史比较 (b –c)2 (|b-c|-1)2 χ2=----------- 校正χ2= -------------- b+c b+c 比值比和可信限 c OR=---- ORU= OR(1±1.96/χ) b
高血压与心肌梗死的病例对照研究 150 500 40 35 15 100 合计 75 SBP<140 60 SBP>=140 对 照 心梗病例
病例对照研究的偏倚及其防止 常见偏倚 选择性偏倚 信息偏倚 错误分类偏倚 混杂偏倚 防 止 设计、实施和分析阶段防止
病例对照研究的优点 省人力、物力、容易组织实施 所需样本少,适用于罕见病的研究 短期内得出结果 检验病因假设,探索尚不够明确的众多 因素,一次调查可得到多个因素与一种疾病的联系
病例对照研究的缺点 难以避免回忆偏倚 代表性较差,容易产生选择性偏倚 一般不能直接计算发病率、死亡率和RR,不能确定某因素与疾病间的因果联系