Download presentation
Presentation is loading. Please wait.
1
病例对照研究 case-control study
西安交大医学院 wn
2
有比较才有鉴别 凭差别方知根源 西安交大医学院 wn
3
内 容 概述 (定义、特点、用途) 研究步骤 (研究对象选择、样本含量确定、资料获取) 资料的整理与分析 主要偏倚 优缺点
内 容 概述 (定义、特点、用途) 研究步骤 (研究对象选择、样本含量确定、资料获取) 资料的整理与分析 主要偏倚 优缺点 西安交大医学院 wn
4
定 义 选择一组有研究疾病的人群(病例)和另一组未患该病的人群(称为对照),调查他们既往暴露于某些危险因素的情况及程度,以判断危险因素与疾病有无联系及联系程度大小的一种观察性研究方法。 西安交大医学院 wn
5
定 义 选择一组有研究疾病的人群(病例)和另一组未患该病的人群(称为对照),调查他们既往暴露于某些危险因素的情况及程度,以判断危险因素与疾病有无联系及联系程度大小的一种观察性研究方法。 即当前研究中打算研究的疾病 西安交大医学院 wn
6
定 义 选择一组有研究疾病的人群(病例)和另一组未患该病的人群(称为对照),调查他们既往暴露于某些危险因素的情况及程度,以判断危险因素与疾病有无联系及联系程度大小的一种观察性研究方法。 留意区分队列研究 按暴露、不暴露分组 西安交大医学院 wn
7
定 义 选择一组有研究疾病的人群(病例)和另一组未患该病的人群(称为对照),调查他们既往暴露于某些危险因素的情况及程度,以判断危险因素与疾病有无联系及联系程度大小的一种观察性研究方法。 暴露:接触过某些物质、具备某些特征、处于某种状态 暴露:有害的、有益的 西安交大医学院 wn
8
病例对照研究基本原理 a c b d 暴露 未暴露 某病患者 (病例) 非患者 (对照) a/(a+c) b/(b+d) 可 比 比 较
可 比 比 较 目标人群 发病时序 工作时序 西安交大医学院 wn
9
特 点 属于观察性研究 要设立对照组 观察方向由“果”到“因” 探索、检验病因假说 西安交大医学院 wn
10
病例对照研究基本原理 病例对照研究的特点 属于观察法 设立对照组 由“果”及“因”: 疾病暴露 探索、检验病因假说 观察法 实验法 数理法
是否有主动施加的干预措施? 观察法与实验法最主要的区别就是:研究者有没有主动的干预措施 西安交大医学院 wn
11
病例对照研究基本原理 病例对照研究的特点 属于观察法 设立对照组 由“果”及“因”: 疾病暴露 探索、检验病因假说 描述流行病学
分析流行病学 描述流行病学与分析流行病学的主要区别是在设计之初设立对照组 研究设计阶段是否设立对照? 西安交大医学院 wn
12
病例对照研究基本原理 队列研究/实验法 由“因”及“果”:暴露疾病 病例对照研究的特点 属于观察法 设立对照组
由“果”及“因”: 疾病暴露 探索、检验病因假说 队列研究/实验法 由“因”及“果”:暴露疾病 西安交大医学院 wn
13
病例对照研究基本原理 病例对照研究的特点 属于观察法 设立对照组 由“果”及“因”: 疾病暴露 探索、检验病因假说 描述流行病学 提供线索
描述流行病学 提供线索 分析流行病学 概括、检验假说 病例对照 概括、检验 队列研究 检验 实验流行病学 确证假说 病例对照研究的特点 属于观察法 设立对照组 由“果”及“因”: 疾病暴露 探索、检验病因假说 病例对照研究:筛选病因,检验假说 西安交大医学院 wn
14
用 途 1 广泛探索可疑的危险因素。 2 深入检验某个或某几个病因假说。 3 为进一步前瞻性研究提供明确的病因线索。 西安交大医学院 wn
15
病例对照研究设计 具体实施 (资料的收集) 数据分析 研究设计 结果解释 西安交大医学院 wn
16
病例对照研究设计 1、提出病因假设 ? 暴露 ? 疾病 ? 西安交大医学院 wn
17
病例对照研究设计 2、提出研究计划或设计 (1)明确研究目的,选择适宜的对照形式 (2)对象的来源与选择 (3)样本含量的估计
(4)暴露因素的定义及分级 西安交大医学院 wn
18
病例对照研究设计 (5)设计调查表 (6)可能的偏倚和质量控制 (7)获取资料的方法 (8)资料整理与分析方法 (9)经费预算
(10)人员分工及单位协调 西安交大医学院 wn
19
病例对照研究设计 3 、执行调查研究计划 (1)培训调查员与预调查 (2)实施调查 4、 资料的整理与分析 5、 结论与报告
西安交大医学院 wn
20
病例与对照的选择 (一) 病例的选择 1 病例的条件:诊断明确;配合较好 2 病例的类型: ● 新发病例 ● 现患病例 ● 死亡病例
● 新发病例 ● 现患病例 ● 死亡病例 3 病例的来源: ● 来源于医院(hospital-based) ● 来源于社区人群(population-based) 西安交大医学院 wn
21
病例与对照的选择 诊断疾病的标准 具体、明确 尽量采用国际通用或国内统一的诊断标准 自订标准:宽严适度(假阳性、假阴性)
控制外部因素,增强两组可比性 病例的 一些特征限定好后,对照要依据这些特征进行选择 可对病例的某些特征进行限定:年龄、性别、民族等 西安交大医学院 wn
22
病例与对照的选择 新发病例: 提供的信息较为可靠 现患病例: 掺入疾病迁延及存活因素在内 疾病患者 存活时间长,有机会入选研究
死亡病例: 信息准确性较差 社区、社区监测资料或普查、抽查的人群资料-社区为基础的 来自社区: 代表性较强,但不易得到 来自医疗机构: 易获得,难以定义源人群,易发生选择偏倚 西安交大医学院 wn
23
病例与对照的选择 (二) 对照的选择 1 对照选择的原则:来自病例产生的总体 与病例有可比性 2 对照来源: ● 来自社区一般人口
● 来自病例的亲属(兄弟姊妹、配偶) 同事、邻居 ● 来自医院 西安交大医学院 wn
24
应该选取多种疾病而不是一种疾病的病人作对照
要求对照没有患和研究因子与研究疾病有关的其他疾病的可能 吸烟(暴露) 肺癌(病例) 慢性支气管炎(对照?) 高盐饮食(暴露) 胃癌(病例) 慢性胃炎(对照?) 西安交大医学院 wn
25
病例与对照的选择 3 选择对照的形式 (1)不匹配:对照数量等于或多于病例
(2)匹配(matching):要求对照在某些因素或特征方面与病例相同或基本相同。 ① 匹配的形式 ● 成组匹配(group matching) ● 个体匹配(individual matching) 西安交大医学院 wn
26
病例与对照的选择 病例与对照不匹配 目标人群 患病人群 未患病人群 病例组 = < 对照组 西安交大医学院 wn
27
频数匹配 (frequency matching)
病例与对照的选择 病例与对照匹配 频数匹配 (frequency matching) 5/10 2/10 3/10 目标人群 患病人群 未患病人群 某些特征 西安交大医学院 wn
28
1:1个体匹配 (individual matching)
病例与对照的选择 病例与对照匹配 1:1个体匹配 (individual matching) 目标人群 患病人群 未患病人群 某些特征 以个体为单位 配对 (pair matching) 西安交大医学院 wn
29
1:R个体匹配 (individual matching)
病例与对照的选择 病例与对照匹配 1:R个体匹配 (individual matching) 目标人群 患病人群 未患病人群 某些特征 1:2, 1:3 …1:R 西安交大医学院 wn
30
病例与对照的选择 ② 匹配目的 ● 提高研究效率 ● 排除匹配(混杂)因素的干扰
③ 匹配过头(overmatching):对并不应该匹配的因素进行匹配,结果使研究因素和疾病之间的真正关联减弱或消失。 西安交大医学院 wn
31
病例与对照的选择 Matching, 即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。
西安交大医学院 wn
32
病例与对照的选择 实例 过高的估计暴露与疾病间的关联 暴露: 钙拮抗剂 疾病: Alzheimer’s disease 混杂因素: 年龄
年龄: 混杂因素 年龄, Alzheimer’s disease 年龄, 服用钙拮抗剂 年龄:(不匹配)对照组 < 病例组 较少服用钙拮抗剂 An investigator wishes to investigate a possible association between use of calcium channel blockers (钙拮抗剂用于高血压、心脏病的治疗drugs used for blood pressure and heart disease) and Alzheimer’s disease. Age is obviously a key confounder: increasing age is associated with use of the drugs in question and with the onset of Alzheimer’s disease 病人年纪偏大,而从非病人群体中随机抽取的对照组必定年龄偏轻Unmatched controls drawn from the general population will be younger and hence less likely to be using calcium channel blockers, leading the crude analysis to overestimate any potential association 过高的估计暴露与疾病间的关联 西安交大医学院 wn
33
病例与对照的选择 实例 较多的病例 较多的对照 按年龄匹配 后再分层 解决方案: 按年龄进行分层分析 年轻组 较少的病例 年老组 较少的对照
分层分析是控制混杂的一种有效方式 This can be handled through stratified analysis by age (e.g. various age categories) If unmatched general population controls are used, there may be few controls in the oldest age strata, leading to imprecise OR estimates in those strata (wide confidence intervals) Matching ensures sufficient numbers of subjects for each level of the matching variable(s) - in this case, age Matched cohort studies are also more efficiently analyzed using stratification by the matching factor(s) OR不精确, 可信区间宽 西安交大医学院 wn
34
病例与对照的选择 匹配因素 混杂因素 (已知、可疑) 复合因素:年龄 + 性别 不能匹配的因素 研究因素与疾病因果链中的中间变量
只与可疑暴露有关而与疾病无关的因素 不是混杂因素 西安交大医学院 wn
35
病例与对照的选择 不能滥用匹配! 匹配带来的问题 增加工作难度(费用、时间) 限制样本量 匹配因素将无法再进行分析 匹配过头 损害统计效率
损害真实性 损害费用效益 不能滥用匹配! 匹配因素不能分析其与疾病的关系,也不能充分分析它与其它因子的交互作用 匹配过头:不不必要的项目列入匹配,会丢失信息,增加工作难度,反而降低研究效率 寻找适当的匹配对照有时很困难,成本高,限制了样本量(例如,如果找不到合适的对照,就得扔掉病例)。因此,统计学效率上的收益被总效率的降低抵消了。 在病例对照研究中,被匹配了的因素将无法再用于分析其与疾病间的关联。一般来说,匹配限制了研究一举多得的优势。 一旦实施了匹配,后果无法挽回。如果你碰巧匹配了因果链上的一个中间变量,你将无法了解所研究的暴露因素经由这条因果链的作用。例如,研究性行为对子宫颈癌的影响。按人乳头瘤状病毒的感染状况进行匹配,将无法了解性行为的真实效应。 如果匹配了的因素实际上不是混杂因素,则统计学精确度要比不匹配时还要差。 Suffice it to say, that the heyday for matching was clearly in the past before the advent of newer mathematical modeling techniques and the computers to run them. Think carefully before you match and seek advice! 王建华. 病例对照研究. 见: 谭红专, 主编. 现代流行病学. 北京: 人民卫生出版社 p 西安交大医学院 wn
36
病例与对照的选择 不匹配 匹配 频数匹配 个体匹配: 1:1、…、1:4、… 广泛探索危险因素 罕见病/符合规定的病例数很少
病例的某种特征构成特殊,随机抽取的对照组很难与病例组均衡可比 匹配比不匹配的统计学检验效率高 西安交大医学院 wn
37
样本含量的确定 1 影响样本大小的因素 2 样本含量的估计方法 ① 研究因素在人群中的暴露率P0 ② 估计该因素引起的RR或OR
③ α值 ④ 把握度(1- β ) 2 样本含量的估计方法 ① 查表法 ② 公式计算法 西安交大医学院 wn
38
样本含量的确定 ● 非匹配设计两组例数相等时 n=2pq(Uα+Uβ)2/(p1-p0)2
P1=p0RR/[1+p0(RR-1)] ;P=(p1+p0)/2 ; q=1-p ● 非匹配设计两组例数不等时 n=(1+1/c)pq(Uα+Uβ)2/(p1-p0)2 p=(p1+cp0)/(1+c); q=1-p 西安交大医学院 wn
39
样本含量的确定 ● 1:1匹配设计 m=[Uα/2+Uβ ( p-p2)1/2]2/(p-1/2)2
P=OR/(1+OR)≈RR/(1+RR) M ≈ m/(p0q1+p1q0) P1=p0RR/[1+p0(RR-1)]; q1=1-p1; q0=1-p0 ● 估计的样本含量非绝对精确,也非越大越好,两组含量相等时效率最高。 西安交大医学院 wn
40
具体实施 (资料的收集) 数据分析 结果解释 研究设计 西安交大医学院 wn
41
资料获取方式 ★ 病例与对照资料来源及收集方法应一致 1 调查表 2 查阅档案 3 采样化验 4 实地查看 5 咨询等 变量选择 变量定义
变量测量 西安交大医学院 wn
42
具体实施 (资料的收集) 数据分析 结果解释 研究设计 西安交大医学院 wn
43
资料整理与分析 1 原始资料的核查、编码录入 2 描述性分析 (1)一般情况描述 (2)均衡性检验 3 推断性分析 西安交大医学院 wn
44
病例对照研究资料整理表 暴露 疾病 合计 病例组 对照组 有暴露 a b n1 无暴露 c d n2 m1 m2 N 西安交大医学院 wn
45
队列研究中关联效应的估计 复习 暴露组 : 非暴露组 (结局事件为发病) 频率指标 累积发病率 人时发病率 (发病密度) 危险度 率
关联效应指标 RR 危险比、相对危险度 率比、相对率 西安交大医学院 wn
46
Person-time incidence rate, incidence density
复习 Cumulative incidence Person-time incidence rate, incidence density risk rate Risk ratio, relative risk Rate ratio, relative rate 西安交大医学院 wn
47
复习 累积发病率:相对危险度 (危险比) RR 队列研究资料整理表 (1) 西安交大医学院 wn
48
复习 人时发病率:相对率 (率比) RR 队列研究资料整理表 (2) 西安交大医学院 wn
49
5 病例对照研究分析 第五章 传统抽样设计 无法计算RR值 关联效应指标:比值比 (odds ratio, OR)
比值比:病例组与对照组暴露比值之比 暴露比值:暴露概率与不暴露概率之比 西安交大医学院 wn
50
5 病例对照研究分析 问题 第五章 病例对照研究中测量暴露-疾病间的关联大小是否可以采用与队列研究相同的效应指标——RR值?
西安交大医学院 wn
51
5 第五章 病例对照研究分析 比值比 西安交大医学院 wn
52
5 第五章 病例对照研究分析 OR与RR的关系 RR 非暴露组发病率 暴露组发病率 西安交大医学院 wn
53
5 病例对照研究分析 第五章 OR与RR的关系 如果暴露组和非暴露组的发病率(<5%)都很低,则RR值与OR值大小近似
如果RR1,OR将比RR更远离1 西安交大医学院 wn
54
资料整理与分析 ● 不匹配不分层资料 ① 暴露率差异的统计学检验 • 四格表 X2= (ad-bc) 2N m1 m2 n1 n2
西安交大医学院 wn
55
资料整理与分析 ② OR(odds ratio): 比值比,优势比 病例组的暴露比值与对照组的暴露比值之比。表示疾病与暴露之间的关联强度。
OR值=(a/c)/(b/d)= ad/bc ◆ 疾病率小于5%时,OR是RR的极好近似值 西安交大医学院 wn
56
表1 不同发病率和OR时的RR 发病率(I0) OR 0.20 0.10 0.05 0.01 2 1.7 1.8 1.9 2.0 3 2.1
2.5 2.7 2.9 4 3.1 3.5 3.0 5 2.8 3.6 4.2 4.8 6 4.0 5.7 7 3.2 4.4 5.4 6.6 8 3.3 4.7 5.9 7.5 9 5.0 6.4 8.3 10 5.3 6.9 9.2 西安交大医学院 wn
57
混杂因素(confounding factor)
定义: 当研究某因素与某疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。这种现象或影响叫混杂,该外来因素叫混杂因素。 西安交大医学院 wn
58
混杂因素 混杂因素成立的条件: ● 一定是所研究疾病的危险因素 ● 必须与暴露间存在统计学联系
● 一定不是暴露因素与疾病间因果关系链上的中间变量 西安交大医学院 wn
59
混杂因素 混杂因素的识别:专业、分层 混杂因素的控制: ① 设计阶段:限制、匹配 ② 调查阶段:分层抽样
③ 分析阶段:分层分析、标化、多因素分析 西安交大医学院 wn
60
暴露特征 i层 合计 病例 对照 有 a i b i n1i 无 c i d i n2i m1i m2i N i
● 分层资料 暴露特征 i层 合计 病例 对照 有 a i b i n1i 无 c i d i n2i m1i m2i N i 西安交大医学院 wn
61
① 计算并比较分层前(粗OR)与分层后ORi
分层后各层ORi与分层前OR比较 无明显变化 变化大 分层因素非混杂因素 且分层因素不是研究因素与疾病的中间环节,考虑混杂 齐性检验 同质 非同质 计算总卡方和OR 分析交互作用 西安交大医学院 wn
62
X2MH = [∑ai-∑E(ai)]2 ∑V(ai)
② 计算总卡方(Mantel-Haenszel卡方) X2MH = [∑ai-∑E(ai)]2 ∑V(ai) ∑E(ai)= ∑ m1i × n1i Ni ∑V(ai)= ∑ m1i ×m2i × n1i × n2i Ni 2(Ni-1) 西安交大医学院 wn
63
ORMH = ∑(ai × di /Ni) ∑(bi ×ci /Ni)
③ 计算总OR值及OR95%CI ORMH = ∑(ai × di /Ni) ∑(bi ×ci /Ni) 西安交大医学院 wn
64
表2 肺癌组与对照组的吸烟史比较 肺癌 对照 合计 吸烟 300 200 500 不吸烟 120 250 370 420 450 870
表2 肺癌组与对照组的吸烟史比较 肺癌 对照 合计 吸烟 300 200 500 不吸烟 120 250 370 420 450 870 OR=3.13 西安交大医学院 wn
65
表3 按是否饮酒分层分析肺癌与吸烟的关系 饮酒 不饮酒 吸烟 不吸烟 合计 肺癌 200 100 300 对照 80 120 40 130
表3 按是否饮酒分层分析肺癌与吸烟的关系 饮酒 不饮酒 吸烟 不吸烟 合计 肺癌 200 100 300 对照 80 120 40 130 170 280 220 500 140 230 370 OR1=3.00 OR0=3.25 西安交大医学院 wn
66
● 1:1配对资料 病例组暴露史 有 无 对照组暴露史 a b c d 西安交大医学院 wn
67
① Mcnemar 卡方 ② OR=c/b 西安交大医学院 wn
68
表4 高血压与心肌梗死的病例对照研究 心肌梗死病例 对 照 合计 SBP≥18.6 SBP<18.6 15 60 75 35 40 50
表4 高血压与心肌梗死的病例对照研究 心肌梗死病例 对 照 合计 SBP≥18.6 SBP<18.6 15 60 75 35 40 50 100 150 卡方=6.58,P<0.01; OR=1.71(1.41~2.57) 西安交大医学院 wn
69
5 第五章 病例对照研究分析 研究设计 具体实施 (资料的收集) 数据分析 结果解释 西安交大医学院 wn
70
结果解释与因果推断 暴露与疾病 提出假设 有无统计学关联? 排除偶然 有无偏倚? 排除虚假 有时间先后否? 前因后果 西安交大医学院 wn
71
关联 偶然关联 随机误差 有统计学 意义关联 因果关联 (有时间先后) 非因果关联 (偏倚) 间接因果关联 (间接病因) 直接因果关联
(直接病因) 西安交大医学院 wn
72
常见偏倚及其控制 1 选择偏倚(selection bias) 选择有代表性的人群 2 信息偏倚(information bias)
① 回忆:多次、有技巧地询问 ② 调查:统一、盲法 3 混杂偏倚(confounding bias) ① 设计阶段:限制、配比 ② 调查阶段:分层抽样 ③ 分析阶段:分层、标化、多因素 西安交大医学院 wn
73
优缺点 优点 1 特别适用于罕见病,样本需要量小 2 省时省力,易于组织实施 3 适于潜伏期长的慢性病,出结果快
4 可同时研究多个暴露和某疾病的关系,特别适合探索性病因研究 西安交大医学院 wn
74
优缺点 缺点 1 不适于暴露率低的因素 2 难以避免选择偏倚 3 难以避免回忆偏倚 4 论证因果关系的能力较弱 西安交大医学院 wn
75
回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素
小结 1.病例对照研究(case-control study, case reference study)是分析流行病学最基本、最重要的研究类型之一 回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素 2.病例对照研究的四大要素 人群、对照、病例和暴露 明确产生病例的人群,从中正确地挑选对照,并正确地收集暴露资料是病例对照研究的精髓 西安交大医学院 wn
76
3.对照不必代表所有未患研究疾病的病人,同样也不必代表所有总体人群 病例不必代表患有该种疾病的全部病人,也不可能做到这一点
4.选择病例原则 符合病例的定义,就应当收入病例组,不受其暴露状态的影响,避免产生选择偏倚 西安交大医学院 wn
77
新发病例与现患病例暴露分布没有差别,也可用现患病例 研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例
5.新发病例比现患病例好 回忆暴露及暴露与疾病的时序关系时更明确 新发病例与现患病例暴露分布没有差别,也可用现患病例 研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例 死亡病例省时省钱,很快可以提供研究线索 西安交大医学院 wn
78
7. 资料质量的可比性与病例和对照成员之间的可比性一样重要 注意两组收集资料时资料质量的可比性,以保证研究的真实性
6.正确地选择对照是病例对照研究成败的关键 病例的来源决定了对照的来源 可比性比代表性更重要 7. 资料质量的可比性与病例和对照成员之间的可比性一样重要 注意两组收集资料时资料质量的可比性,以保证研究的真实性 西安交大医学院 wn
79
8. 基本分析方法是比较两组暴露比例,计算暴露优势比,估计患病的优势比,在发病率低的情况下估计相对危险度
9. 对照所患疾病不应与研究的暴露因素有关 对照疾病的发病率在暴露的各类别或各水平上都一样 病例是新诊断的病例,对照不应是慢性病患者 西安交大医学院 wn
Similar presentations