第五章 病例对照研究 (Case-control study) 流行病学教研组 流行病与卫生统计学教研室.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
病例对照研究 case - control study 也称回顾性研究 ( retrospective study )
3.4 空间直线的方程.
龙星课程—肿瘤生物信息学上机课程 曹莎
病例对照研究 Case – control study.
第八章 临床科研中偏倚的控制 Control of Bias in Clinical Research 卫 生 系 黄民主 教授
第一篇 人群健康研究中的流行 病学原理与方法.
队列研究 放射医学与公共卫生学院 许锬.
病例对照研究 Case-control Study.
(Epidemiology in community health nursing)
第十二章 队列研究 邹焰.
流行病学研究中的偏倚及其控制.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
(cross-sectional study)
证券投资技术分析.
队 列 研 究 Cohort study wn.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
病例对照研究 case-control study
完全随机设计多样本资料秩和检验.
队列研究.
第五章 病例对照研究 (case-control study)
研究设计 入门.
非实验性研究.
糖尿病流行病学.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
流行病学研究中的偏倚 许锬.
第四节 对数留数与辐角原理 一、对数留数 二、辐角原理 三、路西定理 四、小结与思考.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三篇 组织工作.
宫颈刮片脱落细胞 检查结果分析 中国人民解放军总医院 妇产科 宋 磊.
队 列 研 究 前瞻性研究(prospective study)、 发生率研究(incidence study)、
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
如何使用CiteSpace分析Derwent专利数据
第四章 队列研究 (cohort study)
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
调查设计.
第一章 绪论 本章内容:国际商法的概念和范围 国际商法的产生与发展 国际商法的渊源 国际商法的主体.
病因探索 (Quest the cause of disease)
第十章 方差分析.
1085至1125年间的官员地域分布与社会关系 1.
新生儿与新生儿疾病 Newborn and Neonatal Disease
项目名称:XXXXXXXXXXXX 研究科室:XXX 主要研究者:XXX 日期:xxxx年XX月XX日.
模型分类问题 Presented by 刘婷婷 苏琬琳.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
第4章 护理研究设计 主讲教师:罗健.
实体描述呈现方法的研究 实验评估 2019/5/1.
试验名称: 申办方: CRO:.
Harvard ManageMentor®
iSIGHT 基本培训 使用 Excel的栅栏问题
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第4课时 绝对值.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Biases and Their Control
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第九章 偏倚及其控制 Biases and Their Control
队列研究 (cohort study).
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
本底对汞原子第一激发能测量的影响 钱振宇
第四章 UNIX文件系统.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第五章 病例对照研究 (Case-control study) 流行病学教研组 流行病与卫生统计学教研室

目 录 第一节 基本原理 第二节 研究类型 第三节 研究实例 第四节 研究设计与实施 第五节 资料的整理与分析 第六节 常见偏倚及其控制 第七节 注意的问题 第八节 与队列研究的比较

第一节 基本原理 基本原理 研究示意图 研究史

一、基本原理 以确诊患某种特定疾病的病人作为病例 以不患该病但具有可比性的个体作为对照 第一节 基 本 原 理 一、基本原理 以确诊患某种特定疾病的病人作为病例 以不患该病但具有可比性的个体作为对照 通过询问、实验室检查或复查病史,搜集既往 危险因素暴露史 测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联

病例对照研究特点 属于观察法 设立对照,属分析性研究 是回顾性的,由果及因,不能下因果结论 可以研究一种疾病与多种因素的关系 第一节 基 本 原 理 病例对照研究特点 属于观察法 设立对照,属分析性研究 是回顾性的,由果及因,不能下因果结论 可以研究一种疾病与多种因素的关系

二、研究示意图 调查方向 暴露 非暴露 第一节 基 本 原 理 时间 研究开始 对照组 第一节 基 本 原 理 二、研究示意图 时间 病例组 对照组 研究开始 暴露 非暴露 调查方向 图5-1 病例对照研究示意图(Greenberg 2002) 注:阴影区域代表暴露于所研究的危险因素的研究对象

三、研究简史 1843年Guy向统计学会报告-最早病例对照研究 分析职业暴露与肺结核发生的关系 1844年Louis的著作 第一节 基 本 原 理 三、研究简史 1843年Guy向统计学会报告-最早病例对照研究 分析职业暴露与肺结核发生的关系 1844年Louis的著作 最早出现病例对照研究的概念 1926年Lane Claypon 报告 生殖因素与乳腺癌关系的研究

1947年Schreck和Lenowitz 1947年Hartwell 包皮环切和性卫生与阴茎癌的关系 输血与肝炎关系的研究 第一节 基 本 原 理 1947年Schreck和Lenowitz 包皮环切和性卫生与阴茎癌的关系 1947年Hartwell 输血与肝炎关系的研究 1950年Doll和Hill 吸烟与肺癌的研究

20世纪60年代以来 孕妇服用反应停(thalidomide)与婴儿短肢畸形 母亲吸烟与先天性畸形 早产儿吸入高浓度氧与晶体后纤维组织增生症 第一节 基 本 原 理 20世纪60年代以来 孕妇服用反应停(thalidomide)与婴儿短肢畸形 母亲吸烟与先天性畸形 早产儿吸入高浓度氧与晶体后纤维组织增生症 经期使用月经棉与中毒性休克综合征 小剂量电离辐射与白血病 母亲早孕期服用雌激素与少女阴道腺癌等之间的关系

第二节 研究类型 病例与对照不匹配 病例与对照匹配 衍生的研究类型(最后讲)

第二节 研究类型 一、病例与对照不匹配 从设计所规定病例和对照人群中,分别抽取一定量的研究对象 对照组人数≥病例组人数 选择对照没有特殊规定

病例与对照不匹配 目标人群 患病人群 未患病人群 病例组 = < 对照组

二、病例与对照匹配 匹 配/配 比(matching) 分 类 要求 对照在某些因素或特征上与病例保持一致 第二节 研究类型 二、病例与对照匹配 匹 配/配 比(matching) 要求 对照在某些因素或特征上与病例保持一致 目的 对两组进行比较时排除匹配因素的干扰 分 类 频数匹配 个体匹配

频数匹配 (frequency matching) 病例与对照匹配 频数匹配 (frequency matching) 5/10 2/10 3/10 目标人群 患病人群 未患病人群 某些特征

1:1个体匹配 (individual matching) 病例与对照匹配 1:1个体匹配 (individual matching) 目标人群 患病人群 未患病人群 某些特征 配对 (pair matching)

1:R个体匹配 (individual matching) 病例与对照匹配 1:R个体匹配 (individual matching) 目标人群 患病人群 未患病人群 某些特征 1:2, 1:3 …1:R

匹配法注意事项 慎重选择匹配因素 可疑病因不作为匹配因素 比例一般为1:1,最多不超过1:4 第二节 研究类型 匹配法注意事项 慎重选择匹配因素 可疑病因不作为匹配因素 比例一般为1:1,最多不超过1:4 避免 “匹配过度(over-matching)” 匹配的目的 提高研究效率 控制混杂因素的作用 把不必要的项目列入匹配,企图使病例与对尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率.

第三节 研究实例 研究背景 研究方法 研究结果

研究背景 美国波士顿Vincent纪念医院妇产科医生Herbst发现 1966~1969年收治7例阴道腺癌患者 年龄15~22岁 第三节 研究实例 研究背景 美国波士顿Vincent纪念医院妇产科医生Herbst发现 1966~1969年收治7例阴道腺癌患者 年龄15~22岁 过去年龄均大于25岁 7例在15~22岁之间 7例全是腺癌 阴道癌占女性生殖系统癌的2% 阴道腺癌仅占阴道癌的5%~10%,非常罕见

研究方法 Herbst对阴道腺癌危险因素进行探索 7例患者加上另一个医院1例患者作为病例组 每个病人配4个对照,共32个对照 第三节 研究实例 研究方法 Herbst对阴道腺癌危险因素进行探索 7例患者加上另一个医院1例患者作为病例组 每个病人配4个对照,共32个对照 调查员用调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见表5-2

第三节 研究实例 研究结果

第四节 研究设计与实施 研究步骤 病例与对照的选择 样本含量的估计 资料的来源与收集方法

根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设 第四节 研究设计与实施 一、研究步骤 提出假设 根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设

制定研究计划 选择病例与对照比较的方法:用匹配或成组比较法,或两者同时使用 如用匹配法,需确定病例与对照的比例及匹配条件 第四节 研究设计与实施 制定研究计划 选择病例与对照比较的方法:用匹配或成组比较法,或两者同时使用 如用匹配法,需确定病例与对照的比例及匹配条件 病例与对照的来源和选择方法,病例的诊断方法 样本大小的估计 根据病因假设与研究所具备的条件,确定调查因素的种类,数量及其检测方法,并考虑调查因素中的混杂因素

调查表的设计 偏倚及质量控制措施 调查的实施与期中分析 资料整理与分析的方法 所需费用的概算 人员分工与需要的协作单位 第四节 研究设计与实施 调查表的设计 偏倚及质量控制措施 调查的实施与期中分析 资料整理与分析的方法 所需费用的概算 人员分工与需要的协作单位

第四节 研究设计与实施 培训调查员与预调查 实施调查 资料的整理与分析 提出研究报告

研究得出的结论是否可靠,首先要看对照的选择是否合理。 第四节 研究设计与实施 二、病例与对照的选择 对照的选择是整个研究的关键之一 研究得出的结论是否可靠,首先要看对照的选择是否合理。 病例与对照选择的基本原则: 代表性 选择方法 可以是感兴趣的任何类型的病例 对照应当代表病例的源人群,而不是整个非病人群 错误的观点 病例代表所有该病病人 对照代表全部无该病的人群 可比性 抽样 匹配

第四节 研究设计与实施

(一)病例的选择 选择病例的要求 诊断可靠 使用金标准 选择确诊的新病例 回忆偏倚小 代表性好 容易合作 被调查因素改变少 第四节 研究设计与实施 (一)病例的选择 选择病例的要求 诊断可靠 使用金标准 选择确诊的新病例 回忆偏倚小 代表性好 容易合作 被调查因素改变少

来 源 总体人群中全部病例或总体随机样本人群中全部 病例 医院住院或门诊的病例 比较合作 资料易得到且比较可靠 与对照的可比性好 代表性差 代表性好 工作开展比较困难 耗费人力物力 病例 比较合作 资料易得到且比较可靠 与对照的可比性好 代表性差

(二)对照的选择 原 则 候选对象必须来自产生病例的总体 不患有所要研究疾病甚至是同一系统疾病 第四节 研究设计与实施 (二)对照的选择 原 则 候选对象必须来自产生病例的总体 不患有所要研究疾病甚至是同一系统疾病 对照一旦发生所研究的疾病便成为病例组的研究对象

第四节 研究设计与实施 对照与病例比较的方法 成组比较法(group comparison) 匹配法(matching) 频数匹配 个体匹配

来源 同一或多个医疗机构中诊断的其他病例 病例的邻居或所在同一居委会、住宅区内的健康人或非该病病人 社会团体人群中的非该病病例或健康人 第四节 研究设计与实施 来源 同一或多个医疗机构中诊断的其他病例 病例的邻居或所在同一居委会、住宅区内的健康人或非该病病人 社会团体人群中的非该病病例或健康人 社区人口中的非病例或健康人群 病例的配偶、同胞、亲戚、同学或同事等 没有哪一种对照就一定优于另一种对照,各有优势、各有局限性,不同来源的对照解决不同的问题。

三、样本含量的估计 有关参数 人群中被研究因素的暴露率(exposure rate) RR的近似值 OR值(查阅文献或预调查获得) α值 第四节 研究设计与实施 三、样本含量的估计 有关参数 人群中被研究因素的暴露率(exposure rate) RR的近似值 OR值(查阅文献或预调查获得) α值 把握度

第四节 研究设计与实施 方 法 查表法 公式法:求病例对照研究样本含量的公式 或近似公式 对照组患病率 暴露组患病率

例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。 第四节 研究设计与实施 例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。 某市普通人群中吸烟率 P0=30% OR=5.0 α=0.05 把握度=0.90 问需要多少病例与对照?

如代入近似公式计算,所得结果与原公式很接近(n=29.5) 第四节 研究设计与实施 α、β值查表,Zα为1.64, Zβ为1.28 代入公式得: 病例组与对照组,各需28人。 如代入近似公式计算,所得结果与原公式很接近(n=29.5)

第四节 研究设计与实施 病例组与对照组例数不等时的公式: 病例数:对照数=1:c 对照组例数为c*n

第四节 研究设计与实施 1:1匹配设计 总对子数

四、资料来源与收集方法 资料来源 方式方法不恰当,收集的资料就不可靠 统计处理无法纠正的系统误差 资料的收集在病例对照研究中十分重要 第四节 研究设计与实施 四、资料来源与收集方法 资料的收集在病例对照研究中十分重要 方式方法不恰当,收集的资料就不可靠 统计处理无法纠正的系统误差 资料来源 医院病案记录 疾病登记报告等摘录 致病因素数据需检测病人的标本或环境获得 询问调查获得

调查含义及遵循原则 询问调查是个十分复杂而又细致的工作 第四节 研究设计与实施 调查含义及遵循原则 询问调查是个十分复杂而又细致的工作 调查是信息传达、接受和反映的过程,是属于行为科学的范畴。被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 从拟订调查表开始到调查完成,不论哪一步不恰当,都会产生偏倚

调查表的设计需要多学科专家的参与(流行病学、临床医学、统计学、心理学、社会学) 第四节 研究设计与实施 调查表的设计需要多学科专家的参与(流行病学、临床医学、统计学、心理学、社会学) 调查实施前 对调查员进行细致而严格的培训 编写调查员手册 监督与审查 总之,调查员的素质、调查的好坏是取得研究所需要的可靠资料的关键所在,应十分重视。

第五节 资料的整理与分析 均衡性检验 成组比较法资料的分析 混杂因素作用的估计与分层分析 暴露分级资料的分析 1:1配对资料的分析

注意  对所收集的资料进行核查,验错,纠正错误,保证资料的完整性,对于缺项、漏项的尽量补充,对于出现严重出入的资料要弃除。

一、均衡性检验 检验两组在研究因素以外其它主要特征有否可比性 两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关 第五节 资料的整理与分析 一、均衡性检验 检验两组在研究因素以外其它主要特征有否可比性 两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关 均衡性检验,应把两组的这些特征逐一加以比较,必要时作显著性检验

第五节 资料的整理与分析 二、成组比较法资料的分析

第五节 资料的整理与分析 二、成组比较法资料的分析

  联系的显著性检验 当χ2 >3.84 P<0.05时,疾病与因素之间有联系,但不能确定为因果联系。χ2≠相关系数,χ2的大小与联系强弱无关。 当χ2 <3.84 P>0.05时,疾病与因素之间无联系

联系强度 比值比 OR(odds ratio)   联系强度 比值比 OR(odds ratio) OR又叫优势比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值、反映暴露者患某种疾病的危险性较无暴露者高的程度。 描述:暴露组患病的危险性是非暴露组的多少倍

OR>1,暴露因素与疾病存在正相关,是疾病的危险因素。 OR<1,暴露因素与疾病存在负相关,是疾病的保护因素。 计算比值比OR(odds ratio) 比值是指某事物发生的概率与不发生的概率之比 病例组的比值= = 对照组的比值= = OR的数值表示的意义: OR=1,暴露因素与疾病无联系 OR>1,暴露因素与疾病存在正相关,是疾病的危险因素。 OR<1,暴露因素与疾病存在负相关,是疾病的保护因素。

OR的95%可信区间 Miettinen氏法 先求出χ2 、OR 意义:用样本的OR值推算总体OR所在的区间,并作显著性检验。如可信区间不包括1在内,则:OR在与可信区间相同的概率水平有显著意义。如可信区间包括1在内,则暴露与疾病无联系。

两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR 第五节 资料的整理与分析 四格表法 两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR

结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.18~3.78之间 第五节 资料的整理与分析 结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.18~3.78之间

结论:χ2=55. 5> 3. 84,且OR值的95%可信区间为(2. 18,3. 78)不包括1,说明食管癌与吸烟有关联; OR=2

EpiCalc 2000

EpiCalc 2000 资料分析步骤 整理四格表 2检验 计算OR及其可信区间

二、不匹配分层资料的分析 OR=2.20 (1.25~3.86) 考虑年龄可能是混杂因素

提示: 年龄越大,发生心肌梗死的危险性越大 二、不匹配分层资料的分析 为什么考虑年龄是混杂因素? 2=7.27, OR=2.10 (1.22~3.62) 提示: 年龄越大,发生心肌梗死的危险性越大

二、不匹配分层资料的分析 为什么考虑年龄是混杂因素? 表. 在对照组年龄与服用OC的关联 对照组 2=8.98, OR=3.91 (1.53~9.99) 提示: 年龄越小,服用OC的可能性越大    年龄越大,服用OC的可能性越小

为什么考虑年龄是混杂因素? 年龄与疾病 (心肌梗死) 有关联 年龄与暴露 (是否服OC) 有关联 年龄不是OC与心肌梗死作用通路上的中间环节 年纪大的人多 服OC比例低 暴露比例 年轻的人多 服OC比例高 暴露比例 比较病例组与对照组的暴露比例 OR 

二、不匹配分层资料的分析

第五节 资料的整理与分析 表5-7

进行齐性检验 齐性检验 合并χ2与OR值 OR值无明显差别,则年龄是混杂因素 合并OR值 OR值有显著差异,则年龄是明显混杂? 合并OR值 第五节 资料的整理与分析 进行齐性检验 齐性检验 合并χ2与OR值 OR值无明显差别,则年龄是混杂因素 合并OR值 OR值有显著差异,则年龄是明显混杂? 合并OR值 本例齐性检验无显著差异,计算合并OR与χ2

第五节 资料的整理与分析 计算合并OR与χ2值 公式(M-H法): 合并

不匹配分层资料的分析 SPSS

SPSS

(1) (1) (3) (2)

OR<40=2.80, OR40=2.78, 经检验,同质,可以计算总OR (1) OR<40=2.80, OR40=2.78, 经检验,同质,可以计算总OR (2)

分层分析后,OR从2.20增加到2.79,提示因年龄的混杂作用,低估了暴露因素OC与心肌梗死间的关联,使之趋向于1 (3) 分层分析后,OR从2.20增加到2.79,提示因年龄的混杂作用,低估了暴露因素OC与心肌梗死间的关联,使之趋向于1 (4)

三、分级暴露资料 参照组

EpiCalc 2000

EpiCalc 2000   提示随着每日吸烟量的增加,发生肺癌的危险性递增,呈现有统计学显著性的剂量反应关系。

四、1:1配对病例对照研究资料的分析

四、1:1配对病例对照研究资料的分析   联系的显著性检验   联系强度   OR的95%可信区间

χ2=11.28, OR=4.33 OR95%可信限 食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-6 第五节 资料的整理与分析 食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-6 χ2=11.28, OR=4.33 表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍 OR95%可信限

结论:χ2=11. 28> 3. 84,且OR值的95%可信区间为(1. 84,10 结论:χ2=11.28> 3.84,且OR值的95%可信区间为(1.84,10.18)不包括1,说明男性食管癌与吸烟有关联; OR=4.3,说明男性吸烟者患食管癌的危险性是不吸烟男性的4.3倍,吸烟可能是男性食管癌的危险因素。

四、1:1配对病例对照研究资料的分析 例 :妊娠头三个月内孕妇风疹与新生儿发生畸形的关系研究

四、1:1配对病例对照研究资料的分析 结论:χ2=9.63> 6.63,且OR值的95%可信区间为(1.66,9.60)不包括1,说明新生儿畸形与妊娠头三个月内孕妇风疹有关联;OR=4.00,说明妊娠头三个月内孕妇风疹的新生儿发生畸形的危险性是无风疹史的4倍,说明妊娠头三个月内孕妇风疹可能是新生儿发生畸形的危险因素。

四、1:1配对病例对照研究资料的分析

EpiCalc 2000

EpiCalc 2000

其他效应指标 队列研究 病例对照研究 传统病例对照研究中不能获得发病率

第六节 常见偏倚及其控制 病例对照研究中偏倚的种类 对照选择中的偏倚 匹配研究方法的偏倚 收集资料过程中的偏倚

偏倚(bias): 是指在研究设计、实施、分析和解释阶段所出现的系统误差。 一旦产生很难弥补,重在预防

Priene的Bias (600-540BC) Bias是古典文化中七贤人之一 Lydia的国王克利萨斯向Bias咨询建造、部署战舰防御爱奥尼亚人的最好方法 Bias为了避免战争、流血,骗克利萨斯国王说,爱奥尼亚人正在买马准备陆地战 后来,Bias向克利萨斯国王承认,他说了谎,爱奥尼亚人实际上也在建造战舰 克利萨斯国王对Bias的本意表示赞许,与爱奥尼亚人讲和 后人将“背离事实”称为bias (Hunter D. Father of all bias? BMJ 2002;324:1071)

病例对照研究中常见的偏倚 主要类型 1.选择偏倚 2.信息偏倚 3.混杂偏倚

选择偏倚 (Selection Bias) 不同类型 (就研究的暴露、结局特征而言) 的个体入选研究的概率不同。 排除或过分代表某一类型个体。

无偏抽样

选择偏倚

选择偏倚 入院率偏倚 (admission rate) / Berkson偏倚 现患病例-新发病例偏倚 (prevalence-incidence bias) / Neyman偏倚 检出征候偏倚 (detection signal bias) / 暴露偏倚 (unmasking bias) 时间效应偏倚 (time effect bias)

入院率偏倚 (admission rate) / Berkson偏倚 病例组与对照组(其他疾病的患者)入院率不同 入选的与不入选的暴露率不同   疾病严重程度、患者经济状况、就诊方便与否都会影响入院率   解决办法:不同类型的多家医院 入院病人

现患-新发病例偏倚 (prevalence-incidence bias) / Neyman偏倚 入选的为现患或存活病例 不包括死亡病例、病程短的病例  解决办法:新发病例

检出征候偏倚 (detection signal bias) / 暴露偏倚 (unmasking bias) 暴露者较不暴露者更易因某些症状较早较频就医检查,提高了早期病例检出率 如果入选者中早期病例较多的话,则暴露比例必然被虚假的  解决办法:早、中、晚期病例

时间效应偏倚 (time effect bias) 某些个体尚处于早期病变阶段、缺乏适当的检测手段,因此易被视为无病个体 入选病例组的个体中较多的为已进入临床疾病阶段、能够被检测出来的个体  解决办法:提高检测早期病例的灵敏度

信息偏倚 (Information Bias) 又称测量偏倚、观察偏倚。是在收集信息过程中由于测量暴露与结局的方法(工具)有缺陷,使采集到的信息不准确(即不完全真实),从而引起偏倚。错分是测量不准确导致的最直接的结果。 回忆偏倚 (recall bias) 调查偏倚 (investigation bias)

问题环节 问卷的问题 数据管理的问题 设计或分析的问题 生物标本的问题 不准确的回忆 编码 不明确的问题 过分热情或冷淡的调查员 标本采集、处理或保存过程中的问题 检测方法固有的限制 仪器故障 数据管理的问题 编码 设计或分析的问题 测量时间不合适 不适当的汇总变量

暴露的非差异性错分 暴露:酗酒 调查方式:询问 解决办法:客观的指征、明确的定义

暴露的非差异性错分 暴露:被动吸烟 调查方式:询问 解决办法:客观的指征、明确的定义

暴露的非差异性错分 解决办法:客观的指征、明确的定义

暴露的差异性错分 暴露:皮肤晒黑能力 疾病:黑素瘤 调查方式:询问

暴露的差异性错分 暴露:母亲孕期暴露 疾病:新生儿先天畸形 调查方式:询问 病例比对照会报告更多的不实的暴露 对照较病例会漏掉更多的暴露

混杂偏倚 (confounding bias)   由于混杂因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,这个现象叫混杂偏倚

夜灯 我女儿Sonia,旁边是盏夜灯。夜里开着这盏夜灯很方便,我们可以随时从门口查看屋里的情况。 Let’s look at another example. Here is a picture of my daughter, Sonia, with her Winnie the Pooh nightlight. We found having this nightlight was very helpful to us when it came to navigating around her room at night. 我女儿Sonia,旁边是盏夜灯。夜里开着这盏夜灯很方便,我们可以随时从门口查看屋里的情况。

夜灯与近视 2岁以前周围环境的夜灯-儿童近视的发生 现患比 = (Quinn et al. Nature 1999) We kept the nightlight on until we read the now famous study in Nature from my Alma Mater, the University of Pennsylvania, which strongly suggested that ambient nighttime lighting before age 2 was associated with the occurrence of nearsightedness in children. Here kids who used nightlights were over 3 times more likely to have myopia. 现患比 =

于是,我们关掉了Sonia房中的夜灯,开始每天在屋子里抹黑蹒跚 So, off went the nightlight and we began to stumble around her room. 于是,我们关掉了Sonia房中的夜灯,开始每天在屋子里抹黑蹒跚

夜灯与近视 后来,还是在Nature上,又发表了2篇文章,说夜灯与近视的发生没有关联 (Zadnik et al. and Gwiazda et al. Nature, 2000) Until two subsequent studies came out, again in Nature, showing no association.

These authors believed that the apparent association use of a night light and child’s myopia was likely because of confounding by parent’s myopia. These authors provided direct data that nearsightedness in parents is associated with the use of night light, probably to help the parents see better. And, there is data to suggest that myopia is inherited; ie if parents have it, their kids are more likely to have it. So, this is an example, where parenteral myopia confounds the relationship between night lights and child’s myopia and there is no real direct, or what we call independent, association between use of night lights and child’s myopia.

我们的担心没有了,于是又把夜灯打开了,皆大欢喜 So, our fears relieved about night lights. . .. on comes the night light again and everyone is happy. 我们的担心没有了,于是又把夜灯打开了,皆大欢喜

什么样的因素是/不是混杂因素? 与暴露相关 与疾病相关 研究的暴露因素与疾病因果链上的中间变量不是混杂因素 混杂因素要么是所研究的暴露因素的“因”,要么是“果”,要么为简单“相关”,而非因果关系 混杂因素与所研究的暴露因素间的关联必须独立于其与所研究的疾病间的关联,即,混杂因素与研究的暴露因素间的关联必须可见于无病个体中 与疾病相关 不一定是疾病的“病因”,可以只是真正病因的一个标志指标 混杂因素与所研究的疾病间的关联必须独立于其与所研究的暴露因素间的关联,即,混杂因素与所研究的疾病间的关联必须可见于无暴露个体中 如果为所研究疾病的结果,不管其与所研究暴露因素的关系,该变量都不是混杂因素 研究的暴露因素与疾病因果链上的中间变量不是混杂因素

控制混杂的方法 研究设计阶段 资料分析阶段 随机化 限制 匹配 分层分析 多变量分析 匹配后还得再分层,否则会引入混杂 或者不匹配,只分层,可以控制混杂

二、对照选择中的偏倚 选择的对照缺乏代表性 与所研究的可疑病因有关的其它疾病病人作为对照 有意不暴露于可疑病因的疾病病人作为对照 第六节 常见偏倚及其控制 二、对照选择中的偏倚 选择的对照缺乏代表性 与所研究的可疑病因有关的其它疾病病人作为对照 有意不暴露于可疑病因的疾病病人作为对照

三、匹配研究方法的偏倚 匹配过度 匹配过度的影响 可使研究得不出结果 匹配因素 用明确的混杂因素 第六节 常见偏倚及其控制 三、匹配研究方法的偏倚 匹配过度 将一些被研究因素或因果链的中间变量,或将一些不必匹配的因素作为匹配因素而造成 匹配过度的影响 可使研究得不出结果 真实的结果被歪曲了 浪费不少工作量 匹配因素 用明确的混杂因素 匹配因素不要过多 如性别、年龄、种族、社会经济水平等

四、收集资料过程中的偏倚 资料收集过程容易产生的信息偏倚 回忆偏倚 病例对照研究是回顾性调查,难避免回忆偏倚 倾向性 第六节 常见偏倚及其控制 四、收集资料过程中的偏倚 资料收集过程容易产生的信息偏倚 回忆偏倚 病例对照研究是回顾性调查,难避免回忆偏倚 倾向性 被调查者与调查员均可能有倾向性,盲法可以克服

第二节 研究类型 三、衍生的研究类型 病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短。 巢式病例对照研究 单纯病例研究 病例时间对照设计 病例-队列研究 病例交叉研究

巢式病例对照研究(nested case control study) 基本原理 第二节 研究类型 巢式病例对照研究(nested case control study) 基本原理 按队列研究方式进行 选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用 随 访 随访到出现能满足病例对照研究样本量的病例数为止

匹配 按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本 资料处理 按匹配病例对照研究方法处理资料

发病密度抽样设计 (巢式病例对照研究) (固定队列) 某时点上被选为对照,之后该对照也可以成为病例 某时点上被选为对照,之后该对照还可以再次被选为对照

发病密度抽样设计 (开放队列)

①上海地区肝癌与尿中黄曲霉素生物学标志关系 ②18244名中年男性队列中发现22例肝癌 ③每例配5或10个对照 检测研究开始时的尿样: 第二节 研究类型 1992年Ross用巢式病例对照研究: ①上海地区肝癌与尿中黄曲霉素生物学标志关系 ②18244名中年男性队列中发现22例肝癌 ③每例配5或10个对照 检测研究开始时的尿样: 发现黄曲霉素B1及其代谢产物和DNA加成物的OR值经 调整混杂因素后,为3.8(1.2~12.2)。 黄曲霉素作为肝癌致病因素最直接的证据

病例-队列研究(case-cohort study) 第二节 研究类型 病例-队列研究(case-cohort study) 基本原理 研究开始时,在队列中随机选取一组样本作为对照组 观察结束时,队列中出现被研究疾病所有病例作病例组 与随机对照组进行比较 这种研究模式,可同时研究几种疾病,不同疾病有不同 病例组,但对照组都是同一组随机样本

病例--队列与巢式病例对照研究的区别 对照是随机选取,不与病例进行匹配 随机对照组中成员如发生被研究疾病,既为对照,又同时为病例 第二节 研究类型 病例--队列与巢式病例对照研究的区别 对照是随机选取,不与病例进行匹配 随机对照组中成员如发生被研究疾病,既为对照,又同时为病例 1个随机对照组可以同时和几个病例组比较分析

第二节 研究类型 病例--队列与巢式病例对照研究的优点 因果关系清楚 资料可靠 论证强度高 省时省力省钱 适合于分子流行病学研究

病例病例研究(case case study) 第二节 研究类型 病例病例研究(case case study) 背 景 1994年Piegorseh、Begs等提出 遗传与环境的关系 交互作用 病例对照研究和队列研究的效率费用 应用前提条件 在正常人群中基因型与环境暴露各自独立发生 所研究疾病为罕见病(此时可用OR来估计RR值)

第二节 研究类型 基本原理

第二节 研究类型 研究示意图 环境暴露 基因型 + + 病人 - + - - 单纯病例研究

当ORge>1时, 有正相乘模型交互作用 当ORge=1时, 无相乘模型交互作用 当ORge<1时, 有负相乘模型交互作用 第二节 研究类型 表5-1 环境暴露与基因型 G+ G- E+ a b E- c d OR=ad/bc 当ORge>1时, 有正相乘模型交互作用 当ORge=1时, 无相乘模型交互作用 当ORge<1时, 有负相乘模型交互作用

病例交叉研究(case-crossover design) 第二节 研究类型 病例交叉研究(case-crossover design) 解决问题 1991年美国Maclure提出病例交叉设计 日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致?

基本原理 如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。 暴露与某急性事件有关 第二节 研究类型 基本原理 暴露与某急性事件有关 比较相同研究对象暴露情况 在急性事件发生前一段时间与未发生事件的某段时间 如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。

研究对象 病例和对照,两部分的信息均来自于同一个体 "病例部分“ 危险期,疾病或事件发生前的一段时间 第二节 研究类型 研究对象 病例和对照,两部分的信息均来自于同一个体 "病例部分“ 危险期,疾病或事件发生前的一段时间 “对照部分” 对照期,危险期外特定的一段时间 研究是对个体危险期和对照期内的暴露信息进行比较

例如 据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。

第七节 实施病例对照研究应注意的问题 假设目的是否清楚? 疾病与暴露变量的定义明确? 病例与对照的来源,诊断方法? 新发病例还是现患病例? 排除标准是否明确?

抽样的方法与样本大小的估计是否明确? 病例与对照是否匹配及匹配变量是哪些? 调查表是否完全?是否详尽? 调查表是否能够收集到需要的数据? 第七节 实施病例对照研究应注意的问题 抽样的方法与样本大小的估计是否明确? 病例与对照是否匹配及匹配变量是哪些? 调查表是否完全?是否详尽? 调查表是否能够收集到需要的数据? 调查表是否经过试用? 调查表的真实性与可靠性是否经过评估?

调查员、质控员、编码员等工作手册是否编好? 第七节 实施病例对照研究应注意的问题 调查员、质控员、编码员等工作手册是否编好? 调查员是否做了专门培训? 组织机构、人员、设备、经费是否已落实? 方法试剂是否符合标准? 结果的真实性与可靠性是否经过考核? 资料整理、统计处理方法及分析内容是否明确? 如何控制或调整混杂及其他偏倚? 结论的真实性如何?

第八节 病例对照研究与队列研究优点与局限性的比较 病例对照研究的优点 队列研究的优点 病例对照研究的局限性 队列研究的局限性

病例对照研究的优点 特别适用于少见病、罕见病的研究 省力、省钱、省时间,并易于组织实施 还可用于疫苗免疫学效果考核及暴发调查等 第八节 病例对照研究与队列研究优点与局限性的比较 病例对照研究的优点 特别适用于少见病、罕见病的研究 省力、省钱、省时间,并易于组织实施 还可用于疫苗免疫学效果考核及暴发调查等 可同时研究多个因素与某种疾病的联系 对研究对象多无损害

队列研究的优点 研究者亲自观察资料,信息可靠,回忆偏倚小 直接计算RR和AR等,反映疾病危险关联的指标 可证实病因联系 第八节 病例对照研究与队列研究优点与局限性的比较 队列研究的优点 研究者亲自观察资料,信息可靠,回忆偏倚小 直接计算RR和AR等,反映疾病危险关联的指标 可证实病因联系 有助于了解人群疾病的自然史 分析一因与多种疾病的关系 样本量大,结果比较稳定

病例对照研究的局限性 不适于研究暴露比例很低的因素 选择偏倚难以避免 暴露与疾病时间先后难以判断,信息真实性差 存在回忆偏倚 第八节 病例对照研究与队列研究优点与局限性的比较 病例对照研究的局限性 不适于研究暴露比例很低的因素 选择偏倚难以避免 暴露与疾病时间先后难以判断,信息真实性差 存在回忆偏倚 不能测定暴露和非暴露组疾病的率

队列研究的局限性 不适于发病率很低的疾病病因研究 依从性差,易出现失访偏倚 耗费人力、物力、财力和时间,组织与后 勤工作亦相当艰巨 第八节 病例对照研究与队列研究优点与局限性的比较 队列研究的局限性 不适于发病率很低的疾病病因研究 依从性差,易出现失访偏倚 耗费人力、物力、财力和时间,组织与后 勤工作亦相当艰巨 研究设计要求更严密

思考题 病例对照研究的原理与特点? 对照的选择原则(要求)? 匹配的目的?匹配过头? 病例对照研究与队列研究的优缺点比较? 成组资料、配对资料的分析? 何谓偏倚?常见偏倚的类型有哪些?