第七章 筛检 Screening
如果疾病在临床前期出现一些可以识别的异常特征,如肿瘤的早期标识物(biomarkers)、血压升高、血脂升高等,则可使用一种或多种方法将其查出,并对其做进一步的诊断和治疗,则可延缓疾病的发展,改善其预后。 筛检
目录 第一节 概述 第二节 筛检试验的评价 第三节 筛检效果的评价
第一节 概 述 筛检的概念 筛检的目的与应用 筛检的类型 实施原则 伦理学问题 筛检实例
筛检的概念 筛检(screening)是运用快速、简便的试验、检查或其他方法,将健康人群中那些可能有病或缺陷、但表面健康的个体,同那些可能无病者鉴别开来。 它是从健康人群中早期发现可疑病人的一种措施,不是对疾病做出诊断。
筛检的目的与应用 它是早期发现可疑病人的一种措施。筛检出的可疑病人到医疗部门作进一步的诊断和治疗,以达到早期发现、早期诊断、早期治疗的目的(即二级预防)。 它可用于发现某些疾病的高危个体,以减缓发病,达到疾病的一级预防的目的。 它也可用于识别疾病的早期阶段,帮助了解疾病的自然史,揭示疾病的“冰山现象”。
筛检的类型 按筛检对象的范围 按筛检项目的多少 整群筛检 (mass screening) 选择性筛检 (selective screening) 单项筛检(single screening) 多项筛检(multiple screening)
筛检的类型 按筛检的目的 按筛检组织的方式 治疗性筛检 (therapeutic screening) 预防性筛检 (preventive screening) 主动性筛检(active screening) 机会性筛检(opportunistic screening)
实施原则 筛检的疾病 疾病的筛检试验 疾病的治疗 整个筛检项目
筛检的疾病 所筛检疾病或状态应是该地区现阶段的重大公共卫生问题,它指的是疾病的患病率水平高,且能对人群健康和生命造成严重危害。 对所筛检疾病或状态的自然史有比较清楚的了解,有足够长的可识别临床前期(detectable preclinical phase,DPCP)和可识别的临床前期标志(detectable preclinical marker)以满足实施筛检,且这种标识有比较高的流行率。 对所筛检疾病或状态的预防效果及其副作用有清楚的认识。
最基本的条件:适当的筛检方法、确诊方法和有效的治疗手段,三者缺一不可,否则将导致卫生资源浪费,给筛检试验阳性者带来生理和心理上的伤害等不良后果。
伦理学问题 个人意愿 有益无害 公正平等
筛检实例 2005年,中国癌症基金会在全国8个城市12家医院组织了宫颈癌机会性筛检,探索适合不同层次医院的宫颈癌筛检方案。 筛检对象 筛检程序与方法 确诊方法 筛检结果
第二节 筛检试验的评价 筛检试验的定义 筛检试验的评价方法 评价指标 筛检试验阳性结果截断值的确定
筛检试验的定义 筛检试验(screening test)是用于识别外表健康的人群中可能患有某疾病的个体或未来发病危险性高的个体的方法。 方法:问卷询问、体格检查、内镜检查、X线检查、血清学检查、生物化学、基因检查
筛检试验应具备以下五个特征: 简单性 廉价性 快速性 安全性 可接受性
筛检试验与诊断试验的分别 筛检试验 诊断试验 对象 健康人或无症状的病人 病人或筛检阳性者 目的 把可能患有某病的个体与可能无病者区分开来 把病人与可疑有病但实际无病的人区分开来 要求 快速、简便、安全,有高灵敏度 复杂、准确性和特异度高 费用 经济、简单、廉价 一般花费较高 处理 阳性者须进一步作诊断试验以确诊 阳性者要随之以严密观察和及时治疗
筛检试验的评价方法 筛检试验的评价就是将待评价的筛检试验与 诊断目标疾病的标准方法——即“金标 准”(gold standard)——进行同步盲法比较, 判定该方法对疾病“诊断”的真实性和价值。
确定“金标准” “金标准”:是指当前临床医学界公认的诊断疾病的最可靠的方法。也称为标准诊断。 通常包括:活检、手术发现、微生物培养、尸检、特殊检查和影像诊断,以及长期随访的结果。
选择受试对象 原则:受试对象应能代表筛检试验可能应用的目标人群 病例组:应包括患有目标疾病的各种临床类型的病例 。 对照组:是指用金标准证实未患有目标疾病者,包括非患者或与目标疾病易产生混淆的疾病。正常人一般不宜纳入对照组。
确定样本量 待评价筛检试验的灵敏度 待评价筛检试验的特异度 显著性检验水平(值),一般为0.05 容许误差δ,一般为0.05~0.10 当灵敏度和特异度均接近50%时,可用近似公式。 p为待评价的筛检方法的灵敏度或特异度
确定样本量 待评价的筛检试验的估计灵敏度为75%,估计特异度55%,试计算病例组和对照组所需要样本量。 设 = 0.05, = 0.08,则: 所以,评价该筛检试验,病例组样本量为113例,对照组样本量为149例。
整理评价结果 筛检试验 金标准 合计 患者 非患者 阳性 真阳性 A 假阳性 B R1 阴性 假阴性 C 真阴性 D R2 C1 C2 N
评价指标 真实性 可靠性 预测值
真实性 灵敏度与假阴性率 特异度与假阳性率 正确指数 似然比 真实性(validity),亦称效度,指测量值与实际值相符合的程度,故又称准确性(accuracy)。 用于评价真实性的指标有 : 灵敏度与假阴性率 特异度与假阳性率 正确指数 似然比
灵敏度与假阴性率 灵敏度(sensitivity),又称真阳性率(true positive rate),即实际有病而按该筛检试验的标准被正确地判为有病的百分比。 它反映了筛检试验发现病人的能力。 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
假阴性率(false negative rate),又称漏诊率,指实际有病,根据筛检试验被确定为无病的百分比。 它反映的是筛检试验漏诊病人的情况。 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
特异度与假阳性率 特异度(specificity),又称真阴性率(true negative rate),即实际无病按筛检标准被正确地判为无病的百分比。 它反映了筛检试验确定非病人的能力。 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
假阳性率(false positive rate),又称误诊率,即实际无病,但根据筛检被判为有病的百分比。 它反映的是筛检试验误诊病人的情况。 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
正确指数 也称约登指数(Youden’s index),是灵敏度与特异度之和减去1,表示筛检方法发现真正病人与非病人的总能力。 正确指数的范围在0~1之间。指数越大,其真实性越高。 正确指数 = (灵敏度 + 特异度) – 1 =1 – (假阴性率 + 假阳性率)
似然比 似然比(likelihood ratio, LR)属于同时反映灵敏度和特异度的复合指标,即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。 该指标全面反映了筛检试验的诊断价值,非常稳定。 它的计算只涉及灵敏度与特异度,不受患病率的影响。
阳性似然比(positive likelihood ratio,+LR) 是筛检结果的真阳性率与假阳性率之比。 该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。 比值越大,试验结果阳性时为真阳性的概率越大。
阴性似然比(negative likelihood ratio, -LR) 阴性似然比是筛检结果的假阴性率与真阴性率之比。 该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。 比值越小,试验结果阴性时为真阴性的可能性越大。
例1. 人群某病患病状况与筛检结果的关系 筛检试验 金标准 合计 患者 非患者 阳性 165 80 245 阴性 45 730 775 210 810 1020
各项筛检试验评价指标的计算
可靠性 可靠性(reliability),也称信度、精确度(精确性,precision)或可重复性(repeatability),是指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时获得相同结果的稳定程度。
标准差和变异系数 标准差和变异系数的值越小,表示可重复性越好,精密度越高。反之,可重复性就越差,精密度越低。 变异系数为标准差与算术均数之比。 变异系数(CV) =(标准差/算术均数)×100%
符合率 符合率(agreement/consistency rate),又称一致率,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
Kappa值 R1 R2 C1 C2 Kappa值=实际一致性/非机遇一致性 筛检 试验 金标准 合 计 患者 非患者 阳性 A B 阴性 D R2 合计 C1 C2 N Kappa值=实际一致性/非机遇一致性
以例1的资料计算一致率和Kappa值
影响筛检试验可靠性的因素 受试对象生物学变异 观察者 实验室条件
预测值 预测值(predictive value)是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。
阳性预测值 阳性预测值(positive predictive value, PPV): 是指试验阳性结果中真正患病(真阳性)的比例。 R1 筛检 试验 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
阴性预测值 阴性预测值(negative predictive value, NPV)是指筛检试验阴性者不患目标疾病的可能性。 R1 R2 金标准 合 计 患者 非患者 阳性 A B R1 阴性 C D R2 合计 C1 C2 N
以例1的资料计算阳性预测值和阴性预测值
预测值与受检人群目标疾病患病率的关系 阳性预测值、阴性预测值与患病率、灵敏度和特异度的关系,根据Bayes定理可用以下公式表示:
表7-1 在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果 表7-1 在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果 患病率 (%) 灵敏度 特异度 筛检 结果 金标准 合计 PPV NPV 患者 非患者 50 + 250 500 - 1000 20 100 400 80 200 800 90 180 580 31 95 420 56 88 720 820
注:图中实线为阳性预测值曲线,虚线为阴性预测值曲线
注:图中实线为阳性预测值曲线,虚线为阴性预测值曲线, 较粗的曲线代表灵敏度和特异度均为95%时的预测值, 较细的曲线代表灵敏度和特异度均为85%时的预测值
筛检试验阳性结果截断值的确定 对筛检试验测得的观察值有个界定,即正常与异常,以区分某人可能“已患”或“未患”某病,也就是划分该试验阳性与阴性的标准。 如何确定筛检试验阳性结果的截断值(cut off point)或临界点,与筛检试验测得病人与非病人的观察值的分布有关。
糖尿病血糖试验不同血糖水平的灵敏度和特异度分布 餐后2小时血糖mg/100ml) 灵敏度(%) 特异度(%) 70 98.6 8.8 80 97.1 25.5 90 94.3 47.6 100 88.6 69.8 110 85.7 84.1 120 71.4 92.5 130 64.3 96.9 140 57.1 99.4 150 50.0 99.6 160 47.1 99.8 170 42.9 100.0 180 38.6 190 34.3 200 27.1
受试者工作特性曲线(receiver operator characteristic curve, ROC)是用真阳性率和假阳性率作图得出的曲线,它可表示灵敏度和特异度之间的关系。
ROC曲线也可用来比较两种或多种筛检试验的诊断价值。除了直观比较的方法外,还可计算ROC曲线下的面积。
第三节 筛检效果的评价 筛检效果的评价指标 筛检评价中存在的偏倚
筛检效果的评价指标 收益 生物学效果的评价 卫生经济学效果的评价
收益 收益(yield)也称收获量,指经筛检后能使多少原来 未发现的病人得到诊断和治疗。 提高筛检收益的方法: 选择患病率高的人群(即高危人群) 选用高灵敏度的筛检试验 采用联合试验
患病率与预测值的关系 筛查对象 患病率(1/10万) 阳性预测值(%) 一般人群(男性) 35 0.4 男性75岁以上 500 5.6 临床触及前列腺结节 50000 93.0
联合试验 在实施筛检时,可采用多项筛检试验检查同一受试对象,以提高筛检的灵敏度或特异度,增加筛检的收益,这种方式称为联合试验。 串联: 全部筛检试验结果均为阳性者才定为阳性。该法可以提高特异度。 并联: 全部筛检试验中,任何一项筛检试验结果阳性就可定为阳性。该法可以提高灵敏度。
表7-2 OB和OA联合试验筛检大肠癌结果 试验结果 大肠癌病人 非大肠癌病人 OB OA + - 19 3 23 16 27 2 6 69 合计 75 90
粪便隐血试验(OB) 灵敏度= 特异度= 粪便隐白蛋白试验 串联试验 并联试验
生物学效果的评价 病死率 死亡率 生存率 效果指数(index of effectiveness,IE) 绝对危险度降低(absolute risk reduction,ARR) 相对危险度降低(relative risk reduction,RRR) 需要筛检人数(number needed to be screened,NNBS)
卫生经济学效果的评价 成本-效果分析(cost-effectiveness analysis): 指分析实施筛检计划投入的费用与获得的生物学效果 成本-效益分析(cost-benefit analysis): 指分析实施筛检计划投入的费用与获得的经济效益的比值 成本-效用分析(cost-utility analysis): 指分析实施筛检计划投入的费用与获得生命质量改善的评价分析
筛检评价中存在的偏倚 领先时间偏倚(lead time bias) 病程长短偏倚(length bias) 过度诊断偏倚(over diagnosis bias) 志愿者偏倚(volunteer bias)
领先时间偏倚 领先时间(lead time)是指通过筛检试验,在慢性病自然史的早期阶段,在症状出现前提前做出诊断,从而赢得提前治疗疾病的时间。 领先时间偏倚是指筛检诊断时间和临床诊断时间之差被解释为因筛检而延长的生存时间。
病程长短偏倚
过度诊断偏倚
志愿者偏倚 筛检参加者与不参加者之间,某些特征可能存在不同,使得通过筛检发现的病例的预后较临床期确诊的病例的预后好。
小 结 筛检就是用一些方法将人群中表面健康但可能患病的人查出,以便早期治疗,改善其预后。 小 结 筛检就是用一些方法将人群中表面健康但可能患病的人查出,以便早期治疗,改善其预后。 筛检类型可分为,整群筛检或选择性筛检,单项筛检或多项筛检,治疗性筛检或预防性筛检,主动性筛检或被动性筛检。 评价筛检试验真实性的指标主要有灵敏度、特异度、阳性预测值与阴性预测值。 影响筛检试验可靠性的因素有受试对象、观察者和实验室条件。 筛检效果的评价可从个体受益、社会受益的生物学和社会经济学方面进行,同时要注意避免领先时间偏倚、病程长短偏倚和自我选择偏倚。