http://cc.jlu.edu.cn/yfyx.html 预防医学系 吉林大学公共卫生学院
第二篇 预防保健策略与措施
第七章 筛检与诊断试验的评价
外表健康的人群 筛检试验 阳性者 阴性者 诊断试验 阳性者 阴性者 治疗性干预 (健康者和虽患病但尚未予以诊断的人) ○ ● ▲ ○ ○ ○ ○○ ○ ○ ●▲ ○ ● ○ ▲○ ○ ● ▲ ● ▲ ○○ ● ▲ 筛检试验 ○○ ○ ▲ ● ▲ 阳性者 (患某病或有危险患某病的人) 阴性者 (那些未患某病的人) ● ▲ ● ▲ ● ▲ ● ● ● ● ● ● ▲ ● ▲ ● ▲ ▲ ▲ ▲ 诊断试验 ● ● ▲ ▲ 阳性者 (患病或具备危险因素) 阴性者 (未患病或不具备危险因素) 治疗性干预
主要内容 概述 诊断试验的评价过程 诊断试验的评价指标 提高诊断试验效率的方法
一、筛 检 筛检 (screening): 在大量表面上无病的人群中通过快速简便的试验、检查和其他方法,去发现那些未被识别的、可疑的病人或有缺陷的人。
﹠通过快速的试验、检查、或其他方法,在健康人群中将那些可能有病但表面健康的人,同那些可能无病的人鉴别开来 一、筛 检 ﹠通过快速的试验、检查、或其他方法,在健康人群中将那些可能有病但表面健康的人,同那些可能无病的人鉴别开来 ﹠早期发现可疑病人的一种措施 ﹠发现高危个体,减缓发病,达到一级预防
一、筛 检 筛检试验(screening test) ★识别健康人群中未被发现的某病患者或可疑患者,或高危个体 ★问卷、常规体格检查、物理学检查、实验室检验、高级分子生物学技术 ★简单、廉价、快速、安全、易于被群众接受及良好的可靠性与精确性
二、诊 断 诊断 (diagnosis):应用各种实验、医疗仪器等手段对病 人进行检查,以确定或排除疾病。 诊断试验(diagnosis test):诊断过程所采用的方法 实验室检查(生化、血液学、细菌学、免疫学等) 仪器诊断(心电、彩超、影像学等) 病史、体检等资料。
三、筛检试验与诊断试验的区别 筛检试验 诊断试验 对象不同 健康人或无症状的病人 病人 目的不同 把病人及可疑病人与无病者区分开来 筛检试验 诊断试验 对象不同 健康人或无症状的病人 病人 目的不同 把病人及可疑病人与无病者区分开来 病人与可疑有病但实际无病的人区分开来 要求不同 快速、简便、高灵敏度 科学性、准确性 费用不同 简单、廉价 一般花费较贵 处理不同 阳性者须进一步作诊断试验以便确诊 结果阳性者要随之以治疗
四、诊断试验评价的意义 对诊断试验的应用价值进行科学的评价: 缺乏评价可能导致误用,如癌胚抗原(CEA) 淘汰差的诊断方法 应用之前必需经过科学的评价 为临床医生合理选用诊断试验并正确解释其结果提供科学依据: 诊断的特异性;多种诊断的方法的综合运用;缩短确认时间;降低医疗费用等。
主要内容 概述 诊断试验的评价过程 诊断试验的评价指标 提高诊断试验效率的方法
诊断试验评价的基本思想 首先选定一个科学可靠的对比标准(金标准),选择适宜条件的、具有代表性的和适当样本含量的研究对象,并进行分组,然后利用待评价的诊断试验同步盲法测试这些研究对象并比较结果。
一、确定金标准 金标准 (gold standard): 指当前临床医学界公认的诊断疾病的最可靠的方法。也称标准诊断。 活检 手术发现 微生物培养 尸检 特殊检查和影像诊断 抗原抗体检测 长期随访的结果
二、研究对象的选择 ◈ 原则:代表性 ◈ 病例组:按金标准确诊为“有病”的病例 ◈ 对照组:按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。正常人一般不宜纳入对照组。注意年龄、性别等因素与病例组的可比性。
三、样本含量的估计 样本量有关的因素 ◈灵敏度 ◈特异度 ◈容许误差
三、样本含量的估计
三、样本含量的估计
四、分界值的确定 比较金标准和待评价方法的检查结果,一般选择检查结果最接近金标准判断结果的界值作为正常值标准。 常用的确定正常值的统计学方法有: 标准正态分布法 百分位数法 ROC曲线法
五、与金标准同步进行盲法比较 盲法测量: 同一研究对象采用两种方法进行测量,测量者不知道研究对象的分组情况。 同步测量: 两种方法同时间、同地区、同人群中进行检测
主要内容 概述 诊断试验的评价过程 诊断试验的评价指标 提高诊断试验效率的方法
试验评价 诊断 金标准 试验 患者 非患者 合计 阳性 真阳性 a 假阳性 b a+b 阴性 假阴性 c 真阴性 d c+d a+c b+d 诊断试验的评价 诊断 金标准 试验 患者 非患者 合计 阳性 真阳性 a 假阳性 b a+b 阴性 假阴性 c 真阴性 d c+d a+c b+d n
一、真实性 (validity) 灵敏度与假阴性率 特异度与假阳性率 似然比 正确诊断指数 真实性又称有效性,是指筛检试验或诊断试验所获得的测量值与实际情况的符合程度,亦称准确性或效度。包括: 灵敏度与假阴性率 特异度与假阳性率 似然比 正确诊断指数
A C D B 阳性 阴性 病人 非病人 A D C B 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B B+D A+B+C+D A C D B 阳性 阴性 病人 非病人 A D C B
真实性(validity) 1.灵敏度(sensitivity) 意义: 灵敏度反映筛检试验检出病人的能力,其值愈大,则漏诊的可能性愈小 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 1.灵敏度(sensitivity) 又称为敏感性或真阳性率,即实际有病而被筛检试验判定为有病的百分率。 意义: 灵敏度反映筛检试验检出病人的能力,其值愈大,则漏诊的可能性愈小
真实性(validity) 2.特异度(specificity) 意义: 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 2.特异度(specificity) 又称为真阴性率,即实际无病而被该筛检试验判定为无病的百分率。 意义: 特异度反映筛检试验能排除非病人的能力。其值愈大,则误诊的可能性愈小。
真实性(validity) 3.假阴性率(漏诊率) 意义: 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 3.假阴性率(漏诊率) 即实际有病,而被该筛检试验错判为无病的百分率。 意义: 筛检试验的假阴性率愈大,则漏诊者愈多;由于漏诊率和灵敏度互补,所以漏诊率愈大,则灵敏度愈低。
真实性(validity) 4.假阳性率(误诊率) 意义: 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 4.假阳性率(误诊率) 即实际无病,而被该筛检试验错判为有病的百分率。 意义: 筛检试验的假阳率愈大,则误诊者愈多;由于误诊率和特异度互补,所以误诊率愈小,则该筛检试验的特异度愈高。
真实性(validity) 5.正确诊断指数(Youden’s index) 约登指数=Se+Sp-1 意义: 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 5.正确诊断指数(Youden’s index) 又称正确指数,是指灵敏度和特异度之和减去1 约登指数=Se+Sp-1 意义: 综合评价真实性的指标,理想的试验应为1
真实性(validity) 6.预测值(Predictive value, PV) 意义: 试验结果为阳性者中真正有病的概率; 诊断 金标准 试验 患者 非患者 合计 阳性 A(真阳性) B(假阳性) A+B 阴性 C(假阴性) D(真阴性) C+D A+C B+D A+B+C+D 6.预测值(Predictive value, PV) 又称预告值,是已知试验结果时,表明有或无该病的概率。 意义: 试验结果为阳性者中真正有病的概率; 试验结果为阴性者中真正无病的概率
7. 似然比(likelihood ratio, LR) 病人中出现某种试验结果的概率与非病人中出现相应结果的概率之比,说明病人出现该结果的机会是非病人的多少倍。 意义:是同时反映灵敏度和特异度的复合指标,不受患病率的影响,应选择阳性似然比较高的诊断方法。包括: 阳性似然比 (positive likelihood ratio,+LR) 阴性似然比 (negative likelihood ratio,-LR)
真阳性率与假阳性率之比 阳性似然比: 阴性似然比 假阴性率与真阴性率之比 意义:说明病人中某种试验出现阳性结果的机会是非病人的多少倍;比值越大说明患病的概率越大,试验结果的诊断价值越高。 意义:说明病人中某种试验出现阴性结果的机会是非病人的多少倍;比值越小,试验诊断的价值越高。
各指标间的关系 1.灵敏度与特异度的关系:一般而言,当试验的条件与方法确定,随着诊断标准的改变,灵敏度与特异度之间呈互为消长的关系。
应选择灵敏度高的标准: 严重疾病,早期诊断可获得较好的治疗效果,漏掉一个可能的病例后果严重。
应选择特异度高的标准: 治疗效果不理想,确诊及治疗费用昂贵;误诊后果严重,造成 严重的精神负担。
灵敏度=特异度 假阳性和假阴性的重要性相等,选择灵敏度和特异度相等或正确诊断指数最大的分界值作为标准。
ROC曲线:又称受试者工作特征曲线,是用真阳性率和假阳性率作图得出的曲线,它可表示灵敏度和特异度之间的关系。
糖尿病血糖试验的ROC曲线(李立明 2002)
ROC曲线常用来决定最佳临界点,通常最接近左上角的截断点,可定为最佳临界点,作为诊断标准,此时诊断的灵敏度和特异度均较好,且误诊率和漏诊率最小。
ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值,帮助临床医师作出最佳选择。通过分别计算各个试验的ROC曲线下面积进行比较,哪一试验的面积最大,则哪一试验的诊断价值最佳。
各指标间的关系 2.预测值和灵敏度、特异度、患病率的关系: Bayes 条件概率公式:
灵敏度、特异度和患病率不同时糖尿病筛检结果 (%) 灵敏度 特异度 筛检 结果 诊断 合计 阳性预 测值(%) 阴性预 糖尿病 非糖尿病 1.5 22.9 99.8 + 34 20 54 63.0 - 116 9830 9946 98.8 150 9850 10000 44.3 99.0 66 98 164 40.2 84 9752 9836 99.1 2.5 111 97 208 53.3 139 9653 9792 98.6 250 9750 摘自(《流行病学进展》第4卷,施侣元,1986)
各指标间的关系 2.预测值和灵敏度、特异度、患病率的关系: 当Se Sp一定时,P增大,阳性预测值增大,阴性预测值减小 当P一定时,Se增大,Sp减小,阳性预测值减小,阴性预测值增大
二、可靠性 (reliability) 变异系数(coefficient of variance,CV) 可靠性又称信度,指相同条件下同一试验对相同人群重复试验获得相同结果的稳定程度。可靠性高,说明试验结果受随机误差的影响不大。评价指标包括: 变异系数(coefficient of variance,CV) 符合率(agreement rate) 诊断试验的一致性分析
二、可靠性 (reliability) 变异系数 当某试验是作定量测定时,可用变异系数来表示可靠性。即所测平均数的标准差与测定的均数之比;比值越小,可靠性越好。 用途:CV常用于比较度量衡单位不同或均数相差悬殊的资料之间的变异度。
二、可靠性 (reliability) 符合率 又称准确度,当某试验做定性测定时,同一批研究对象两次诊断结果均为阳性与均为阴性的人数之和占所有进行诊断试验人数的比率。 用途:可用于比较两个医师诊断同一组病人或同一医师两次诊断同一组病人的结果。
二、可靠性 (reliability) 诊断试验的一致性分析 Kappa值=实际一致性/非机遇一致性 评价不同地点或不同操作者对同一试验结果一致性的指标,该值考虑了机遇因素对一致性的影响并加以校正,提高了判断的有效性。 Kappa值=实际一致性/非机遇一致性 用途:若要衡量临床医生的诊断水平如何,他们对同一人群的诊断结果是否存在差异,可采用Kappa分析。
a a+b(r1 ) a+c(c1) a+b+c+d(n) c c+d(r2 ) 二、可靠性 (reliability) b d 诊断试验的一致性分析 乙检验师 甲检验师 合计 + - a b a+b(r1 ) c d c+d(r2 ) a+c(c1) b+d(c2) a+b+c+d(n)
二、可靠性 (reliability)
二、可靠性 (reliability) Kappa值判断标准 Kappa值 一致性强度 <0 弱 0~0.2 轻 0.21~0.40 尚好 0.41~0.60 中度 0.61~0.80 高度 0.81~1 最强
二、可靠性 (reliability) 个体本身的变异 影响因素 实验条件和实验环境所致变异 观察变异
三、实用性评价 诊断方法是否简单实用? 能否迅速地应用于临床? 试验步骤、操作方法、使用及试剂规格、检测对象与注意事项是否具体明确? 病人和医护人员是否容易接受? 经济效益如何? 对病人有无损伤? 有无临床推广应用价值?
主要内容 概述 诊断试验的评价过程 诊断试验的评价指标 提高诊断试验效率的方法
一、联合试验 联合试验:是指同时应用两种或两种以上的方法来筛检或诊断疾病。分为两种: 1 并联试验(parallel test):也叫平行试验。同时做几个试验 2 串联试验(serial test):也叫系列试验。依次做几项试验 结果判定:一项为阴即为阴,全部为阳才为阳。 效果:Se减小 Sp增大 阳性预测值增大 阴性预测值减小 应用:当现有试验的特异度都达不到要求时,可采用此法。 结果判定:一项为阳即为阳,全部为阴才为阴。 效果:Se增大 Sp减小 阳性预测值减小 阴性预测值增大。 应用:可能尽可能地发现病人时,多项的筛检试验者不够敏 感时,可采用。
一、联合试验 联合试验筛检糖尿病的结果 试验结果 尿糖 血糖 糖尿病病人 非糖尿病病人 + - 14 10 33 11 117 21 35 7599 合计 199 7641 ▲串联:全阳为阳,否则为阴 ▲并联:一阳即阳,全阴才阴
实验方法 灵敏度(%) 特异度(%) 血糖试验 75.38 99.58 尿糖试验 65.83 99.59 串联试验 58.79 99.73 一、联合试验 实验方法 灵敏度(%) 特异度(%) 血糖试验 75.38 99.58 尿糖试验 65.83 99.59 串联试验 58.79 99.73 并联试验 82.41 99.45
当试验的方法确定之后,我们选择患病率较高的人群,不但可以使新发现病例数量增加,还可以使阳性预测值升高,试验成本下降,提高试验效率。 二、选择患病率高的人群 当试验的方法确定之后,我们选择患病率较高的人群,不但可以使新发现病例数量增加,还可以使阳性预测值升高,试验成本下降,提高试验效率。
思考题 诊断 真实性评价指标的计算及意义 ROC曲线的定义及应用 诊断试验评价的基本思想