Download presentation
Presentation is loading. Please wait.
1
第十二章 筛检与诊断试验
2
案例 200位成年男性体格检查,经冠状动脉造影和心电图运动试验检查,结果:在110例冠脉造影显示狭窄的人中,心电图阳性55例,阴性55例; 90例冠脉造影显示不狭窄的人中,心电图阳性9例,阴性81例。 如何评价心电图运动试验对诊断冠状动脉狭窄的意义。
3
内容提要 第一节 概述 第二节 如何评价及评价指标 第三节 试验的指标与标准 第四节 提高诊断试验效率的方法 第五节 诊断试验的评价原则
第一节 概述 概念、筛检试验的用途及原则 第二节 如何评价及评价指标 真实性、可靠性和收益 第三节 试验的指标与标准 指标、原则与方法 第四节 提高诊断试验效率的方法 第五节 诊断试验的评价原则
4
第一节 概述 概念、筛检试验的用途及原则
5
筛检 ( Screening ) 定义 筛检不是诊断,仅是一个初步检查,对筛检阳性和可疑阳性的人,必须进一步进行确诊检查。
1951年美国慢性病委员会提出: “通过快速的检验、检查或其他措施,将可能有病但表面上健康的人,同可能无病的人区别开来。” 筛检不是诊断,仅是一个初步检查,对筛检阳性和可疑阳性的人,必须进一步进行确诊检查。
6
筛检的分类 按筛检对象的范围分类: 按所用的筛检方法数量分类: 整群筛检 ( mass screening )
选择性筛检 ( selective screening ) 按所用的筛检方法数量分类: 单项筛检 ( single screening ) 多项筛检 ( multiple screening )
7
诊断 ( diagnosis ) 定义 诊断不同于筛检,筛检是把病人及可疑病人与无病者区别开来,而诊断则是进一步把病人与可疑有病但实际无病者区别开来。 用于确定或排除疾病的试验称为诊断试验。涉及各种诊断手段与方法,包括临床检验、仪器检查和影像诊断。实验室诊断试验仅是其中一部分。
8
筛检试验的用途 ① 早期发现病例 二级预防 ② 筛检高危人群 一级预防 ③ 研究疾病自然史 ④ 开展流行病学监测
9
筛检的应用原则 筛检的疾病是一个重大公卫问题 治疗方法有效 有进一步确诊方法与条件 明确该病的自然史 有较长潜伏期或领先时间
有适当的筛检方法 有良好的预期效益
10
一、评价性试验研究的基本方法 用待评价的诊断试验和标准诊断方法(金标准)检测相同的受检对象,并进行比较:根据标准诊断的结果将被检对象分为实际患病组(病例组)和未患某病(对照组)两组,根据待评价的诊断试验得出阳性或阴性结果并汇入四格表,然后对待评价的诊断试验的真实性进行评价。
11
评价某项诊断试验的资料整理表
12
评价性研究的设计要点 1.选择研究对象 2.确定金标准 (gold standard) 3.样本含量 与一些参数有关 4.确定正常值
研究对象要能代表目标人群(试验检查对象总体) 2.确定金标准 (gold standard) 3.样本含量 与一些参数有关 α显著性水平值 δ容许误差 p 率的估计值 4.确定正常值
13
研究对象的选择 病例:应该包括所研究疾病的各种临床类型如轻、中、重型;典型与非典型;病程长与病程短;
对照:其他可能引起阳性结果或者与目标疾病容易混淆的疾病病例。 通常不以正常健康人为对照。
14
避免偏倚 问题最多的是对照组的选择与构成 防止的方法是做好研究设计 ①对照组排除疾病时常常没有采用金标准
②对照组中各病种比例不能代表目标人群,缺乏代表性 ③对照组人数过少,甚至不设对照组 防止的方法是做好研究设计
15
金标准 — 即标准诊断方法 标准诊断方法:可以明确肯定或排除某种疾病的最可靠的诊断方法。 包括: 病理学诊断( 组织活检和尸体解剖)
标准诊断方法:可以明确肯定或排除某种疾病的最可靠的诊断方法。 包括: 病理学诊断( 组织活检和尸体解剖) 外科手术发现 特殊的影像诊断(如冠脉造影对冠心病的诊断) 综合诊断标准(风湿热:Johes 标准;SARS ) 长期临床随访所获的肯定诊断
16
样本量大小的估算公式 p为敏感性或特异性,δ为容许误差,α为第一类错误的概率,μ值由μ界表查得。病例组样本量由敏感性估计,对照组样本量由特异性估计。 一般取α=0.05,②δ在0.05~0.10;③p=50%时,样本量最大,离开50%愈远,样本量愈小。
17
筛检试验的条件 1. 安全可靠,创伤、痛苦少 2. 高的灵敏度和特异度 3. 快速、简单、价廉
18
第二节 如何评价及评价指标 真实性、可靠性、收益
第二节 如何评价及评价指标 真实性、可靠性、收益
19
一、真实性 ( validity ) 又称效度 ( efficacy )、准确性 ( accuracy )指测量值与实际值符合的程度
评价指标: 灵敏度 ( sensitivity Se) 假阴性率β 特异度 ( specificity Sp ) 假阳性率α 似然比 ( likelihood ratio, LR ) 约登指数( Youden’s index, r)
20
灵敏度(Se):真阳性率 实际有病的人正确判为患者的能力。 Se= a / a+c
假阴性率(β) 实际有病的人错判为非患者的比例。 β = c / a+c Se= 1 -β 特异度(Sp):真阴性率 实际无病的人正确判为非患者的能力。 Sp = d / b+d 假阳性率(α) 全部非病人中诊断试验为阳性者所占的比例。 α= b / b+d Sp = 1 -α
21
敏感性、特异性的相互关系 Se和Sp是试验本身固有特性,受P的影响很小,但受选定的诊断标准(临界值)的影响较大。
连续性资料,如何确定有病和无病的临界点?选择高Se时,Sp低,造成误诊;选择高Sp时,Se低,造成漏诊。必须全面衡量后果。 应考虑临床实际来确定临界点。
22
敏感性高的诊断试验用于: 特异性高的诊断试验用于: ①疾病诊断初期,用于排除诊断; ②漏诊可能造成严重后果的疾病;
③用于筛检无症状的患者,而该病的发病率比较低。 特异性高的诊断试验用于: ①肯定诊断; ②误诊会给病人造成严重后果,包括经济负担、精神和肉体上的严重危害等。
23
似然比(LR):病人中出现某种试验结果的概率与对照组中出现相应结果的概率之比。
阳性似然比:指病例组阳性概率与对照组阳性概率的比值,即诊断试验正确判断阳性的可能性是错误判断阳性的多少倍。值越大越好。 +LR=真阳/假阳=Se/(1-Sp)=a/(a+c):b/(b+d) 阴性似然比:指病例组阴性概率与对照组阴性概率的比值,即错误判断阴性的可能性是正确判断阴性的可能性的多少倍。值越小越好。 -LR=假阴/真阴=(1-Se)/Sp= c/(a+c):d/(b+d)
24
约登指数 ( YI ,r) :正确指数 灵敏度与特异度之和减1
r = Se+ Sp - 1 = 1 - α-β 约登指数值于 -1~l 之间变动,其值愈大,诊断试验的真实性愈好
25
练习 200位成年男性体格检查,经冠状动脉造影和心电图运动试验检查,结果:在110例冠脉造影显示狭窄的人中,心电图阳性55例,阴性55例; 90例冠脉造影显示不狭窄的人中,心电图阳性9例,阴性81例。 试评价心电图运动试验对诊断冠状动脉狭窄的真实性如何?
26
二、可靠性 ( reliability ) 可重复性、精确度,是诊断试验在完全相同条件下进行重复操作获得相同结果的稳定程度。 衡量指标:
可重复性、精确度,是诊断试验在完全相同条件下进行重复操作获得相同结果的稳定程度。 衡量指标: 1.定量资料: 变异系数 2.计数资料: 符合率 同一批次受试者做两次检测;不同观察者或同一观察者在不同情况下对某结果判定的一致程度 3. Kappa值一致性分析
27
2名眼科医师对100张眼底图象有无视网膜病的诊断结果
请计算符合率、调整一致率=?
28
Kappa=实际一致性/非机遇一致性 意义:一致性大小;取值-1 ~ +1
为负数,观察到的一致性比机遇造成的一致性还小;=-1,两医生的判断完全不一致;=0,观察到的一致率完全由机遇造成;>0,观察的一致程度大于因机遇一致的程度;=1,两医生的判断完全一致。 0.4~0.75,为中高度一致;≥0.75,极好一致性;≤0.4,一致性差。
29
真实性与可靠性的关系 真实性与可靠性不是必定相关的: 在评价时两类评价指标均不可忽略。 真实性好不一定可靠性也好 可靠性好不一定真实性好
警惕:可靠性虽然很好但不真实的结果。 在评价时两类评价指标均不可忽略。
31
影响可靠性原因 1. 实验条件所致变异 2. 观察者差异 试验标准化 培训人员 3. 被观察者的个体生物学变异 统一测量时间、条件
32
三、预测值 ( predictive value,PV )
又称诊断价值,试验结果表明有无疾病的概率。 值愈大愈好。 阳性预测值 (positive PV,+ PV ) 阳性试验结果中实际患病者百分率,试验阳性者患病概率 PV= a / a+b 阴性预测值 (negative PV,- PV ) 阴性试验结果中实际未患病百分率,试验阴性者未患病的概率 PV= d / c+d
33
患病率(P):指被检查的全部对象中,真正患病者的比例。也称为验前概率,预测值:验后概率 预测值与患病率的关系:
PV是临床很有用的指标,但不稳定,受Se、Sp和P的影响。 Se越高,-PV也越高; Sp越高,则+PV也越高 PV很大程度上取决于P,对PV的影响更为重要。 P不同,PV也会有很大差别,因此在解释诊断试验结果时应特别小心。
34
举例 酸性磷酸酶诊断前列腺癌,Se为70%,Sp为90%,应用于不同人群因P不同,其PV差别极大
一般人群 35 0.4 75岁以上男性 500 5.6 临床触及前列腺结节 50000 93.0
35
第三节 试验的指标与标准 一、试验指标 客观指标 主观指标 半客观指标 以客观指标最好
36
诊断标准、界值、截断点( cutoff point )
对于诊断试验,截断点一般就是正常值的界值,在筛检试验中还可根据筛检目的进行调整。 1. 通常,正常者与异常者的测定值总有重叠 无论怎样定标准,总有误诊或漏诊,且直接影响到 Se和 Sp。 2. 截断点的确定不是一成不变的,可因不同目的加以调整。
37
二、确定与判断标准的原则 标准的高低关系到Se、Sp,遵循原则 漏诊可能造成严重后果,选择高Se的诊断标准
重要性相等时,诊断标准定在Se =Sp处或r最大处
38
确定与判断标准的方法 (l)统计学方法 均数±标准差法 百分位数法
(2)受试者工作特征曲线 (receiver operation characteristic curve,ROC) 曲线上距离左上角最短的点所对应的值 (3)病例、正常两组分布交叉对应之点 (4)约登指数最大值对应之点 (5)从临床治疗出发制订
39
受试者工作特征曲线(ROC曲线) 是用构图法揭示敏感性与特异性(误诊率)之间的相互关系。是对连续性资料而言的,通过设定出多个不同的临界值,计算出一系列的敏感性和特异性,再以敏感性为纵坐标,1-特异性(误诊率)为横坐标所绘制的曲线。
40
第四节 提高诊断试验效率的方法 1.选择患病率高的人群 2.联合试验 3. 优化试验方法
第四节 提高诊断试验效率的方法 1.选择患病率高的人群 2.联合试验 并联 ( parallel test )、串联 ( serial test ) 3. 优化试验方法
41
选择在高危人群中应用诊断试验 诊断试验的PV与患病率(P)高低有关,随P升高,+PV升高,α误诊率降低。
选择高危人群的方法有: 设立专科门诊;选择有某些生理特征、特殊临床表现或某些致病因素的特殊暴露人群
42
并联与串联试验 1.并联试验(parallel test ) 2.串联试验(serial test ) 3. 并联、串联混合联合应用
是指同时应用多项试验,其中任何一项阳性即视为阳性。可提高Se,降低Sp 2.串联试验(serial test ) 同时应用多项诊断试验,当每项验均为阳性时才视为阳性。可提高Sp,降低Se 3. 并联、串联混合联合应用
43
第五节 诊断试验的评价原则 一、是否与金标准进行了同步盲法比较? 二、研究对象的代表性如何? 三、样本量的含量是否足够?
第五节 诊断试验的评价原则 一、是否与金标准进行了同步盲法比较? 二、研究对象的代表性如何? 三、样本量的含量是否足够? 四、临界值的确定是否合理可靠? 五、诊断试验的重复性及测量变异如何? 六、评价指标计算是否正确?解释是否合理? 七、对联合试验的评价是否得当? 八、是否交待了诊断试验的具体步骤? 九、是否对试验的临床实用性做了实事求是评判?
44
230例心梗患者和130例非心梗患者进行血清肌酸激酶(CK)测定(≥80IU/L为+ <80为-)结果如下,请计算各项指标。
心肌梗塞 合计 有 无 阳性 215 16 231 阴性 25 114 129 230 130 360
Similar presentations