第四章 诊断试验 (Diagnostic test) 时景璞 中国医科大学附属第一医院 临 床 流 行 病 学 教 研 室
是否患病?患什么病? 诊断试验准确性高、精确性好; 病人可接受、简便易行; 安全性大、创伤性小; 成本低、花费少、效益高。
§1 诊断研究的现状及其重要性 一、诊断研究的现状 1. 国外 普遍采用医学科研方法学进行临床 诊断试验研究与评价。 §1 诊断研究的现状及其重要性 一、诊断研究的现状 1. 国外 普遍采用医学科研方法学进行临床 诊断试验研究与评价。 McMaster University将某诊断试验 似然比告知临床医生,通过简单 计算可推断病人 患某病的概率。
Steinberg WM 对经B超、CT等证实39例急性 胰腺炎和127例非胰腺炎腹痛者进行了对照研究: 敏感度(Se.) 特异度(Sp.) 总淀粉酶* (Backman M) 胰蛋白酶原 97.5% 82.8% 脂肪酶 86.5% 99.0% *选择最佳临界点(正常上限的1.5倍),对照组 仅10~11%超出正常上限,无1 例超出正常上限2 倍。 95.0% 98.4%
为提高诊断试验准确率,联合诊断 试验的研究:Nakano 研究 343 例各种 肝脏疾患,包括 132 例肝细胞癌和37例 肝转移癌,测定 AFP和血清铁蛋白。 Se. Sp. AFP 59.8% 92.5% 血清铁蛋白 50.8% 73.6% 联合试验 85.6% 81.9%
临界点: AFP≥200μg / L 血清铁蛋白≥300μg / L 采用联合试验诊断符合率: <3cm 72.2%; 3~5cm 84.6%; >5cm 93.3%
2. 国内 起步较晚,问题不少。 ▲ 阳性率 某诊断试验的诊断价值; ▲ 缺乏有效的对照(黄金标准); ▲ 正常值的确定缺乏科学方法。
中华内科杂志 1983~1987 年有关诊断 试验论著共 120篇,其中,采用金标准对照、 四格表法分析者仅20篇,占16.7%。 中华肿瘤杂志 1990~ 1999年有关诊断 试验论著共23篇,金标准明确者占82.6%;采用盲法者占39.1%;达到方法学标准者仅4.3%。 已经开始重视进行科学的评价。
表4-1 10项标记对原发性肝细胞癌诊断价值的评定 标记 (血清) 敏感度 特异度 阳性预测值 阴性预测值 符合率 表4-1 10项标记对原发性肝细胞癌诊断价值的评定 标记 (血清) 敏感度 特异度 阳性预测值 阴性预测值 符合率 铁蛋白 80.0 50.5 45.8 83.6 60.9 HDL-C* 96.5 56.7 65.5 95.6 75.9 铜氧化酶 49.0 83.2 41.5 86.7 76.5 α1抗胰蛋白酶 74.7 93.6 86.1 81.4 87.0 α1抗糜蛋白酶 68.0 92.2 82.3 84.4 83.8 LDH 同功酶 76.3 33.7 20.8 86.1 41.6 GOTm 81.6 63.5 40.3 91.9 67.7 AKP-Ⅰ 24.8 98.6 92.6 98.6 68.1 GGT 总活力** 93.9 56.9 26.9 98.2 62.2 GGT-Ⅱ 90.9 97.1 94.7 94.4 94.5 高密度脂蛋白 ** γ-谷氨酰转移酶(AFP阴性原发肝癌中GGT-Ⅱ 阳性72.2%)〈孟宪镛等,中华内科杂志. 1987;26(3): 141〉
二、研究和评价诊断试验的重要性 1. 科学选择诊断试验的基础 诊断试验的用途 (1)诊断疾病,包括鉴别诊断; 1. 科学选择诊断试验的基础 诊断试验的用途 (1)诊断疾病,包括鉴别诊断; (2)筛检疾病(screening); (3)考核疗效、判断预后、药物 监测、随访(follow-up)等。
2. 正确认识诊断试验的临床应用价值 未采取医学科研原理和方法评价时, 难以正确认识一项新的诊断试验。 2. 正确认识诊断试验的临床应用价值 未采取医学科研原理和方法评价时, 难以正确认识一项新的诊断试验。 如: 癌胚抗原 (CEA ) 诊断结直肠癌价值, 35例/36例中CEA(97.2%)升高; 但后来发现缺少特异性,未患结直肠癌的其他癌症病人也存在此抗原。 未患肿瘤的重度吸烟者中约20%CEA阳性!
§2 诊断试验评价内容 及需要注意的问题 一、诊断试验研究的定义及评价内容 1. 诊断试验(diagnostic test)的定义 §2 诊断试验评价内容 及需要注意的问题 一、诊断试验研究的定义及评价内容 1. 诊断试验(diagnostic test)的定义 指经各种检查后,对受检对象疾病 或健康状况作出的诊断以及 对各种诊断标准的评价。 评价
2. 诊断试验研究的内容 (1)一项新的诊断试验结果为阳性时, 对某病的确诊价值如何; (2)一项新的诊断试验结果为阴性时, 2. 诊断试验研究的内容 (1)一项新的诊断试验结果为阳性时, 对某病的确诊价值如何; (2)一项新的诊断试验结果为阴性时, 对某病的排除价值如何; (3)哪些因素影响诊断试验的结果; (4)该诊断试验在何时使用收益最高; (5)正常值如何确定等。
二、诊断试验研究时应注意的问题 1. 黄金标准(Gold Standard)的确立 (1)黄金标准的概念 相对而言当前医学界公认的、 能够比较正确的区分有病 或无病的诊断方法。 金标准是相对的
病理学诊断: (活体病理组织检查;尸检) 手术探查; 病原微生物培养; 特殊的影像学检查; 临床长期随访所获得的肯定诊断等; 临床常用的黄金标准有 : 病理学诊断: (活体病理组织检查;尸检) 手术探查; 病原微生物培养; 特殊的影像学检查; 临床长期随访所获得的肯定诊断等;
假阳性 例:评价B 超诊断胆囊结石 以口服造影剂胆囊造影作为金标准。 胆囊造影阳性者做手术。其中 5 例病人 造影无结石,均被判定为假阳性 假阳性
随访 5 例患者均因临床症状反复 发作而诊断胆石症进行了手术,结果 每位患者的胆囊内均有结石。 客观事实说明 B超对胆囊结石的 诊断比口服造影剂胆囊造影更正确! 但由于金标准选择不当,当时误认为 B超对胆结石的评价结果不可靠。
选作黄金标准的条件 1)注意该诊断试验的精确性和实用性。 2)若某种疾病目前尚无标准诊断方法,难以评 价某诊断试验价值时,最好不广泛选用。 3)结合临床具体情况确定。
2. 研究对象的确立 (1)评价筛检试验,研究对象选自人群; 2. 研究对象的确立 (1)评价筛检试验,研究对象选自人群; (2)评价临床诊断试验,研究对象应选自病例。 1)试验组应包括: 特 征:年龄、性别; 临床表现:典型、不典型; 病 情:轻、重;有无并发症等。 2)对照组应包括: 确实没患有所研究的疾病的其他病例和与 该病易混淆的病例。
3. 样本量大小的估计 (1) 对诊断试验敏感度的要求 (假阴性率控制在什么水平); (2)对诊断试验特异度的要求 (假阳性率控制在什么水平); (3)允许误差。
u p(1-p) n= δ2 病例组的样本量由敏感度估计。 对照组的样本量由特异度估计。 (4)诊断试验样本量的估计公式: δ2 α 2 δ=允许误差 α=为第一类错误的概率 u 从界值表查得 病例组的样本量由敏感度估计。 对照组的样本量由特异度估计。
例1:应力性骨折(stress fracture,SF) 国外:骨闪烁显像为标准诊断方法, 其敏感度达 100%,特异度达 98%, 但设备昂贵,检查费用高。 评价临床诊断标准, 骨闪烁显像为金标准。 要求:允许误差为 5%, 估计:敏感度90%,特异度85%, α=0.05, SF组与NSF组各需要多少例?
解:已知α=0.05,双测u0.05=1.96,δ=0.05, 敏感度=0.90,特异度=0.85,代入公式: n1=1.962×0.90×(1-0.90)/0.052=138.3≈139(SF) n2=1.962×0.85×(1-0.85)/0.052=195.9≈196(NSF) 答:SF组与NSF组分别需要 139例和196例, 共需345例。
4. 资料来源的情况 样本多来自病例 假阴性问题。 若结果为阳性,大多进一步检查; 4. 资料来源的情况 样本多来自病例 假阴性问题。 若结果为阳性,大多进一步检查; 若结果为阴性,不肯进一步检查。 那么,这阴性结果是真阴性还是假阴性? A. 可能贻误病人(漏诊) B. 影响判断诊断试验结果的准确程度。 5. 疾病诊断客观标准的选择 如:心绞痛的诊断依据 。
+ 6. 研究结果的盲法判定 ± - 为消除测量(观察)性偏倚。 Test review bias: 已知诊断试验结果,再判断金标准结果 试验回顾性偏倚。 Diagnosis review bias: 金标准 判定者 已知金标准判断结果,再做 诊断试验 诊断回顾性偏倚。 两者均可导致结果间的一致性偏高。 诊断试验 操 作 者
§3 诊断试验的研究 方法和评价指标 评价诊断试验准确性的基本方法: 与黄金标准进行盲法和同步 比较的四格表分析法。
一、诊断试验准确性的评价指标 表4-2 评价诊断试验的四格表 黄金标准 合 计 病例组 非病例组 诊断 试验 + a b a+b d - c 表4-2 评价诊断试验的四格表 黄金标准 合 计 病例组 非病例组 诊断 试验 + a b a+b d - c c+d a+c b+d N 合计
1. 符合率与患病率 (1)符合率又称准确度 (Coincidence rate or Accuracy ) 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 1. 符合率与患病率 (1)符合率又称准确度 (Coincidence rate or Accuracy ) 1)定义 指测量值与真值之间的符合程度。 2)公式 符合率 =(a+d)/ N×100% [ N =(a + b + c + d)] 3)意义 符合率的值越接近 1,其假阳性率、 假阴性率值越小,诊断的价值越大。
对象的比例。 2)公式 患病率 =(a+c)/ N×100% 3)意义 与敏感度、特异度、预测值有一定 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (2)患病率(Prevalence rate) 1)定义 表示某个时点 某人群中存在 某种疾病(新+旧)的频率。 金标准判定有病者占全体受试 对象的比例。 2)公式 患病率 =(a+c)/ N×100% 3)意义 与敏感度、特异度、预测值有一定 关系。
2. 敏感度与特异度 (1)敏感度又称真阳性率 (Sensitivity) 1)定义 指患者组中经该诊断试验检查所 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 2. 敏感度与特异度 (1)敏感度又称真阳性率 (Sensitivity) 1)定义 指患者组中经该诊断试验检查所 获阳性人数的比例。 2)公式 敏感度= a /(a+c)×100% 3)意义 用来衡量与表达该诊断试验正确 识别确实患病的能力。
▲有利于确定诊断:当漏诊会造成一定危害时, 试验结果阳性是诊断的有力证据,避免漏诊; ▲有利于早期诊断:寻找可疑病例,利于早期 发现、早期诊断(恶性肿瘤); ▲有利于鉴别诊断:为排除某病以敏感度高的 试验检查结果为阴性时有利于鉴别诊断; ▲有利于筛检:确定高危人群,特别对发病率 较低、稀有病例的筛检。 *敏感度仅与患病组有关而与非患病组无关。
该诊断试验检查所获阴性人数比例。 2)公式 特异度 = d /(b+d)×100% 3)意义 用来衡量和表达该诊断试验能正确 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (2)特异度又称真阴性率 (Specificity) 1)定义 指在非患者组中用 该诊断试验检查所获阴性人数比例。 2)公式 特异度 = d /(b+d)×100% 3)意义 用来衡量和表达该诊断试验能正确 识别确实未患病的能力。 ▲ 减少误诊; ▲ 有利于确定诊断; ▲ 需进一步进行复杂、昂贵、较危险的检查时。
误诊率(Missed diagnosis rate) 又称假阳性率 (False positive rate) 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 误诊率(Missed diagnosis rate) 又称假阳性率 (False positive rate) = b /(b+d)×100% = 1-特异度 漏诊率(Misdiagnosis rate) 又称假阴性率(False negative rate) = c /(a+c)×100% = 1-敏感度
敏感度与特异度是诊断试验 本身的特性,是评价诊断试验的 准确性的两个基本指标。 当试验方法和诊断标准均为 固定时,每个诊断试验的敏感度 和特异度恒定。
通常,敏感度与特异度呈反比关系。 表4-3 不同血糖水平诊断糖尿病 的敏感度和特异度变化 血糖水平 敏感度 特异度 5.0 98.6 7.3 表4-3 不同血糖水平诊断糖尿病 的敏感度和特异度变化 血糖水平 敏感度 特异度 5.0 98.6 7.3 5.6 97.1 23.5 6.1 92.9 48.4 6.7 88.6 68.2 7.2 81.4 82.4 7.8 74.3 91.2 8.3 64.3 96.l 8.9 55.7 98.6 9.4 52.9 99.6 10.0 50.0 99.8 10.5 44.3 99.8
P±Zα/2√P(1-P)/n 敏感度或特异度的95%可信区间公式: P为敏感度或特异度 α=0.05 Zα/2=1.96 n=a+c 金标准确定为病例总数(敏感度可信区间) n=b+d金标准确定为非病例总数(特异度可信区间) 条件:nP≥5,同时n(1-P)≥5
符合率与敏感度、特异度的关系 敏感度 误诊率 特异度 漏诊率 但不反映敏感度和特异度单方面的情况。如: 符合率 敏感度 误诊率 特异度 漏诊率 但不反映敏感度和特异度单方面的情况。如: 假设两个诊断试验的符合率均为70%, A试验的敏感度为80%,特异度为60%, 而 B试验的敏感度为60%,特异度为80%。 由于不同疾病被误诊与漏诊的临床代价不一样, 故敏感度和特异度的临床意义也有所区别,因此, 符合率相同的两个诊断试验当其敏感度不同时,其 临床价值可能不一样。
3. 预测值(Predictive Value) 敏感度和特异度—诊断能力。 预测值--其诊断结果为阴性或阳性与疾病的存在 是否有关联。 预测值是已知诊断试验结果阳性或阴性时,表 明有病或无病的概率,亦称诊断价值。
真正患病者的比例。 2)公式 阳性预测值 = a /(a+b)×100% 3)意义 试验结果是阳性时,患该病的 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (1)阳性预测值(Positive Predictive Value, +PV) 1)定义 指在诊断试验结果为阳性者中, 真正患病者的比例。 2)公式 阳性预测值 = a /(a+b)×100% 3)意义 试验结果是阳性时,患该病的 可能性多大。
2)公式 阴性预测值 = d /(c+d)×100% 3)意义 试验结果是阴性时,未患该病的 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (2)阴性预测值(Negative Predictive Value, -PV) 1)定义 指在诊断试验结果为阴性者中, 真正未患病者的比例。 2)公式 阴性预测值 = d /(c+d)×100% 3)意义 试验结果是阴性时,未患该病的 可能性多大。
(3)预测值与患病率及敏感度、特异度之间的关系 1)患病率一定时预测值与敏感度、特异度之间的关系 表4-4 患病率一定时预测值与敏感度 特异度之间的关系(%) 肌酸磷 敏感度 特异度 阳 性 阴 性 酸激酶 预测值 预测值 40IU 99 68 84 98 80IU 93 88 93 88 160IU 67 97 98 85 280IU 42 99 99 49 ◇当PR一定时 Se↑ -PV↑ (Se↑,诊断试验结果阴性时不是假阴性) Sp↑ +PV↑ (Sp↑ 诊断试验结果阳性时不是假阳性) 患病率=64%
PR↑ +PV ↑ -PV↓ PR↓ +PV↓ -PV↑ 2)敏感度、特异度一定时,预测值与患病率的关系 表4-5 预测值与患病率之间的关系(%) 患病率 99 95 90 80 70 60 50 40 30 20 10 5 1 0.5 0.1 阳性预测值 99.9 99.7 99.4 99 98 97 95 93 89 83 68 50 16 9 2 阴性预测值 16 50 68 83 89 93 95 97 98 99 99.4 99.7 99.7 99.9 99.9 敏感度、特异度各为95% ◇Se、Sp一定时 PR↑ +PV ↑ -PV↓ PR↓ +PV↓ -PV↑
图1 预测值依赖于该病的验前概率 患病率 10% 50% 验前概率 0.1 0.9 0.5 0.5 有病 无病 有病 无病 图1 预测值依赖于该病的验前概率 患病率 10% 50% (验前概率) 1000 000病人 1000 000病人 验前概率 0.1 0.9 0.5 0.5 有病 无病 有病 无病 试验 100 000 900 000 500 000 500 000 敏感度90% 特异度95% 90 000 10 000 45000 855 000 450 000 50 000 25000 475000 a c b d 真阳性 假阴性 假阳性 真阴性 真阳性 假阴性 假阳性 真阴性 阳性预测值= 90 000/(90 000+45 000) = 450 000/(450 000+25 000) = 67% = 95% 阴性预测值= 855 000/(10 000+855000) = 475 000/(475 000+50 000) = 99% = 90% A B
◇患病率受不同人群、不同地区、甚至不同时间 的影响,因而预测值也受到影响 表4-6 不同患病率对酸性磷酸酶诊断前列腺癌预测值的影响 患病率1/10万 阳性预测值% 一般人群 35 0.24 75岁以上人群 500 3.8 临床触及前列腺结节 50000 87.1 敏感度70% 特异度90%
3)Bayes 公式 Se、Sp、PV、PR的关系: +PV= Se×PR (Se×PR)+(1-Sp)(1-PR) ×100% Sp(1-PR)+ PR(1-Se) -PV = ×100%
4. 似然比(Likelihood Ratio) 似然比是评价诊断试验性能的 指标之一。 如果一个诊断试验具有阳性和 阴性两种形式,似然比就具有区别 有病、无病的能力。
Likelihood Ratio,+LR) 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (1)阳性似然比(Positive Likelihood Ratio,+LR) 1)定义 诊断试验正确判断阳性 可能性是错误判断阳性可能性的倍数, 即诊断试验的真阳性率与假阳性率之比 或敏感度与误诊率之比。 2)公式 +LR =〔a/(a+c)〕/〔b/(b+d)〕 = 敏感度/误诊率 = 敏感度/(1-特异度) 3)意义 该值愈大,诊断试验的价值越大。
Likelihood Ratio,-LR) 黄金标准 D 诊断 试验 合 计 a b c d a+b a+c b+d c+d N - + 合计 (2)阴性似然比(Negative Likelihood Ratio,-LR) 1)定义 诊断试验错误判断阴性 可能性是正确判断阴性可能性的倍数, 即诊断试验的假阴性率与真阴性率之比 或漏诊率与特异度之比。 2)公式 -LR =〔c/(a+c)〕/〔d/(b+d)〕 = 漏诊率/特异度 =(1-敏感度)/特异度 3)意义 该值愈小,诊断试验的价值越大。
(3)似然比的主要特性 1)更稳定不受患病率的影响。 2)如果是连续资料,采用不同临界值, 可计算不同水平的似然比。 3)应用似然比可缩短诊断步骤,已知 患病率和阳性似然比时,利用 Nomogram似然比图可直接 查得阳性预测值。
0.1 0.2 1 2 5 10 0.5 20 30 40 50 60 70 80 90 95 99 图2 似然比的应用 1000 500 200 100 50 20 10 5 2 1 .5 .2 .1 .05 .02 .01 .005 .002 .001 验前概率 似然比 验后概率
5.估计验后概率及其临床应用价值 验后概率(post-test probability) 验后概率=验后比/(1+验后比) 验后比=验前比×似然比 验前比=验前概率/(l-验前概率) 验前概率=患病率
如:18岁女孩,因面色苍白乏力被当地医生 怀疑严重贫血转至某三级医院就诊。 根据病史及外周血涂片检查,在该院该 年龄段女孩患缺铁性贫血的可能性为40% (验前概率)。 实验室血清铁蛋白检查结果为12mmol/L, 该院血液学实验室以骨髓铁染色作黄金标准, 用血清铁蛋白试验法诊断缺铁性贫血的阈值 为65mmol/L,≤65mmol/L为缺铁性贫血, 其敏感度为90%,特异度为85%。 问该病员患缺铁性贫血的概率是多少?
验前概率=0.40 验前比=0.40/(1-0.40)=0.67 阳性似然比=Se/(1-Sp)=0.9/(1-0.85)=6 验后比=验前比×似然比=0.67×6=4.02 验后概率=验后比/(1+验后比) =4.02/(1+4.02)=0.80 该病员铁蛋白试验阳性后,患缺铁性 贫血概率比验前概率明显升高,为80%, 因此诊断其患缺铁性贫血有80%的把握。
表4-7 血清铁蛋白诊断缺铁性贫血的似然比 血清铁蛋白 缺铁性贫血 非缺铁性贫血 阳性似然比 mmol/L n % n % 表4-7 血清铁蛋白诊断缺铁性贫血的似然比 血清铁蛋白 缺铁性贫血 非缺铁性贫血 阳性似然比 mmol/L n % n % <15 474 59 20 1.1 52.0 15-34 175 22 79 4.5 4.8 35-64 82 10 171 10.0 1.0 65-94 30 3.7 168 9.5 0.39 ≥95 48 5.9 1332 75.0 0.08 利用表中数字重新计算该患者的验后比: 验后比=验前比×似然比=0.67×52=34.84 验后概率(+PV)=验后比/(1+验后比) =34.84/35.84=97.2%
又如:为评价心电图运动试验的临床诊断价值, 某医院对前来就诊的350人进行了冠脉造影 (黄金标准)和心电图运动试验,结果如下: 表4-8 心电图运动试验的敏感度与特异度 心 电 图 冠脉造影 合 计 运动试验 阳性 阴性 阳性 (ST段下降≥lmm) 137 11 148 阴性 (ST段下降 <1mm) 90 112 202 总 数 227 123 350 (David L.Sackett 1985)
心电图运动试验 137 227 = ×100% =60.4% 敏感度 112 特异度 123 = ×100% =91.1%
特异度及患病率的情况下可估计某个体是否患 某病的概率。如:30岁以上不同年龄者,具有 不同临床症状时,其冠心病的患病率不同。 临床工作中,在已知某诊断试验的敏感度、 特异度及患病率的情况下可估计某个体是否患 某病的概率。如:30岁以上不同年龄者,具有 不同临床症状时,其冠心病的患病率不同。 表4-9 30岁以上人群冠心病的验前(患病)概率 非心绞痛胸痛(%) 非典型心绞痛(%) 典型心绞痛(%) 年龄(岁) 男 女 男 女 男 女 30~39 5.2±0.8 0.8±0.3 21.8±2.6 4.2±1.3 69.7±3.2 25.8±6.6 40~49 14.1±l.3 2.8±0.7 46.l±1.8 13.3±2.9 87.3±1.0 55.2±6.5 50~59 21.5±1.7 8.4±1.2 58.9±1.5 32.4±3.0 92.0±0.6 79.4±2.4 60~69 28.1±1.9 18.6±1.9 67.l±1.3 54.4±2.4 94.3±0.4 90.6±1.0 92.0±0.6 注:每个值表示患病率±1标准误 (GA Daiamond 1979)
+PV= 例1:某55岁男性有明显冠心病症状,需借助心电图 运动试验进一步确诊。从表4-9查知,其所在人群的 患病率约为90%,计算预测值: 0.6×0.9 0.6×0.9+(1-0.9)(1-0.9) +PV= = 98% 结果表示心电图运动试验结果阳性时,该男性患冠心病的可能性为98%。 0.9(1-0.9) 0.9(1-0.9)+0.9(1-0.6) -PV= =20% 结果说明心电图运动试验阴性时,该55岁男性患 冠心病的可能性为80%。
6.ROC曲线(Receiver Operator Characteristic Curve,ROC) 受试者工作曲线:是表示真阳性(灵敏度)与假阳性(1-特异度)关系的曲线图。 表示灵敏度与特异度之间的关系 常被用来决定最佳临界点 越近左上角点的临界值其Se、Sp越高,假阳性和假阴性越低 临床上常用来比较两种或两种以上诊断试验的诊断价值 帮助临床医生决策。
图3 血糖测定的ROC曲线 6.ROC曲线(Receiver Operator Characteristic Curve,ROC) 100 80 60 (200 ) 40 (400 ) 20 0 20 40 60 80 100 1-specificity(%) (50 ) (25 ) (100 ) Sensitivity(%)
图4 脑 和 扫描的 曲线 100 80 60 Sensitivity(%) 40 CT 20 0 20 40 60 80 100 RN 图4 脑 和 扫描的 曲线 CT RN ROC CT scan 100 80 60 40 20 0 20 40 60 80 100 1-specificity RN scan Sensitivity(%) Figure 4 Computerized Tomography Compared to Radionuclide Scanning in Diagnosing Brain Tumors. Griner PF et al, Ann Intern Med, 1981; 94:553-600.
二、诊断试验的可靠性(Reliability) 1. 定义 在相同的条件下诊断试验重复 试验获得相同结果的稳定程度。 2. 影响因素 观察测定的变异(variation) 研究对象生物学变异 测量仪器、试剂的变异 观察者 的变异 之间 自身
准确性与可靠性的不同点 准确性(accuracy)又称 客观性(objectivity)或 真实性(factuality) 试验结果与真实情况的比较。 可靠性(Reliability)又称 重复性(repeatability)或 精确性(precision) 重复试验结果自身差异的比较。
图 5 准确性与可 靠性 A. 又准确又可靠 C. 不准确但可靠 B. 准确但不可靠 D. 不准确不可靠 A C B D 不准确 频数 测量 真实性
图 6 准确性与可靠性 A B 又准确又可靠 准确但不可靠 不准确但可靠 C D 不准确不可靠
§4 诊断试验正常值的确定 正常人的解剖、生理、生化等各种数据的波动范围。 一、正常值的概念 二、制定正常值的几种方法 §4 诊断试验正常值的确定 一、正常值的概念 正常人的解剖、生理、生化等各种数据的波动范围。 含义包含个体又可以包含群体 “正常人”与“健康人” 的不同 用“参考值”代替“正常值” 二、制定正常值的几种方法 1. 正态分布法(均数加减标准差法) 对正常范围之内、之外意义的正确理解
百分位数法确定正常值(不考虑分布) 误差大,要求样本量大 正 常 双侧 2.5 50 97.5 正 常 小 5 正 常 大 95
3. 临床诊断界限的确定 正常人 d 频 数 病 人 a b c X Z Y
No hepatitis Hepatitis 10 25 50 100 200 400 800 Figure 9: Hypothetical distribution of serum alanine Aminotransferase (ALT )among patients with and without hepatitis.
例: Creatine Kinase诊断心肌梗塞的正常值确定方法 图10 肌酸激酶正常值的确定 表4-10 CK诊断心肌梗塞结果 心梗患者% 非心梗患者% IU CK 心肌梗塞 (IU) 病例 非病例 0 2 88 40 13 26 (y点) 80 30 8 (z点) 120 30 5 160 21 0 200 19 1 240 18 1 280 13 1 320 19 0 (x点) 360 15 0 400 7 0 440 8 0 480 35 0 合计 230 130 480 440 400 360 Sp: 36% 320 漏:0% 误:64% 280 Se:100% 240 200 160 120 93% 80 12% 7% 40 88% 99% 32% 1% 68%
图3 血糖测定的ROC曲线 4. ROC曲线(Receiver Operator Characteristic Curve,ROC) 100 80 60 (200 ) 40 (400 ) 20 0 20 40 60 80 100 1-specificity(%) (50 ) (25 ) (100 ) Sensitivity(%)
图4 脑 和 扫描的 曲线 100 80 60 Sensitivity(%) 40 CT 20 0 20 40 60 80 100 RN 图4 脑 和 扫描的 曲线 CT RN ROC CT scan 100 80 60 40 20 0 20 40 60 80 100 1-specificity RN scan Sensitivity(%) Figure 4 Computerized Tomography Compared to Radionuclide Scanning in Diagnosing Brain Tumors. Griner PF et al, Ann Intern Med, 1981; 94:553-600.
5. 临床治疗实际界限 临床诊断测定值到什么水平需治疗, 常根据人群调查中是否系危险因素来判定。 如调查表明: 血尿酸<7mg%时发生痛风可能性非常小; 随血尿酸的升高,痛风发生的可能性增高; 当血尿酸>9mg%时,几乎都发生痛风。 血尿酸危险性水平定在>7mg%。
三、确定正常值的注意事项 1. 研究对象的选择 (1)根据研究目的选择适当的研究对象; (2)保证研究对象的同质性; (3)研究对象的代表性。 2. 研究对象的生理因素和环境因素 3. 技术操作和仪器设备因素 4. 统计处理问题
四、临床诊断意见分歧的分析及处理 1. 临床诊断意见分歧环节 2. 判断临床诊断意见一致的符合率 表7-11 诊断意见一致符合率判定表 1. 临床诊断意见分歧环节 2. 判断临床诊断意见一致的符合率 表7-11 诊断意见一致符合率判定表 甲医生 有病 无病 乙 有病 a b r1 医 生 无病 c d r2 c1 c2 N N (a+d)-(r1 c1 + r2 c2) Kappa值= N2 -(r1 c1 + r2 c2)
表4-12 Kappa值一致性强度的判断 Kappa值 一致性强度 <0 弱 0 ~0.20 轻 0.21~0.40 尚好 0.41~0.60 中度 0.61~0.80 高度 0.81~1.00 最强
§5 诊断试验评价原则及诊断策略 一、诊断策略 如何提高诊断疾病的效率 1. 在高危人群中应用诊断试验 甲:患典型心绞痛的老年人 §5 诊断试验评价原则及诊断策略 一、诊断策略 如何提高诊断疾病的效率 1. 在高危人群中应用诊断试验 甲:患典型心绞痛的老年人 乙:胸痛待查中年人 丙:情绪变化胸痛的青年人
表4-13 不同的估计患病率、心电图运动试验的预测值 估计患病率 试验阳性 试验阴性 (%) 预测值 增加数 预测值 增加数 (%) (%) (%) (%) 90 (甲) 97 7 29 19 80 92 12 48 28 70 88 18 61 31 60 82 22 71 31 50 (乙) 75 25 79 29 40 67 27 85 25 30 57 27 90 20 20 43 23 94 14 10 (丙) 25 15 97 7
2. 采用联合试验方法(复合试验) (1)定义 同时采用多种诊断试验方法 检查或者依次采用几种诊断方法 检查为联合试验或复合试验。
(2)方法与判断结果 表4-14 联合诊断试验结果的判断 表4-14 联合诊断试验结果的判断 方式 联合试验的判断方法 判断结果 试验1 试验2 平行试验 + + + (并联) + - + - + + - - - 系列试验 + + + (串联) + - - - • • • -
(3)联合试验整理四格表 金标准 金标准 阳性 阴性 阳性 阴性 诊断 一或多 a b 诊断 均阳性 a b 项阳性 表4-15 平行试验结果的判断 表4-16 系列试验结果的判断 金标准 金标准 阳性 阴性 阳性 阴性 诊断 一或多 a b 诊断 均阳性 a b 项阳性 试验 均阴性 c d 试验 其一阴性 c d 关系见书P104 例题见P105、106
二、疾病的早期诊断 1. 筛检(screening) 2. 定期健康检查 3. 病例搜索 4. 群众自检
(1)筛检的定义 通过快速检验、检查或 其他措施将可能有病但表面 健康的人同那些可能无病的 人区别开来。
(2)筛检的目的 1)早期发现、提供患病率资料、 早期治疗; 2)研究疾病自然史; 3)发现高危人群,消除高危因素, 达到预防的目的。
(3)筛检的条件(原则) 1)严重威胁人类的疾病(收益); 2)合适的筛检试验 (准确性、精确性、可行性 ); 3)足够的超前期(Lead time) 超前期偏倚(Lead time bias); 4)有效的治疗方法。
Figure 11 Lead Time Gained by Early Diagnosis during Screening Symptoms Onset of Disease Screening Diagnosis Outcome Figure 11 Lead Time Gained by Early Diagnosis during Screening
Figure 12 Lead Time Gained by Early Diagnosis during Screening Five years Symptoms and diagnosis + Three years Five years + Lead time Eight years? Three years Five years…… Screening Outcome
(4)筛检的优点 方法简单、敏感性强、廉价、 应用较广。 (5)筛检的方法 单项筛检、多项筛检。
(6) 筛检与诊断试验的不同点 表7-17 筛检与诊断试验的不同点 表7-17 筛检与诊断试验的不同点 筛检 诊断试验 1)受检对象 自然人群 病人 2)目 的 确定患病可能性 证实诊断 3)试验要求 敏感度高 特异度高 4)结果阳性 进一步诊断 进一步治疗 5)结果权威性 差 好 6)经济效益 省钱 费钱 7)偏 倚 超前期、志愿者…
2. 定期健康检查 3. 病例搜索:早期发现的另一种形式 4. 群众自检
三、诊断试验的评价原则 1. 是否与金标准进行了盲法、同步比较? 2. 样本代表性(样本来源、病情、样本量、医院级别 1. 是否与金标准进行了盲法、同步比较? 2. 样本代表性(样本来源、病情、样本量、医院级别 等)? 3. 评价指标计算是否正确?解释是否合理? 4. 诊断试验的重复性? 5. 正常值的确定方法(最适临界点是否可靠等)? 6. 诊断试验的实用性(应用指征、操作步骤、 判定标准等;高效益、低成本、微量快速、 安全且无创伤、毒副作用小等)? 7. 联合试验的评价原则。
中国医科大学第一附属医院 临床流行病学教研室 诊断试验习题 (供七年制、研究生使用) 中国医科大学第一附属医院 临床流行病学教研室
1. 168 例乳腺肿物患者经B 超检查为 恶性者76例,而经手术后病理证实 为乳腺癌84例中,B 超确诊为70例。 (1)请列出四格表,计算相关指标。 (2)根据计算结果评价该诊断试验。
2. 以110例生化检查为渗出液的胸水 病例为研究对象,其中,B 超诊断为 恶性胸水者66例。而胸水细胞学确诊 为恶性胸水者70例中, B超诊断阳性 者64例。 (1)请列出四格表,计算相关指标。 (2)根据计算结果评价该诊断试验的准确性。
3. 为了评价肌酸激酶(CK)试验的准确性, 检测了 360例疑似心肌梗塞患者的CK含量。 经心电图检查确诊为心肌梗塞230例中 CK≥80IU(阳性)者215例,而非 心肌梗塞患者中CK<80IU(阴性) 者114例。 (1)请列出四格表。 (2)计算相关指标并评价。
4. 300名排尿障碍患者经前列腺穿刺检查,确诊的69名前列腺癌患者中,肛门指诊阳性者48人;231人非前列腺癌患者中阳性者25人。 (1)请列出四格表。 (2)评价肛门指诊确诊前列腺癌的准确性。
5. X光胸片诊断肺癌的漏诊率为 5%,误诊率为10%。某病人的验前概率为60%。 (请分别用Bayes公式和四格表法计算)
6. 某病患病率为4%,现拟筛检1000人,筛检试验的敏感度为90%,特异度为80%。 请回答下列问题: 1)筛检出的阳性者是多少人?筛检出的阳性者中,假阳性是多少人?筛检出的阳性者中有多少人是真患病者? 2)筛检出的阴性者是多少人?筛检出的阴性者中未患病者是多少人?
7. 采用前列腺肛门指诊和酸性磷酸酶联合试验诊断前列腺癌,测定结果见附表1—4—1。 问题: 1)请计算单项前列腺肛门指诊和酸性磷酸酶检查的敏感度和特异度各为多少? 2)若采用系列试验,其敏感度和特异度为多少? 3)若采用平行试验,其敏感度和特异度为多少? 4)采用了系列试验或平行试验以后,敏感度(特异度)相对于单项试验有何变化? 5)联合诊断试验在提高了敏感度(特异度)的同时,相应的特异度(敏感度)有何变化?
检验结果 前列腺癌 非前列腺癌 肛门指诊阳性 酸性磷酸酶阴性 15 11 酸性磷酸酶阳性 肛门指诊阴性 31 19 两者均阳性 53 附表1—4—1 前列腺肛门指诊和酸性磷酸酶检查结果 检验结果 前列腺癌 非前列腺癌 肛门指诊阳性 酸性磷酸酶阴性 15 11 酸性磷酸酶阳性 肛门指诊阴性 31 19 两者均阳性 53 两者均阴性 132 1625 合计 231 1670
诊断习题答案
课题一 B 超诊断乳腺肿物的研究 Se.= 83.3% Sp.= 92.9% Pr.= 50% CR.= 88.1% PV+= 92.1% PV-= 84.8% LR+= 11.7 LR-= 0.18 表1 B 超诊断乳腺肿物的研究 术后病理 乳腺癌 非乳腺癌 B + 70 6 76 超 - 14 78 92 合计 84 84 168 合计
评价 该研究采用了与金标准同步对照的方法。对照组为易混淆病例,符合临床诊断方法学研究的要求。 计算结果,准确度为88.1%,敏感度为 83.3%, 特异度92.9%,漏诊率为16.7%,误诊率为 7.1%。该 诊断试验的患病率为50%,其预测值诊断效价最高, 应用该诊断试验检查的结果为阳性时,患乳腺癌 的可能性为92.1%,结果阴性时,不患该病的可能性 为84.8%。B 超诊断结果为阳性者患乳腺癌可能性是 未患乳腺癌可能性的11.7倍,结果为阴性时患乳腺癌 可能性是未患乳腺癌可能性的1/5。B超为无痛性、无 损伤性检查方法,费用可承受,故B超作为乳腺癌的 临床诊断方法有较高的应用价值。 根据研究要求,样本量略显少些。
课题二 B超诊断恶性胸水的研究 表2 B超诊断恶性胸水的研究 符合率=92.7% 金标准(胸水) 患病率=63.6% 敏感度=91.4% 特异度=95% 阳性预测值=97.0% 阴性预测值=86.4% 阳性似然比=18.3 阴性似然比=0.09 金标准(胸水) 恶性 非恶性 B + 64 2 66 超 - 6 38 44 合 计 70 40 110 合计
评价 该诊断试验选择了良、恶性胸水患者为研究对象, 对照组为易混淆病例,符合临床科研方法要求。计算 结果,B超对良、恶性胸水诊断的敏感度为91.4%, 特异度为95%,误诊率为5%、漏诊率小于10%, 符合率较高为94.6%,其阳性预测值为97%,若B超 检查结果为阳性,有97%把握患者胸水为恶性;其 阴性预测值为86.4%,若B超检查的结果为阴性, 有86%的把握患者胸水为良性;B超正确诊断恶性 胸水能力是误诊的18倍,对恶性胸水的漏诊情况还 不足正确诊断良性胸水的1/10。 综上可见,B超显像是诊断良、恶性胸水的一种 准确性好的诊断方法,且对机体损伤小、安全,费用 亦较便宜,有较好的临床应用价值。 该诊断试验若样本量再增加些其结果更有说服力。 评价
课题三 肌酸激酶诊断心肌梗塞的研究 表3 CK诊断心肌梗塞的研究 符合率=91.4% CK 心电图 患病率=63.9% 心梗 非心梗 课题三 肌酸激酶诊断心肌梗塞的研究 表3 CK诊断心肌梗塞的研究 CK 心电图 心梗 非心梗 阳性≥80IU 215 16 231 阴性 <80IU 15 114 129 总数 230 130 360 符合率=91.4% 患病率=63.9% 敏感度=93.5% 特异度=87.7% 阳性预测值=93.1% 阴性预测值=88% 阳性似然比=7.6 阴性似然比=0.07 合计
评价 该诊断试验敏感度、特异度均在85%以上,符合率达91.4%,是较好的诊断试验。 结果表示经该试验检查为阳性时,有93%的把握确实患心肌梗塞,结果为阴性者时有88%的把握未患心肌梗塞。心肌梗塞病人中,用该试验检查漏诊者为6.5%,12.3%的非心肌梗塞者可能被误诊。临床应用时要引起注意。此诊断试验的阳性似然比为7.6,阴性似然比为0.07,说明肌酸磷酸激酶正确诊断心梗的能力是误诊的 7.6倍,漏诊的可能性是正确诊断未患心梗的1/10以下。 综上所述,是心肌梗塞较好的诊断试验。 评价
课题四 肛门指诊诊断前列腺癌的评价 表4 肛门指诊诊断前列腺癌的评价 符合率=84.7% 患病率=23% 合计 敏感度=69.6% 课题四 肛门指诊诊断前列腺癌的评价 表4 肛门指诊诊断前列腺癌的评价 符合率=84.7% 患病率=23% 敏感度=69.6% 特异度=89.2% 阳性预测值=65.8% 阴性预测值=90.7% 阳性似然比=6.4 阴性似然比=0.34 + - 肛门 穿刺 指诊 前列腺癌 非前列腺癌 48 25 73 21 206 227 合计 69 231 300 合计
课题五 X光胸片诊断肺癌的评价 漏诊率为 5%(Se=95%),误诊率为10%(Sp=90%) 某病人的验前概率为 60% 如果该患X光胸片结果阳性患肺癌的可能性多大? 93.4% 如果该患X光胸片结果阴性患肺癌的可能性多大?不足10%。 Bayes公式计算 : Se×PR PV+ = =93.4% (Se×PR)+(1-Sp)(1-PR) Sp(1-PR) PV- = = 92.3% Sp(1-PR)+ PR(1-Se)
表5 X光胸片诊断肺癌的评价 合计 阴性预测值=c/(c+d)×100%= 92.3% 21 206 227 合计 69 231 300 四格表法 c/(a+c)×100%=5% b/(b+d)×100%=10% (a+c)/(a+b+c+d)×100%=60% 阳性预测值=a/(a+b)×100%=93.44% 阴性预测值=c/(c+d)×100%= 92.3% + - 合计 黄金标准 X光 肺癌 非肺癌 48 25 73 21 206 227 合计 69 231 300
课题六 筛检 某病患病率为4%,现拟筛检1000人, 筛检试验的敏感度为90%,特异度为80%。 1.筛检出的阳性者是多少人? 228人 筛检出的阳性者中,假阳性有多少人? 192人 筛检出的阳性者中,有多少真患病者? 36人 2.筛检出的阴性者是多少人? 772人 筛检出的未患病者多少人? 768人
课题七 联合试验 前列腺肛门指诊:敏感度=29.44% 特异度=98.44% 酸性磷酸酶检查:敏感度=36.36% 特异度=97.96% 课题七 联合试验 前列腺肛门指诊:敏感度=29.44% 特异度=98.44% 酸性磷酸酶检查:敏感度=36.36% 特异度=97.96% 系列试验:敏感度=22.94% 特异度=99.10% 平行试验:敏感度=42.86% 特异度=97.31% 与单项诊断试验比较,系列试验大大提高了特异度;平行试验提高了敏感度 联合诊断试验在提高了敏感度(特异度)的同时,相应的特异度(敏感度)会下降 前列腺肛门指诊和酸性磷酸酶检查结果 检验结果 前列腺癌 非前列腺癌 肛门指诊阳性 酸性磷酸酶阴性 15 11 酸性磷酸酶阳性 肛门指诊阴性 31 19 两者均阳性 53 两者均阴性 132 1625 合计 231 1670