Presentation is loading. Please wait.

Presentation is loading. Please wait.

主要内容 诊断性研究的基本知识 诊断性研究的主要评价指标 怎样解决临床问题.

Similar presentations


Presentation on theme: "主要内容 诊断性研究的基本知识 诊断性研究的主要评价指标 怎样解决临床问题."— Presentation transcript:

0 第 10 讲 诊断试验及其评价 寇长贵 流行病与卫生统计学教研室

1 主要内容 诊断性研究的基本知识 诊断性研究的主要评价指标 怎样解决临床问题

2 诊断的概念 “诊断”(diagnosis)的词义是将一个事物与另一个事物区分开来。疾病的诊断是将有病者和无病者区分开的标准。
诊断性试验可用于: 诊断疾病 筛查无症状的病人 疾病的随访 判断病情的严重性 估计疾病的临床过程及预后 估计对治疗的反应 测定目前对治疗的反应

3 例如 (该让病人交四次钱呢, 还是交一次费?) 脑肿瘤的诊断哪样是最好的诊断方法? 颅骨照片or脑血管造影or颅部CTor颅部MIR……
不孕症的检查那一种是最佳诊断方法? 输卵管碘油造影 输卵管通液术 输卵管通气术 宫腔镜配合腹腔镜镜下通液 (该让病人交四次钱呢, 还是交一次费?)

4 评价诊断性试验的临床意义 提供临床上最好的诊断方法. 提高临床效益: 增加经济效益: 开展“循证实验医学”的必要条件:
早期正确诊断、早期治疗 增加经济效益: 减少住院时间、节约卫生资源 开展“循证实验医学”的必要条件: 生化检验、细菌免疫、影像学、核医学

5 诊断性试验研究的基本过程 1. 确定研究目的 2. 研究对象的选择 3. 金标准的确立(参考试验偏倚) 4. 样本量的计算
病例和对照应是同期进入研究的连续病例或按比例抽样的随机样本 临床病例应包含各种临床亚型、易混淆、需要鉴别的疾病 3. 金标准的确立(参考试验偏倚) 4. 样本量的计算 5. 同步盲法检测研究对象 试验方法标准化 判断结果的标准要具体(错误:剔除结果不明确者) 重复性好 6. 采用ROC曲线确立临界点 7. 计算灵敏度、特异度、约登指数、预测值、似然比等评价指标(四格表) 8. 得出结论

6 受试者操作特性工作曲线

7 受试者操作特性工作曲线

8 诊断试验检查结果 诊断试验 病人 非病人 合计 阳性 A B A+B 阴性 C D C+D A+C B+D N

9 预测值 预测值(predictive value):即指在已知试验结果的条件下,表明有或无该病的概率。预测值又为分阳性预测值和阴性预测值两种。

10 预测值 诊断试验 病人 非病人 合计 阳性 A B A+B 阴性 C D C+D A+C B+D N 阳性预测值(positive predictive value):又称预测阳性结果正确率,即在诊断试验阳性结果的人中,有该病的概率,也是真阳性占阳性结果总数和百分率。 阴性预测值(negtive predictive value) :又称预测阴性结果正确率,即在诊断试验阴性结果的人中,无该病的概率,也是真阴性占阴性结果总数和百分率。

11 预测值与患病率的关系 患病率(%) +PV (%) -PV (%) 99 95 90 80 70 60 50 40 30 20 10 5 1
0.1 99.9 99.7 99.4 99.0 98.0 97.0 95.0 93.0 89.0 83.0 68.0 50.0 16.0 2.0

12 似然比 诊断试验 病人 非病人 合计 阳性 A B A+B 阴性 C D C+D A+C B+D N 似然比(Likelihood,LR):是同时反映灵敏度和特异度的复合指标,即有病者中得出某一诊断结果的概率与无病者得出这一概率的比值。   阳性似然比=灵敏度/假阳性率   阴性似然比=假阴性率/特异度 意义:全面反映诊断试验的诊断价值,非常稳定。

13 举例:监护病房CK诊断心梗(CK<80=CK-)
似然比 举例:监护病房CK诊断心梗(CK<80=CK-) 心梗 无心梗 CK+ 215(93.48%) 16(12.31%) 231 +LR=7.6 CK- 15(6.52%) 114(87.69%) 129 -LR=0.07 Total +LR=93.48/12.31=7.6 -LR=6.52/87.69=0.07

14 似然比的特点和应用 比灵敏度和特异度更稳定,不受患病率的影响; 用于估计疾病概率。 更科学地描述诊断试验 验前概率=病人/(病人+非病人)
验前比=验前概率/(1-验前概率) 验前概率=验前比/(1+验前比) 验后比=验前比×似然比 验后概率=验后比/(1+验后比)

15 似然比应用举例 某患者女性45岁,胸痛就诊,患冠心病概率为多少? 文献资料,患病率1% 若患者有典型心绞痛,其似然比=100
验前比=0.01/(1-0.01)=0.01 验后比=0.01×100=1 验后概率=1/(1+1)=0.5=50% 若患者心电图检查ST段压低2.2mm,其似然比=11 验后比=验前比×似然比=1×11=11 验后概率=11/(1+11)=91%

16 似然比应用举例 一小孩发热39.30C以上,并有上呼吸道感染症状,诊为病毒感染, 但WBC计数为22000。问患者患隐匿性菌血症的概率?
   灵敏度 特异度 似然比(+) 似然比(-) >= % 7% >= % 43% >= % 77% >= % 92% >= % 97%

17 似然比应用举例 病人比率 非病人比率 似然比(+) <5000 0 7 0/7=0 5000-10000 8 36 8/36=0.22
病人比率 非病人比率 似然比(+) < /7=0 /36=0.22 /34=0.79 /15=1.8 /5=3 >= /3=7.7 验前概率=50%, 验前比=0.5/(1-0.5)=1 验后比=验前比×似然比=1×3=3 验后概率=3/(1+3)=75%

18 似然比应用

19 处理综合试验结果 验后比 =验前比×试验1似然比×试验2似然比

20 综合试验结果处理举例 35岁无症状女性体检发现运动试验阳性(ST压低>=1mm),应激试验同样阳性,该女性患冠心病概率为多少?
文献资料:30-39女性冠心病概率0.3%,ST段压低,LR1=5.9,应激试验阳性LR2=5.7 验前概率=0.3%, 验前比1=3/997 验后比1=验前比1×LR1=(3/997)×5.9=验前比2 验后比2=验前比2×LR2=验前比1×LR1×LR2 =(3/997)×5.9×55.7=0.1 验后概率=0.1/(1+0.1)=9%

21 诊断性试验证据的分级 A级: B级: C级. 具有适当病谱的盲法对照试验,但未采用参考标准诊断.
A1. 同质性为一级(level 1)的诊断性试验系统评价. A2. 选用的病例具有适当的病谱,并使用连续病例的盲法试验,每例均有诊断性试验及参考标准的结果. B级: B1. 同质性二级或二级以上的诊断性试验系统评价. B2. 病谱选择不当或者未用连续病例作盲法对照试验.(但每例均有参考标准和诊断试验对比的两种结果). C级. 具有适当病谱的盲法对照试验,但未采用参考标准诊断. D级. 没有独立应用参考标准诊断,或未采用盲法对照. E级. 专家意见缺乏严格评价的证据.

22 如何解决临床问题

23 案例 案例1:78岁女性患者,腹部术后第10天出现急性呼吸困难和胸部疼痛不适;体检发现两肺底湿啰音,胸片示右肋膈角有少量积液,动脉血氧分压(PaO2)为70 mmHg,SaO292%;心电图正常,通气/血流比值(V/Q)灌注扫描结果为“中度肺栓塞(PE)可能”。 案例2:25岁男性,经过10h汽车驾驶后,出现急性发作性呼吸短促和胸痛,并伴有焦虑;体检、心电图、胸片和血糖均正常,PaCO2 32 mmHg,PaO2 82 mmHg,V/Q扫描结果也是“中度PE可能”。

24 问题 根据V/Q结果能否肯定PE? 这2例患者的V/Q结果究竟该如何解释? 其对PE的诊断会起多大作用? 下一步该如何处理?

25 循证诊断的基本步骤

26 第1步:提出临床问题 PICO:标准化临床问题的4个要素; 如:对于患有小细胞低色素性贫血的老年女性患者,低铁蛋白能否诊断为缺铁性贫血?

27 第1步:提出临床问题 PICO:标准化临床问题的4个要素; P:人群(诊断过程中); I:诊断试验方法 V/Q
O:疾病 PE

28 第2步:检索证据 选择数据库: 制定检索策略: 检索结果: 注意检索结果的管理 筛选问题相关的文献: 4s模型
PICO和问题的类型:PE;肺血管造影;V/Q 检索结果: 注意检索结果的管理 筛选问题相关的文献:

29 第3步:评价证据 内在真实性:科学性和内容的真实性 结果的重要性: (1)试验是否与金标准试验进行“盲法”比较
(2)研究样本是否包括各型病例(轻、中、重;治疗、未治疗),以及个别易于混淆的病例 (3)是否每个被检者都经过金标准试验检查 (4)诊断性试验步骤是否详尽,实验的安排是否作了叙述,能否进行重复试验 结果的重要性: (1)估计疾病的验前概率 (2)应用似然比

30 第3步:评价证据 临床适用性?(该诊断性试验能否用于你的病人) 1. 该试验能否在你的医院开展?准确性如何?负担得起吗?
2. 你能否比较准确的估计验前概率? (根据临床实践、个人经验、文献资料等进行估计) 3. 验后概率能否改变患者的处理措施并对患者有所帮助? (能否跨过试验-治疗阈值?病人是否愿意合作?) 4. 试验结果对病人有帮助吗?

31 诊断性试验必须与金标准比较,才能确定是否可靠,金标准的选择要根据具体临床情况。
是否是与金标准进行盲法比较 诊断性试验必须与金标准比较,才能确定是否可靠,金标准的选择要根据具体临床情况。 不采用盲法,可能会影响试验结果的客观性。 例如,已经发现患者CT片上有肺部病变,往往能从X光片上看出以前读片时没有看到的阴影。 除强调盲法外,每个受检者都应经过金标准试验检查。

32 是否是与金标准进行盲法比较 PIOPED研究 以肺血管造影作为金标准(目前,公认肺血管造影是确诊PE的最好方法,作为金标准是合理的)
需了解诊断试验和金标准是否分别在独立、盲法下进行,即检查者彼此并不知道另一种试验结果。 PIOPED并未明确陈述是否采用盲法 但从他们努力保证试验的重复性和独立进行读片等方法,实际上是采用了盲法(后经与作者联系予以确认) 该研究中,731例疑诊PE的患者经知情同意后分别进行V/Q扫描和肺血管造影。 血管造影被分为3种结果:PE确诊、不能确诊和否定。 V/Q扫描分为4种结果:高度可能、中度可能、低度可能、正常或接近正常。

33

34 研究样本是否包括各型病例,以及个别易于混淆的病例
选择的研究对象应与临床实践的情况相似,诊断试验结果才具有意义。选择病例组时应包括各型病例:典型和不典型的病例,早、中、晚期的病例等。 例如:癌胚抗原(CEA)可以准确区别晚期结肠癌或直肠癌患者与正常人,但是如果选择较早期的结肠癌或直肠癌患者、其他癌症患者或有胃肠疾病者为研究对象,CEA的鉴别诊断能力就明显降低。因此,CEA已不再用于直肠、结肠癌的诊断和筛查。 诊断性试验不能只在有病组进行。 如对腰背痛患者进行MRI检查,发现许多患者有椎间盘突出,但后来对没有腰背痛的人进行MRI检查,也有2/3的人有椎间盘突出。

35 研究样本是否包括各型病例,以及个别易于混淆的病例
选择的研究对象应与临床实践的情况相似,诊断试验结果才具有意义。选择病例组时应包括各型病例:典型和不典型的病例,早、中、晚期的病例等。 例如:癌胚抗原(CEA)可以准确区别晚期结肠癌或直肠癌患者与正常人,但是如果选择较早期的结肠癌或直肠癌患者、其他癌症患者或有胃肠疾病者为研究对象,CEA的鉴别诊断能力就明显降低。CEA已不再用于直肠、结肠癌的诊断和筛查。 诊断性试验不能只在有病组进行。 如对腰背痛患者进行MRI检查,发现许多患者有椎间盘突出,但后来对没有腰背痛的人进行MRI检查,也有2/3的人有椎间盘突出。 PIOPED: 纳入了所有怀疑PE的患者,包括高、中、低可疑患者。 患者的代表性好,能代表临床实际情况。

36 是否每个被检者都经过金标准试验检查 如果用诊断性试验结果来决定患者是否去作金标准试验,则科学性就会受到很大影响;
确认性偏倚(verification bias or work-up bias):一些研究者常常将诊断试验结果阳性者都作金标准试验,而阴性者只抽一部分去作金标准试验,根据结果列出列联表,计算敏感度和特异度,结果就会夸大试验的敏感度。 例如,当怀疑患者为肺癌时,医师很可能安排那些胸片或CT更象恶性肿瘤的患者去作介入检查,而很少安排良性病变可能性大的患者。

37 是否每个被检者都经过金标准试验检查 PIOPED研究中:
那些V/Q正常或接近正常或低度可能的患者比那些扫描明显阳性的患者更不可能进行肺血管造影(分别为69%和92)(因为临床医师不愿让那些V/Q正常的患者去冒血管造影的风险) 文中列出了仅限于同时进行了肺血管造影的患者,由于对其余150例没有进行金标准检查(血管造影),我们无法判断这些患者到底是否患病; 研究者对这150例(轻度或正常扫描136例;血管造影结果不肯定者l4例)采用了第二种金标准,即对每例患者随访观察1年,不用肝素治疗,如果其情况良好,则判断为无PE。在1年随访中,无一例患者发生肺梗死(符合临床意义的肺梗死定义)。因此可以认为这些患者确实不存在肺梗死。

38 诊断试验的步骤是否详尽,能否重复 研究的操作步骤、仪器设备、试剂、试验条件等;
重复性(Reproducibility)又称精密性(Precision)或可靠性(Reliability); 如多次测定同一标本结果接近,说明测定数值稳定,表明仪器性能好,操作技术熟练,方法可靠。可通过实验室质控、人员培训来保证重复性。 PIOPED:作者不仅提供了有关V/Q扫描结果的详细诊断标准,而且报告了2个独立诊断专家的一致性,“中度PE可能”和“低度PE可能”的不一致性率较高,分别为 25%和30%,他们最后求助于专家委员会进行协调。因此,可以相信该试验研究结果的真实性。

39 第3步:评价证据 内在真实性:科学性和内容的真实性 结果的重要性: (1)试验是否与金标准试验进行“盲法”比较
(2)研究样本是否包括各型病例(轻、中、重;治疗、未治疗),以及个别易于混淆的病例 (3)是否每个被检者都经过金标准试验检查 (4)诊断性试验步骤是否详尽,实验的安排是否作了叙述,能否进行重复试验 结果的重要性: (1)估计疾病的验前概率 (2)应用似然比

40 是否估计了疾病的验前概率 验前概率(pretest probability)是指患者在做该项试验前或检查前患这种病的概率。
同种疾病不同患者的验前概率是不相同的,其对诊断可产生着主要影响,每一项病史和体征都是一项诊断性试验,或增加或降低靶疾病的概率。 年轻患者所表现的呼吸短促、胸痛导致不能活动 lOh,增加了PE的验前概率,但是年龄、缺乏基础疾病、伴有焦虑情绪、体检正常、胸片和血气分析无异常等又降低了PE的验前概率,最后对该患者的PE诊断概率估计仅为20%;而对老年妇女的验前概率估计为80%。

41 是否估计了疾病的验前概率 验前概率的估计: 虽然验前概率大多是凭临床医师的个人经验估计,有时也可参考临床流行病学资料和他人的报告;
咨询同事,看他们对同一患者验前概率的估计是否与自己一致,这比个人的直觉更准确; 当仍然难以确定时,可估计一个高的验前概率和一个低的验前概率,看是否改变临床的处理决策。

42 是否应用似然比 似然比(1ikelihood ratio,LR)表达了对某病患者进行某项诊断试验所得到的数值范围。
案例中,无论V/Q扫描结果如何,其并不能确诊肺梗死,而只能修改验前概率,从而产生新的验前概率。 从验前概率到验后概率所产生的诊断变化,是由诊断性试验结果LR所决定的。当试验结果只有阴性或阳性时,LR分为阳性试验结果和阴性试验结果。 过去的诊断性试验研究,仅报告敏感度和特异度,现在越来越多的诊断试验文献报告LR。

43 是否应用似然比 PIOPED研究中,V/Q扫描将患者分为4个等级,从“高度可能”到“正常”。
当资料为连续测定的变量,如用敏感度和特异度,或仅计算一个阳性LR和阴性LR,将丢失很多信息。可以将连续变量的LR划分为不同区间,计算多个LR,就可得到更多的信息,可选择使用。

44

45 第3步:评价证据 临床适用性?(该诊断性试验能否用于你的病人) 1. 该试验能否在你的医院开展?准确性如何?负担得起吗?
2. 你能否比较准确的估计验前概率? (根据临床实践、个人经验、文献资料等进行估计) 3. 验后概率能否改变患者的处理措施并对患者有所帮助? (能否跨过试验-治疗阈值?病人是否愿意合作?) 4. 试验结果对病人有帮助吗?

46 第4步:应用证据 ----诊断试验的研究结果用于自己的患者 临床适用性?(该诊断性试验能否用于你的病人)
1. 该试验能否在你的医院开展?准确性如何?负担得起吗? 2. 你能否比较准确的估计验前概率? (根据临床实践、个人经验、文献资料等进行估计) 3. 验后概率能否改变患者的处理措施并对患者有所帮助? (能否跨过试验-治疗阈值?病人是否愿意合作?) 4. 试验结果对病人有帮助吗? ----诊断试验的研究结果用于自己的患者

47 第4步:应用证据 是否适用于你的病人? 要考虑所报道患者的文化背景、人口学特征和地理环境是否与自己所在单位患者的情况相同。随着疾病的严重程度、合并症的不同等,诊断性试验的结果会发生改变; 如果临床情况与文献的研究场所相似,患者又满足研究所采用的纳入标准和排除标准,那么,应该对诊断结果的使用充满信心。 PIOPED所纳入的患者是北美许多大型综合性医院怀疑PE的代表性样本,因此结果很适用于大多数临床,推广到危重患者(试验中已排除)和有各种禁忌情况的患者是不适合的。

48 第4步:应用证据 验后概率的结果是否改变了对患者的处理?
确定了验前概率,了解某项诊断试验性的LR,再根据患者的检查结果,就可计算验后概率,然后决定患者是否需要再作其他诊断试验,或随访,或放弃,或立即治疗; 在临床决策中,对任何一个疾病,如果该疾病的诊断概率低到一定程度,临床医师会放弃诊断,不再进行检查,该数值就称之为“检查阈值(test threshold)”; 同样,当疾病的诊断概率达到或高于一数值,临床医师会认为诊断成立,停止再检查而开始治疗,这就称之为“治疗阈值(treatment threshold)”; 而当诊断概率处于“检查阈值”和“治疗阈值”之间时,就意味着诊断尚未确定,还需进一步检查。

49 第4步:应用证据 治疗理论 验后概率的结果是否改变了对患者的处理?
“检查阈值”和“治疗阈值”是由医生根据治疗方法的危险性和费用而主观确定的。. 如果治疗方案损伤性大、危险或极其昂贵,就需要对疾病的把握度非常高时才用,就可以定高治疗阈值; 如疾病危害性大且病情经过险恶,不治疗或漏诊时患者的危险性则很高,如肺梗死,就可将治疗阈值定低一些。 治疗理论

50 临床问题 病例: 一位30岁HIV阳性的男子有干咳、发烧以及缺氧症状。X线胸片显示有浸润发生,其CD4计数为200,怀疑是肺孢子虫型肺炎。 一位医师认为该病人患有此病的可能性是90%,并计划凭经验进行治疗(不进行支气管镜检查)。 另一位医师则认为患此病的可能性仅为50%,她认为应进行支气管镜检查。 提问: 你如何解决这个分歧? 你是否会建议进行支气管镜检查或进行经验性治疗方案? 何种情况进行支气管镜检查是合适的?

51 临床资料 -HIV合并肺孢子虫型肺炎 即使治疗方案从一开始就是正确的话,死亡率仍有10%。如果延误治疗,其死亡率为40%。
有30%接受了治疗的病人出现副作用,而其中3%的副作用会导致死亡(即由药物引致的死亡率为1%) 该病支气管镜检查的灵敏度为95%,特异度则亦为95%

52 治疗理论 不要问: 这个试验有多好? 问: 这个治疗有多好? 治疗原则: 如果好处多于坏处,进行治疗 试验原则:
不要问: 这个试验有多好? 问: 这个治疗有多好? 治疗原则: 如果好处多于坏处,进行治疗 试验原则: 如果有改变处理的潜在可能的话,则进行试验 情况: 不确诊病例而只有一种试验可用。 不确诊病例,而有2种或2种以上的试验可用。

53 试验-治疗域值示意图 Observe Test Treat 0% 10% ATODDS 70% 100%
Obs/Test Test/Treat 试验-治疗域值示意图

54 人的一生不论成功与失败  只要奋斗就是辉煌!


Download ppt "主要内容 诊断性研究的基本知识 诊断性研究的主要评价指标 怎样解决临床问题."

Similar presentations


Ads by Google