SCI 论文网 www.18sci.com SCI论文写作 ——诊断试验类
诊断试验简介 什么是诊断试验? 为什么要评价诊断试验? 什么是理想的诊断方法? 如何评价诊断方法? 诊断试验设计 评价指标 SCI 论文网 www.18sci.com 什么是诊断试验? 为什么要评价诊断试验? 什么是理想的诊断方法? 如何评价诊断方法? 精密度高 患者可 接受度高 准确性高 安全 无不适感 迅速 价格低 便捷 评价指标 诊断试验设计 某种状况:疾病诊断、判断疾病严重程度、疾病随访、疗效考核以及药物毒副作用的监测。 理想的诊断方法:准确、精密度高、安全、无不适感、迅速、便捷、价格低廉、患者的可接受程度 如何评价诊断试验 涉及两方面的内容,如何设计诊断试验,用什么指标评价诊断试验的准确度
什么是? SCI 论文网 www.18sci.com 诊断试验 (diagnostic test)/诊断准确性 (Diagnostic accuracy) 研究:评价某种诊断试验方法对疾病的诊断价值的临床试验。 是否能正确地将一组研究对象区分为具有或不具有某种状况。 病史、实验室检查、分子标记物、影像学检查、其他医疗器械检查、组织学检查等。 某种状况:疾病诊断、判断疾病严重程度、疾病随访、疗效考核以及药物毒副作用的监测。 理想的诊断方法:准确、精密度高、安全、无不适感、迅速、便捷、价格低廉、患者的可接受程度
为什么要评价? 出现新的诊断方法,或现有方法的改进。 现有诊断方法存在缺陷,侵入性、时间长、昂贵。 SCI 论文网 www.18sci.com 为什么要评价? 出现新的诊断方法,或现有方法的改进。 现有诊断方法存在缺陷,侵入性、时间长、昂贵。 写前言的基础
诊断试验设计要素 1. 金标准(gold standard/reference standard): SCI 论文网 www.18sci.com 1. 金标准(gold standard/reference standard): 目前可行的、最好的判断疾病状态的方法;权威机构颁布的综合诊断标准; 实验室(如生物标记物)、影像学、病理学检查、术中发现、尸体解剖、或者长期随访结果; 单一检查/组合检查。 eg: 急性肾损伤公认的诊断标准是Kidney Disease Improving Global Outcomes (KDIGO)标准; 冠心病的标准诊断方法是冠状动脉造影; 诊断肾炎的标准方法是肾组织活检和尸体解剖; 肿瘤确诊需依据病理学诊断。 金标准应该比评价的诊断试验更可靠 比如肿瘤的诊断,金标准是病理检查,但是病理检查有自己的缺陷:侵入性的检查,与病理医师的经验有关,但是肿瘤标志物就不一样了,微创、客观是他最大的优势,所以可以视为诊断标志物。
将同一组可能具有某种疾病的研究对象,接受一项或多项检查的结果,与金标准的检验结果做比较,从而对被评价检验方法的真实性、可靠性做评估。 SCI 论文网 www.18sci.com 诊断试验 (diagnostic test)/诊断准确性 (Diagnostic accuracy) 研究:评价某种诊断试验方法对疾病的诊断价值的临床试验。 将同一组可能具有某种疾病的研究对象,接受一项或多项检查的结果,与金标准的检验结果做比较,从而对被评价检验方法的真实性、可靠性做评估。
诊断试验设计要素 2. 研究对象/受试对象 3. 盲法设计 病例组:是经金标准确诊的患有研究疾病的病例。代表性越高,临床应用价值越大。 SCI 论文网 www.18sci.com 2. 研究对象/受试对象 病例组:是经金标准确诊的患有研究疾病的病例。代表性越高,临床应用价值越大。 对照组或非病例组:是经金标准证实未患所研究疾病的其他病例或健康者。不推荐健康者。 3. 盲法设计 ’single-gate’ ’two-gate’
诊断试验设计要素 4. 诊断结果判定 观察指标要客观 判断结果的标准要明确具体: SCI 论文网 www.18sci.com 4. 诊断结果判定 观察指标要客观 判断结果的标准要明确具体: 若被评价的诊断指标是定性的,要明确给出判断诊断结果为阳性的标准以及判断为阴性的标准; 若被评价的诊断指标是连续性变量,则须确定正常值。
小结 SCI 论文网 www.18sci.com 诊断试验 设计要点 金标准 研究对象 1.是否给出明确的金标准? 2.是否公认? 3.是否给出其测定方法? 1.是否有代表性? 2.是否给定纳入方式? 诊断试验 设计要点 诊断结果判定 盲法设计 1.是否给出明确的观察指标 及其测定方法? 2.是否给出根据观察指标, 判定结果为阳性/阴性的标准? 3.该标准是否合理? 单盲?双盲? 除样本量之外的设计要点
诊断试验的评价指标 准确度 似然比 灵敏度和特异度 预测值 评价指标 误诊率和漏诊率 优势比 约登指数 ROC曲线 SCI 论文网 www.18sci.com 准确度 似然比 灵敏度和特异度 预测值 评价指标 误诊率和漏诊率 优势比 评价指标:评价诊断方法准确性的指标 约登指数 ROC曲线
诊断试验的评价指标 SCI 论文网 www.18sci.com 示例
诊断试验的评价指标 表: 诊断资料四格表 SCI 论文网 www.18sci.com 金标准 合计 病例 对照 被评价的 诊断方法 阳性 真阳性 True Positive (TP) 假阳性 False Positive (FP) 诊断为阳性 Predicted Positive (TP+FP) 阴性 假阴性 False Negative (FN) 真阴性 True Negative (TN) 诊断为阴性 Predicted Negative (FN+TN) 实际阳性/患病 Actual Positive (TP+FN) 实际阴性/未患病 Actual Negative (FP+TN) 研究对象总数 (N= TP+FP+FN+TN) 评价指标:评价诊断方法准确性的指标
诊断试验的评价指标 准确度 (accuracy):与金标准相比,诊断试验获得正确结果的比例,即获得真阳性和真阴性的比例。 SCI 论文网 www.18sci.com 准确度 (accuracy):与金标准相比,诊断试验获得正确结果的比例,即获得真阳性和真阴性的比例。 (真阳性人数+真阴性人数) 研究对象总数 = (TP+TN) N 与患病率有关 没有揭示假阴性(漏诊)和假阳性(误诊)的频率 受诊断阈值限制 患病人数 研究对象总数 = (TP+FN) N eg,一种罕见疾病,患病率只有5%。随便将所有100例样本均诊断为阴性,大家计算一下准确度: (0+95)/100=95% 只有准确度的时候,假阴性和假阳性总体的频率是固定的,但各自的频率是不一样的。 对于连续性的诊断方法(如基因/蛋白的表达水平),待检验的诊断方法的结局(阳性还是阴性)依赖于诊断阈值 采用运动心电图诊断冠心病的准确度为55.4% 采用运动心电图诊断冠心病的准确度为55.4%
诊断试验的评价指标 SCI 论文网 www.18sci.com 灵敏度 (sensitivity, Sen):金标准诊断确诊的患者,被诊断为阳性的概率,即真阳性率(True positive rate) 真阳性人数 (真阳性人数+假阴性人数) = TP ( TP+ FN) 只和病例组有关,反映了待评价指标检出病例的能力。 标准误: 95% CI: 𝑆𝐸𝑆𝑒𝑛= 𝑆en×(1−Sen) 𝑇𝑃+𝐹𝑁 Sen±1.96𝑆𝐸𝑆𝑒𝑛 灵敏度:患者被诊断为阳性的概率 很多审稿人现在都强调95%置信区间 漏诊是指将患病错误地判定为不患病,即假阴性。 采用运动心电图诊断冠心病 的灵敏度为52.9%; 漏诊率为47.1% 漏诊率=1-灵敏度
诊断试验的评价指标 SCI 论文网 www.18sci.com 特异度 (specificity, Spe):金标准诊断确诊的非患者,被诊断为阴性的概率,即真阴性率(True negative rate) 真阴性人数 (真阴性人数+假阳性人数) = TN ( TN+FP) 只和非病例组有关,反映了待评价指标排除病例的能力。 标准误: 95% CI: 𝑆𝐸𝑆𝑝𝑒= 𝑆𝑝e×(1−Spe) TN+FP Spe±1.96𝑆𝐸𝑆𝑝𝑒 灵敏度度:非患者被诊断为阴性的概率 很多审稿人现在都强调95%置信区间 误诊是指将不患病错误地判定为患病,即假阳性 采用运动心电图诊断冠心病 的特异度为92.3%; 误诊率为7.7% 误诊率:1-特异度
诊断试验的评价指标 灵敏度和特异度: 不受患病率影响,越接近1,越好 无法比较两种待检验方法的优劣 SCI 论文网 www.18sci.com 灵敏度和特异度: 不受患病率影响,越接近1,越好 无法比较两种待检验方法的优劣 无法比较两种待检验方法的优劣,可能一种方法的灵敏度高、特异度低;而另一种特异度高而灵敏度低
诊断试验的评价指标 SCI 论文网 www.18sci.com 约登指数 (Youden’s index, J):正确诊断指数,表示诊断方法的真实度。其值越接近1,诊断试验的真实性越好。 1−(假阳性率+假阴性率)=(灵敏度+特异度)−1 标准误: 95% CI: 𝑆𝐸𝐽= 𝑇𝑃×𝐹𝑁 (𝑇𝑃+𝐹𝑁) 3 + 𝐹𝑃×𝑇𝑁 (𝐹𝑃+𝑇𝑁) 3 = 𝑆𝑒𝑛(1−𝑆𝑒𝑛) (𝑇𝑃+𝐹𝑁) + 𝑆𝑝𝑒(1−𝑆𝑝𝑒) (𝐹𝑃+𝑇𝑁) J±1.96𝑆𝐸𝐽 采用运动心电图诊断冠心病 的约登指数为0.45
诊断试验的评价指标 似然比 (likelihood ratios, LR) SCI 论文网 www.18sci.com 似然比 (likelihood ratios, LR) 阳性似然比(LR+):反映被评价的诊断方法正确判断阳性的可能性是错误判断阳性可能性的倍数,即真阳性率与假阳性率之比。 LR+越大,说明诊断结果为阳性时,病人真的患病的概率越大,诊断价值越大。 LR+= Sen (1−Spe) 采用运动心电图诊断冠心病 的阳性似然比为6.87 标准误: 95% CI: 𝑆𝐸𝐿R+=exp( 1−𝑆𝑒𝑛 𝑇𝑃 + 𝑆𝑝𝑒 𝐹𝑃 ) LR+ 𝑒 ±1.96 1−𝑆𝑒𝑛 𝑇𝑃 + 𝑆𝑝𝑒 𝐹𝑃
诊断试验的评价指标 似然比 (likelihood ratios, LR) SCI 论文网 www.18sci.com 似然比 (likelihood ratios, LR) 阴性似然比(LR-) 反映被评价的诊断方法错误判断阴性的可能性是正确判断阴性的可能性的倍数,即假阴性率与真阴性率之比。 LR-越小,说明能够否定患有该病的可能性越大,诊断价值越大。 LR−= (1−Sen) Spe 采用运动心电图诊断冠心病 的阴性似然比为0.51 标准误: 95% CI: 𝑆𝐸𝐿R−=exp( 𝑆𝑒𝑛 𝐹𝑁 + 1−𝑆𝑝𝑒 𝑇𝑁 ) LR− 𝑒 ±1.96 𝑆𝑒𝑛 𝐹𝑁 + 1−𝑆𝑝𝑒 𝑇𝑁
诊断试验的评价指标 预测值 (predictive value, PV) 阳性预测值(PV+):真阳性数与试验诊断阳性数之比 SCI 论文网 www.18sci.com 预测值 (predictive value, PV) 阳性预测值(PV+):真阳性数与试验诊断阳性数之比 反映诊断结果为阳性的,受试者真的为阳性的概率。越接近1,诊断价值越高。 受患病率影响,患病率增加,PV+增加 PV+= 真阳性人数 患者总数 = TP (𝑇𝑃+𝐹𝑃) 标准误: 95% CI: 𝑆𝐸𝑃𝑉+= 𝑃𝑉+×(1−𝑃𝑉+) 𝑇𝑃+𝐹𝑃 PV+±1.96𝑆𝐸𝑃𝑉+ 采用运动心电图诊断冠心病 的阳性预测值为88.7%
诊断试验的评价指标 预测值 (predictive value, PV) 阴性预测值(PV-):真阴性数与试验诊断阴性数之比 SCI 论文网 www.18sci.com 预测值 (predictive value, PV) 阴性预测值(PV-):真阴性数与试验诊断阴性数之比 反映诊断结果为阴性的,受试者真的为阴性的概率。越接近1,诊断价值越高。 受患病率影响,患病率增加, PV− 下降。 PV−= 真阴性人数 对照总数 = TN (𝐹𝑁+𝑇𝑁) 标准误: 95% CI: 𝑆𝐸𝑃𝑉−= 𝑃𝑉−×(1−𝑃𝑉−) 𝑇𝑁+𝐹𝑁 PV−±1.96𝑆𝐸𝑃𝑉− 采用运动心电图诊断冠心病 的阴性预测值为63.2%
SCI 论文网 www.18sci.com
诊断试验的评价指标 优势比 (odds ratio, OR):试验组中诊断阳性数与阴性数比值与对照组中诊断阳性数与阴性数比值的比值。 SCI 论文网 www.18sci.com 诊断试验的评价指标 优势比 (odds ratio, OR):试验组中诊断阳性数与阴性数比值与对照组中诊断阳性数与阴性数比值的比值。 OR>1,表示试验组比对照组更容易获得诊断阳性结果;反之亦然 OR= Sen (1−Sen) (1−Spe) Spe = 𝑇𝑃 𝐹𝑁 𝐹𝑃 𝑇𝑁 标准误: 95% CI: 𝑆𝐸𝑂𝑅=exp( 1 𝑇𝑃 + 1 𝐹𝑃 + 1 𝑇𝑁 + 1 𝐹𝑁 ) OR× 𝑒 ±1.96 1 𝑇𝑃 + 1 𝐹𝑃 + 1 𝑇𝑁 + 1 𝐹𝑁 采用运动心电图诊断冠心病 的优势比为13.46
诊断试验的评价指标 ROC曲线:以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。 利用AUC评价诊断价值; SCI 论文网 www.18sci.com 诊断试验的评价指标 ROC曲线:以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。 利用AUC评价诊断价值; 两种或两种以上不同诊断试验对疾病识别能力的比较; 任意界限值时的对疾病的识别能力; 选择最佳的诊断界限值。
Standards for reporting of diagnostic accuracy SCI 论文网 www.18sci.com 诊断性试验SCI文章写作 Standards for reporting of diagnostic accuracy (STARD)报告规范 标题 摘要 前言 方法 讨论 结果与图表
SCI 论文网 www.18sci.com 标题 推荐带有Diagnostic accuracy 之类的字样以明确该研究属于诊断准确性试验。
前言 陈述文章研究的问题/目的: 评估诊断试验的准确性; 比较不同诊断试验的准确性; 比较同一诊断试验对不同研究对象群体的准确性等。 SCI 论文网 www.18sci.com 前言 陈述文章研究的问题/目的: 评估诊断试验的准确性; 比较不同诊断试验的准确性; 比较同一诊断试验对不同研究对象群体的准确性等。
前言小结 SCI 论文网 www.18sci.com 方法比较 单一方法 建议在前言中: 建议在前言中交代: 目前诊断的金标准及其缺陷 针对这一诊断方法的研究进展和尚未解决的问题 建议在前言中: 综述这两种诊断方法的研究进展和各自的优缺点 交代清楚是否已有研究比较了这两种诊断方法,若有则需要指出这些研究中存在什么缺陷 诊断方法的缺陷: 有创、不够灵敏、不够特异、周期长、昂贵、患者接受率低 不良反应率高/反应严重等。 以往研究的缺陷: 种族、地域、年龄、时间、回顾性、单中心、技术更新等。
方法——研究对象 数据收集的机构或场所 病例的纳入和排除标准 SCI 论文网 www.18sci.com 数据收集的机构或场所 病例的纳入和排除标准 研究对象的募集方式:基于某种或某些临床症状;基于某种或某些检查的结果;基于研究对象已经接受了被评价试验的检查或金标准的检查。 研究对象的抽样方式:多数情况为按照研究对象的募集方式、纳入和排除标准连续(consecutively)纳入研究。如果不是的话,须交代具体的抽样方式,如随机抽样。 资料收集的时间设计:需明确资料的收集是在被评价试验和金标准试验前还是之后,即是前瞻性研究还是回顾性分析。
方法——诊断方法 金标准:描述使用的是什么金标准,并给出依据,即是 国内外公认的标准。需提供参考文献。 SCI 论文网 www.18sci.com 方法——诊断方法 金标准:描述使用的是什么金标准,并给出依据,即是 国内外公认的标准。需提供参考文献。 诊断试验和金标准的技术要点:即怎么检测,包括何时、 何种方法测量、使用的仪器或试剂等。如非首创的诊断 方法,则需提供参考文献。 诊断依据:即描述被评价试验和金标准试验的定义、使 用的单位;若诊断结果为连续性变量的话,给出结果判 定的界值;若诊断结果为分类变量的话,给出结果判定 的具体标准。 诊断实施者和结果判定者描述:为保证诊断的可靠性以及重复性,诊断的实施者需要是权威人士或经验丰富的医师,或者是经过严格培训的医护人员。此外,需给出诊断实施者和结果判定者的人数。 盲法设计原则:描述被评价试验和金标准试验的实施者 和结果判定者之间是否设盲。如不是的话,需详细描述 实施者和结果判定者可获得的信息。
方法——统计学 评价诊断精确性的各项指标的计算方法和统计学方法; 需指明描述结果不确定性的指标(如95% CI)。 SCI 论文网 www.18sci.com 方法——统计学 评价诊断精确性的各项指标的计算方法和统计学方法; 需指明描述结果不确定性的指标(如95% CI)。 若有组间比较,需指标组间比较所用的统计学方法; 如果做了重复研究的话,需要描述评价重复性的方法。
结果与图表——研究对象 研究人群的人口学以及临床特征,如年龄、性别分布、 是否伴随其他疾病、具有的症状等。 SCI 论文网 www.18sci.com 结果与图表——研究对象 研究人群的人口学以及临床特征,如年龄、性别分布、 是否伴随其他疾病、具有的症状等。 研究对象的数目,包括满足入选标准的数目、由于某种 原因退出研究的人数以及最终实际纳入研究的人群数目。 这里强烈推荐使用流程图的形式来展示。
结果与图表——诊断结果 研究对象接受被评价试验和金标准检查的时间,以及在此 期间所接受的任何治疗措施。 SCI 论文网 www.18sci.com 研究对象接受被评价试验和金标准检查的时间,以及在此 期间所接受的任何治疗措施。 患者的疾病严重程度的分布以及对照组研究对象的其他疾 病的分布。这些分布可能会影响被评价试验的诊断效能。 报告被评价试验的诊断结果(包括不明确的缺失的结果), 可采用四格表的形式。 在检查过程中(包括被评价试验和金标准)发生的所有不 良事件及其比例。
结果与图表——诊断结果 各评价指标以及统计学分析的结果。 SCI 论文网 www.18sci.com 结果与图表——诊断结果 各评价指标以及统计学分析的结果。 若存在被评价试验无法解释的结果和不确定的结果,则需 要说明其具体的原因及处理方法,如技术原因、样本量不 足、存在其他疾病或接受了什么治疗等。 若有做不同亚组(如性别、年龄、疾病严重程度)或不同 测试中心的研究,需给出其对应的诊断准确性和有效性的 结果。 如果做了重复试验的话,需报道其结果。通常用到的统计 学方法是信度分析。
讨论 STARD规范要求诊断精确性研究需讨论结果的临床适用性。 SCI 论文网 www.18sci.com 讨论 STARD规范要求诊断精确性研究需讨论结果的临床适用性。 针对高灵敏度的诊断方法,可讨论其适用范围:当漏诊可 能造成严重后果(如有传染危险但可治疗的疾病),或当 筛检无症状病人而且该病发病率较低时,宜采用高灵敏度 的诊断方法。此外,疾病的早期阶段可能怀疑有多种疾病, 为了排除某种诊断的可能性。当试验结果为阴性时,高敏 感度诊断试验的临床价值最大。 针对高特异度的诊断方法,可讨论其适用范围:当假阳性 会使病人受到严重危害时,或由于其他原因必须确诊某病 时,宜采用高特异度的诊断方法。
诊断性试验常见误区 t检验/卡方检验比较某一指标在病例组和对照组间的差异,得出该指标有诊断价值。 无金标准 样本量过少 评价指标不全面 SCI 论文网 www.18sci.com 诊断性试验常见误区 t检验/卡方检验比较某一指标在病例组和对照组间的差异,得出该指标有诊断价值。 无金标准 样本量过少 评价指标不全面 1.多少漏诊;多少误诊
SCI 论文网 www.18sci.com THANK you!