Presentation is loading. Please wait.

Presentation is loading. Please wait.

康德英 华西医院循证医学/临床流行病学教研室

Similar presentations


Presentation on theme: "康德英 华西医院循证医学/临床流行病学教研室"— Presentation transcript:

1 康德英 华西医院循证医学/临床流行病学教研室 2012-12
系统评价/Meta分析概述 康德英 华西医院循证医学/临床流行病学教研室

2 一、背景 为提高效率,应在短时间获取、阅读高质量的文献综述。 高质量的文献综述-Meta-分析/系统评价应运而生。

3 文献综述(review) 综述是专题性、概述性、评论性的一类文献。
基于特定目的、需要或兴趣,收集有关的文献资料,采用定性分析的方法,对论文中阐述的研究目的、方法、结果、结论和观点等进行分析和评价,并基于自己的观点和判断,将一系列相关文献,加以综合归纳、条理化,最后成文。 存在问题: 原始研究文献的搜集不够全面,比较片面局限; 未对原始研究文献的质量进行严格评价; 综述过程欠透明、重复性较差,结论不一定正确、可信。

4 系统评价(Systematic Review)
系统评价(综述)是一种全新的文献评价方法 针对某一具体临床问题(如疾病的病因、诊断、治疗、预后),系统、全面地收集全世界所有已发表或未发表的临床研究,采用临床流行病学的原则和方法严格评价文献,并筛选出符合质量标准的文献,进行定性或定量合成(meta-analysis,荟萃分析或汇总分析),从而得出综合可靠的结论。

5 一般文献综述与系统评价的甄别 特征 一般文献综述(review) 系统评价 (systematic review) 研究问题 较广泛
某一具体临床问题 原始研究文献来源 常不全面 全面,常为多途径 检索方法 检索策略常未报告 检索策略明确、可重复 原始研究文献的筛选 缺乏具体标准、有潜在偏倚 纳入、排除标准明确 原始研究文献的评价 评价方法不统一或未评价 有严格的评价方法 结果的综合 多采用定性描述方法 多采用定量方法meta分析 结论的形成 较主观,受综述者自身水平、观点制约 较客观,基于研究证据 更新 未更新 定期更新,时效性

6 Cochrane系统评价 已故英国著名流行病学家和内科医生Archie Cochrane1979年提出“应该根据特定病种/疗法将所有相关随机对照试验联合起来进行综合分析,并随着新的临床试验的出现不断更新,以便得出更为可靠的结论”。 Cochrane于 1987年对过去20余年发表的、有关妊娠和分娩后随访的大样本随机对照试验结果,进行了里程碑式的系统评价。 1992年底,由Cochrane的学生Iain Chalmers爵士发起,在英国国家卫生服务部资助下,成立了以Cochrane 命名的、全球首个Cochrane中心-英国Cochrane中心。 1993年秋在英国牛津正式成立国际Cochrane协作网,邀请David Sackett担任首届主席,确定每年召开一次国际Cochrane年会。

7 系统评价与Meta分析 文献的定性综合评价
有关汇总多个医学文献结果的思路,在很早就有;1904年Karl Pearson提出数据合并的概念。 上个世纪20年代,Fisher介绍了对若干独立试验结果的P值合并方法。

8 Meta分析 Meta analysis:Meta为希腊词, “after/more comprehensive/secondary”
中文译名: Meta分析 荟萃分析 综合分析 元分析 二次分析 回锅肉:肥而不腻,入口化渣 荟萃分析,垃圾分析.

9 Meta分析 Meta分析是对具有相同研究问题的、多个独立的研究,所进行的一种定量汇总分析。 实际上是文献综合评价与统计学方法相结合的分析过程。

10 Meta分析 通过对多个同类独立研究的结果进行汇总和合并分析; 达到增大样本含量、提高检验效能的目的; 提高效应量的估计精度;

11 系统评价与Meta分析 系统评价可分为定性与定量评价,两者有密切联系。一个系统评价可能包括多个Meta分析,有时可能一个都没有。

12 二、系统评价的制作方法与步骤 确定题目(问题提出明确具体) 制定计划书(Protocol): 检索文献(包括检索策略,查全所有相关研究)
文献纳入与筛选(确定纳入与排除原始研究标准) 纳入研究文献的严格评价(逐一严格评价每个研究的方法与结果) 数据提取与收集(研究结果提取与标准化) Meta分析 (研究结果间的异质性检验,运用合适的统计方法,进行汇总分析) 结果报告、讨论及结论(评价、解释、报告Meta分析结果,敏感性分析) 系统评价的更新

13 (一)确定题目 构建可回答的、具体的、前景性问题,提出立题依据( well formulated question & rationale)
基本格式: Medicine For Disease/symptom

14 (二)制定计划书-protocol Background: why is this important?
明确目的、范围和相关标准(objective and scope referral standard) Background: why is this important? Specify the research question (or questions) Provide an overview of your methods, including search strategy, inclusion/exclusion criteria, quality assessment, how you will abstract the data, and analysis plan Specify if you plan on doing subgroup analyses or sensitivity analyses (best if these are a priori)

15 (三)检索文献 系统全面地收集所有相关的文献资料;必须使用检索工具, 制定检索方法和检索策略 ( Retrieve relevant literatures ) 要求: 检索策略合理可行,检索过程透明、可重复 检索手段多样(机检+手检) 联合选择多种文献检索源(两个以上)

16 系统、全面检索文献 同时检索两个以上数据库: Medline, Embase, CINAHL, CBM, CNKI, VIP
检出文献的参考文献 Reference lists 手工检索:核心杂志, conference proceedings, books 注册临床试验数据库:CENTRAL 与相关领域专家、药企、作者联系Corresponding or first authors of published studies

17 检索实例(Chinese medicinal herbs for symptomatic carriers of hepatitis B virus infection)
Electronic searches The trials registers of The Cochrane Hepato-Biliary Group The Cochrane Library, and of The Cochrane Complementary Medicine Field were searched MEDLINE (March Obtober 2000) EMBASE (January October 2000). A search strategy for the Cochrane Library was developed by the Cochrane Hepato-Biliary Group. MEDLINE and EMBASE were searched using the MeSH terms: hepatitis-B, carrier-state, medicine-Chinese-traditional, plants-medicinal, drugs-Chinese-herbal, plants extracts, and herbs. No language restrictions were applied.

18 (四)文献纳入与筛选 根据研究问题(PICOS)来确定纳入与排除标准,进而选择文献 (Selecting good studies),并非所有文献都可纳入。 筛选分三步进行 : 初筛:相关性(文题+摘要) 阅读全文:纳入与排除标准 与作者联系:报告不充分或未报告

19 文献筛选纳入流程图 去重后的文献数 筛查过的文献数 排除的文献数 合格的全文文献数 排除的全文文献数及原因 纳入的定性综合文献数 合格 纳入
检索 通过数据库检索的文献数 通过其他途径检索的文献数 文献筛选纳入流程图 纳入的定量综合文献数(Meta分析)

20 文献纳入与排除标准的制定 PICOS: similar patient populations: P
similar interventions: I similar control/comparison: C similar outcomes: O similar study design: S

21 Cochrane SR的 “纳入标准” 基本格式
S:研究设计类型 (e.g., RCT) P:研究对象或人群 (risk group) I:干预措施 (dosage strength, regimen) O:主要结局指标 (definitions, follow-up period)

22 (五)纳入研究文献的严格评价 对入选的文献, 须用临床流行病学评价文献的原则和方法,进一步分析评价,以防止和减少偏倚(assessment of study quality) 。 原始研究的主要偏倚: 选择性偏倚 随访偏倚 测量偏倚

23 Cochrane风险评价工具(RCT) 评价条目 评价内容描述 具体评价问题 1.随机分配方法
详细描述产生随机分配序列的方法,有助于评估组间可比性 随机化分配序列的产生是否正确? 2.分配方案隐藏 详细描述隐藏随机分配序列的方法,从而帮助判断干预措施分配情况是否可预知 分配方案是否有效地隐藏? 3.盲法 描述对受试者或试验人员实施盲法的方法,以防止他们知道受试者的干预措施,提供判断盲法是否成功的相关信息 盲法是否完善? 4.结果数据的完整性 报告每个主要结局指标的数据完整性,包括失访和退出的数据。明确是否报告以上信息及其原因,是否采用意向性分析(ITT) 结果数据是否完整? 5.选择性报告研究结果 描述选择性报告结果的可能性及情况 研究报告是否提示无选择性报告结果? 6.其它偏倚来源 除以上5个方面,是否存在其他引起偏倚的因素?若事先在计划中提到某个问题或因素,应在全文中作答 研究是否存在引起高度偏倚风险的其他因素?

24 (六)数据提取与收集 收集和提取数据资料(collecting of data), 判断收集数据的可靠性. 一般资料
研究特征(疾病/患者,干预措施,设计方案) 结果测定 随访失访

25 (七)Meta分析 汇总分析与结果报告(analysis and presenting results)
定性分析:用描述的方法,对研究的设计 方法和结果进行总结. 定量分析: 1) 异质性检验 2) Meta-分析

26 Meta分析的统计步骤 包括: 异质性(同质性)检验; 计算合并效应量; 合并效应量的假设检验与区间估计 。 敏感性分析/亚组分析

27 步骤1:异质性检验 (Heterogeneity Test)
检验多个原始研究结果间的一致性: Q检验法及I2指数 图形法

28 异质性分类 统计异质性: Variability in the intervention effects being evaluated
临床异质性:Variability in the participants, interventions and outcomes studied 方法学异质性:Variability in study design and risk of bias

29 统计异质性检验结果 森林图目测:可信区间的重叠交叉程度 Q检验:P>0.10和P<0.10 I Square(I2):
0% to 40%: might not be important; 30% to 60%: may represent moderate heterogeneity; 50% to 90%: may represent substantial heterogeneity*; 75% to 100%: considerable heterogeneity*.

30 步骤2.多个研究的效应量合并 将多个研究的结果合并(或汇总)成为一个合并效应量,以反映多个研究综合结果。 常用效应量的表达方式有:
数值变量资料:均数差值(或标准化均数差值) 分类变量资料: OR (比数比)、RR (相对危险度) 。

31 步骤3.合并效应量的统计推断 检验合并效应量在总体上是否具有统计学意义。 合并效应量的总体推断方法:
假设检验(Hypothesis Test) 合并效应量的95%可信区间估计

32 步骤4.敏感性分析或亚组分析 考察Meta分析结果的稳健性与可靠性。

33 一) 数值变量资料- Meta分析

34 基本过程 异质性检验(Q检验法及森林图目测法)  效应量:合并分析MD合并 假设检验及合并效应量MD合并的95%可信区间估计 敏感性分析

35 分析数据提取与准备 根据现有数据判断资料是否满足正态分布。 结果是否包括了所有观察对象,有无缺失/失访情况,其比例有多大?
纳入研究间度量衡单位是否一致、有无方向性(正向指标、负向指标)

36 1、Meta分析所需数据 组 别 治疗开始前 均数标准差 治疗后 前后差值 治疗组 对照组 合 计

37 2、确定单个研究的效应量 效应量为试验组与对照组的均数之差; 包括两种形式: 1、观察终点的均数之差 2、治疗前后变化值均数间的差值。
根据基线比较的结果而定。

38 3、多个研究合并效应量 均数差值:样本量相差较大 均数差值的标准化值:标准或度量衡单位不统一

39 例1 某研究者为分析某降血脂药物的疗效,纳入了5个RCT,结果如下
    表1 合并均数差值计算过程及结果 研究 治疗组 对照组 s*i di wi diwi d2iwi nt xt sd nc xc sd2 合计

40 4、实例分析结果 异质性检验 Q = 5.45, P = 0.24>0.10, I2=27%,满足同质性。
合并效应量估计:-0.70 (固定效应模型) 假设检验及95%可信区间估计 Z=2.50, P=0.01<0.05,有统计学意义。 95%可信区间(-1.25,-0.15)

41 5、敏感性分析(sensitivity analysis)
定义:是指在排除结果异常的研究后,重新进行Meta分析的结果并与未排除前的结果进行比较,以探讨该研究对合并效应量的影响程度及结果可靠性。

42 若敏感性分析未从实质上改变结果,说明结果较为可信;若敏感性分析得到不同结论,表明在解释结果和下结论时应非常慎重,提示有潜在的重要因素影响干预措施效果,需明确争议的来源。

43 有缺陷的数值变量资料的处理 偏态数据资料,不能处理 只有标准误,无标准差,需转换。 变化值均数差值:终点指标的选择
有无临床意义的判定(有临床意义最小值)

44 二)分类变量资料-Meta分析 目前对分类变量资料进行Meta分析,比较成熟的方法,主要是两组比较的二分类变量资料;
效应量主要采用OR、RR,对于临床试验中罕发不良事件,两者基本等价。否则倾向使用RR。

45 二分类变量Meta分析 异质性检验(Q检验法及森林图目测法)  效应量合并:OR合并 假设检验及OR合并的95%可信区间估计 敏感性分析

46 1、Meta分析所需数据 组 别 例数 阳性数 阴性数 阳性率 治疗组 n1 a b p1 对照组 n2 c d p2
组 别 例数 阳性数 阴性数 阳性率 治疗组 n a b p1 对照组 n c d p2 合 计 a+c b+d

47 2、效应量的确定 效应量为试验组与对照组的暴露比的比值(OR)或者两组率的比值(RR);当发生事件率低于10%时,两者基本等价。

48 例2 纳入5个多中心临床试验研究,用以评价阿司匹林治疗心肌梗塞的疗效,资料见表2
表2 5个随机对照试验结果一览 阿司匹林组 对照组 合计 研究 死亡 存活 病死率 死亡 存活 病死率

49 3、Meta分析结果 异质性检验结果: Q=10.85-(38.03)2/141.15=0.63,无统计学意义,I2=0%, 满足同质性。
合并效应量结果:OR为0.76 (固定效应模型) 假设检验: P<0.01,有统计学意义; 95%可信区间为0.65 ~ 0.90。

50 Q检验结果 合并分析检验结果 合并效应量及95%可信区间

51 三)Meta分析的统计方法抉择 Meta分析是一类定量汇总分析方法; 结合分析目的/效应量指标的资料类型,与同质性检验结果,进行综合抉择。

52 RevMan提供的统计分析方法

53 三、如何批判性阅读系统评价/Meta分析结果
任何研究结果在用于指导实践之前都需要进行质量评价,系统评价也不例外。 报告质量工具:PRISMA 方法学质量工具:AMSTAR、OQAQ

54 “中药系统评价”的方法学质量评价 纳入165个公开发表的、有关中药或中药制剂、中药复方的系统评价/Meta分析(截止2010年)

55 有66个SR(40.00%)所纳入的原始研究全部为中文文献,仅有27个同时纳入了中、英文或其他语种发表的原始研究。
文献检索与文献纳入环节 有3个SR未提及任何检索所用数据库(1.82%);有40个(24.24%)只检索了中文数据库;有52个(31.52%)限定的检索日期并非数据库收录起始日期而未说明原因。 有66个SR(40.00%)所纳入的原始研究全部为中文文献,仅有27个同时纳入了中、英文或其他语种发表的原始研究。 另有42.42% 的SR对发表性偏倚进行了分析。 55

56 原始研究文献的质量评价:126个(76.36%)选用工具对原始研究的质量进行了严格评价。
原始研究文献的筛选与纳入环节 162个(98.2%)设置了原始研究纳入标准,但有明确排除标准的只有98个(59.4%)。 94个(58.75%)只纳入随机对照试验(RCT);有51个(31.88%)纳入了两种及以上设计类型的原始研究;另有15个SR中(9.38%)纳入原始研究类型不明。 原始研究文献的质量评价:126个(76.36%)选用工具对原始研究的质量进行了严格评价。 56

57 临床异质性分析: 干预措施: 试验药物所属类别一致者有97个(58.78%)。剂量完全一致者仅有8个,占5%。
成分全部相同者占38.75%(n=62),剂型相同有37.6%。 与疾病构成相对应,SRs中原始研究的干预措施也以活血化瘀方剂或活血化瘀药占的比例最大。干预措施中成分全部相同的有38.75%,剂型相同的有37.58%,试验药物类别一致的有58.78%,剂量一致的有5%。 57

58 临床异质性分析: 对照措施: 对照措施的成分、剂型、所属类别、剂量一致的比例均低于25%,其中剂量一致的系统评价有17个,有15个采用的是空白对照。 原始研究对照药物的成分、剂型、药物类别、剂量一致的SRs也比较少。 58

59 Meta分析: 有45个(27.27%)中药系统评价的汇总分析不合理。(仅考虑数据的统计学异质性而忽略了其临床异质性,结果导致临床明显异质的原始研究结果强行合并) 27.27%的TCM SRs只考虑了统计学异质性未考虑临床异质性,其汇总分析不合理。 59

60 小 结 正确对待SR:系统评价本身并不能提高原始研究质量“Garbage in, garbage out”
小 结 正确对待SR:系统评价本身并不能提高原始研究质量“Garbage in, garbage out” 系统评价不是万能的(ISIS MI, 硫酸镁 );一个系统评价不能回答所有问题:多个或单个系统评价; 制作SR为系统工程,具有挑战性,工作量大! (高质量系统评价);先做user,后做doer;提倡团队协作。


Download ppt "康德英 华西医院循证医学/临床流行病学教研室"

Similar presentations


Ads by Google