Download presentation
Presentation is loading. Please wait.
1
《循证医学临床实践》第五章 系统综述与Meta-分析 临床流行病学与循证医学教研室
2
第一节 系统综述概述 一、系统综述基本概念 1. 基本概念 一种全新的文献综合方法,指针对某一具体 临床问题(如:病因、诊断、治疗、预后),
第一节 系统综述概述 一、系统综述基本概念 1. 基本概念 一种全新的文献综合方法,指针对某一具体 临床问题(如:病因、诊断、治疗、预后), 系统、全面地收集已发表或未发表的临床研究, 采用临床流行病学严格评价文献的原则和方法, 筛选出符合质量标准的文献进行定性或定量合 (荟萃分析),得出可靠的综合结论。 系统综述可以是定性的(Qualitative systematic review)也可以是定量的(Quantitative systematic review)(此种系统综述含Meta-分析的过程)
3
随着循证医学的兴起, 如何系统总结既往的 研究成果, 为临床循证决策提供高质量证据日益 受到重视。 系统综述( systematic review,SR )和Meta分析 (Meta-analysis,MA )已被公认为客观评价和合成 针对某一特定问题的研究证据的最佳手段, 通常 被视为最高级别的证据。 过去20 年间这种合成证据的方法在医学研究 领域得到了广泛的应用,
4
截至2010年9月PubMed已经收录Meta-分析
的论文 2万 5千余篇。 Cochrane系统综述从2006年开始被SCI收录, 目前影响因子高达5. 653。 国内发表的系统综述和Meta-分析的数量从 2001年以后呈现持续增长的趋势, 但文章质量 良莠不齐,在研究设计、资料处理和论文写作等 方面仍需进一步完善和规范。
5
2. Cochrane系统综述 (1)Cochrane系统综述是由Cochrane协作网经过 培训的评价人员完成的系统综述。
固定的格式和内容要求,统一的系统综述软件 (RevMan)录入和分析数据、撰写系统综述计划 书和报告 (3)定期更新, Cochrane系统综述有着完善的反馈 和完善机制,其质量常比非Cochrane系统综述 质量更高,被认为是单一的、评价干预措施 疗效的最好信息资源(best single source)。
6
3. Meta-分析 从20世纪60年代,医学文献中陆续出现了对 多个独立研究统计量进行合并的报道。 1976年G.V.Glass将合并统计量对文献进行 综合分析研究的方法称为“Meta-Analysis”。 (1)Meta-分析的定义 一种统计分析方法,它将多个独立的、可以 合成的临床研究综合起来进行定量分析。 (Meta-Analysis is statistical technique for assembling the results of several studies in a review into a single numerical estimate.)
7
系统综述不一定都包括有Meta-分析过程 Meta-分析也不一定是系统综述
常被混用。 系统综述不一定都包括有Meta-分析过程 Meta-分析也不一定是系统综述 !若没有明确、科学的方法去收集、选择、 评价临床研究资料,而仅单纯采用统计方法 将多个临床研究进行合成并不能保证结论的 真实性和可靠性。
8
4. 文献综述(传统综述) 作者根据特定目的和需要或兴趣,围绕某一题目收集相关的医学文献,采用定性分析方法,对论文的研究目的、方法、结果、结论和观点等进行分析和评价,结合自己的观点和临床经验进行阐述和评论,总结成文,可为某一领域或专业提供大量新知识和信息,以便读者较短时间了解某一专题的研究概括和发展方向,解决临床实践中遇到的问题。
9
二、为什么要进行系统综述 1. 应对信息时代的挑战
1. 应对信息时代的挑战 (1)每天需要新的知识及证据,获得有价值的文献较难全世界每年发表医学论文200多万篇。生物医学杂志期刊 2万2千多种/年,年增长率6.7%。无时间,无阅读者比例较大。若每天坚持阅读19篇文章,才能全面了解本领域进展。
10
(2)系统综述直接为各层次的决策者提供科学依据
1)采用严格的选择、评价方法,去粗取精、去伪 存真,将真实、可靠而有临床应用价值的信息 进行合成。 2)某些干预措施的利弊,靠单个临床研究结果是 难以确定的。 3)临床应用过程中存在较大争议等问题需要探讨。
11
2. 及时转化和应用研究成果 (1)疾病谱变化带来的影响 对多因素疾病,如:恶性肿瘤、心脑血管疾病和 各种慢性疾病的治疗方法的评估,需要尽量开展 大样本临床试验,特别是随机对照试验(RCT)。 (2)大规模RCT消耗较大(人力、财力和时间) 承受能力、可行性受一定限制。现有临床研究虽 数量多,但样本量不够大,故单个试验结果难以 提供全面、准确和推广应用价值大的研究结果。 (3)系统综述可对多个临床试验结果进行合成 系统综述结果质量高、同质性,可将其综合的 有效措施,转化和应用于临床实践与决策。
12
实例:采用累积性Meta-分析回顾性分析有关静脉链激酶
治疗急性心肌梗死的临床试验 1973年 8个RCTs(2432例)的Meta-分析即证明静脉链激酶 能有效降低AMI患者的总病死亡(P=0.01); 1978年达25个RCTs(34542例)的Meta-分析,P=0.01 (包括GISSI-1和ISIS-2),到1986年,P=0.0001; 1987年在传统综述和教科书中才推荐常规使用静脉链激酶 治疗急性心肌梗死。 临床应用比Meta-分析的结果整整晚了14年! 若早用, 可挽救多少急性心肌梗死患者的生命。故,Murphy 等1994年指出:1973年以后的大型临床试验,即使 无医德问题也是多余的,且浪费大量经费。
13
3. 提高统计效能 系统综述或Meta-分析可解决结果矛盾或 不一致的问题。 针对同一临床问题的研究很多,结果可能 不一致,甚至相互矛盾。通过定量的系统综述 可得到一个总的结果, 例如:对可能早产的孕妇是否使用激素, 纳入的 7个高质量临床试验,尽管仅两个试验 结果有统计学意义,但对 7个临床试验进行 定量系统综述,借以增加样本含量和统计效能 后,总的结果有统计学意义,肯定了糖皮质 激素能有效降低早产儿的病死率。
14
系统综述或Meta-分析在进行资料合成时,
不是根据阴性或阳性研究的个数多少决定哪种 治疗措施有效,而是充分考虑了各个研究的 样本量大小和研究的质量。 系统综述可减少相关偏倚的影响,提高了 研究结果的可靠性和准确性。
15
三、系统综述与叙述性文献综述的区别与联系
叙述性文献综述有助于广泛了解某一疾病的全貌, 而系统综述则有助于深入了解某一具体疾病的诊治。 两者的主要区别如下(表5-1): 表5-1
16
第二节 系统综述的方法 系统综述的简单分类: 1. 根据系统综述纳入的原始研究类型不同 临床对照试验的系统综述 观察性研究的系统综述
第二节 系统综述的方法 系统综述的简单分类: 1. 根据系统综述纳入的原始研究类型不同 临床对照试验的系统综述 观察性研究的系统综述 2. 根据进行系统综述时纳入原始研究的方式 前瞻性 回顾性 累积性 3. 根据资料分析时是否采用统计学方法(Meta-分析) 定性 定量 4.根据研究的临床问题不同 病因、诊断、治疗、预后、卫生经济评价等
17
系统综述的基本方法和步骤 如下(图5-1): 图5-1 系统评价程序图示 1.确定题目、制定研究计划 2.检索文献 (1)计算机检索
系统综述的基本方法和步骤 如下(图5-1): 1.确定题目、制定研究计划 2.检索文献 (1)计算机检索 (2)手工检索 (3)追踪参考文献 3.筛选文献 4.文献质量评价 5.资料提取 6.资料分析 7.解释结果,撰写报告 8.更新系统综述 定性分析 定量分析 同质性好 同质性不好 固定效应模型 亚组 分析 随机 效应 模型 敏感性 图 系统评价程序图示
18
一、确立题目、制订系统综述计划书 题目主要来源: 临床医疗实践中涉及疾病防治的不肯定、有争议的重要临床问题 避免重复
全面、系统检索,是否有系统评价
19
确立题目时明确四个要素: 1. 研究对象的类型 2. 研究的干预措施和进行比较的措施
1. 研究对象的类型 2. 研究的干预措施和进行比较的措施 3. 主要研究结果的类型包括所有重要的结果及严重的不良反应 4. 研究的设计方案
20
制订计划书,内容包括: 系统综述的题目 背景资料 目的 检索文献的方法及策略 选择合格文献的标准 评价文献质量的方法 收集和分析数据的方法
21
二、检索文献 1. 检索方法:电子数据库结合手工检索 2. 期刊、数据库:(Medline、Embase、Scisearch、
系统、全面检索,制定检索策略 1. 检索方法:电子数据库结合手工检索 2. 期刊、数据库:(Medline、Embase、Scisearch、 Registers of clinical trials)不仅限于MedlineCRG 专业注册数据库(Cochrane协作评价组) 3. 参考文献目录:获得未能检索到的研究 4. 个人通信:获得未发表的试验结果 5. 灰色文献:学术报告、会议论文、研究生论文等。
22
1. 根据确立的研究问题及构成研究问题的四要素制定 如:拟探索静脉滴注硫酸镁能否降低急性心肌梗死患者的
三、选择文献 1. 根据确立的研究问题及构成研究问题的四要素制定 如:拟探索静脉滴注硫酸镁能否降低急性心肌梗死患者的 近期死亡率? 纳入标准: 确定研究对象:急性心肌梗死患者,不考虑梗死部位、患者 性别、年龄 干预措施: 静脉使用硫酸镁与安慰剂比较 主要研究结果:35天内的病死率 设计方案: RCT 排除标准: 口服硫酸镁或静脉滴注硫酸镁与其他药物进行比较,结果为 心肌梗死后35天后的病死率或非RCT的文献资料均不能纳入。
23
2. 文献资料的选择步骤 文献资料的选择应分三步进行(图5-2)。 (1)初筛:根据检索出的引文信息如题目、摘要筛除 明显不合格的文献,对肯定或不能肯定的文献应 查出全文再进行筛选; (2)阅读全文:对可能合格的文献资料,应逐一阅读 和分析,以确定是否合格; (3)与作者联系:一旦被排除的文献将不再录用,故, 若文中提供的信息不全面而不能确定,或有疑问 和有分歧的文献应先纳入,通过与作者联系获得 有关信息后再决定取舍或选择过程中进一步评价。
24
图 选择文献的基本步骤
25
四、评价纳入研究的偏倚风险 1. 评价纳入研究的偏倚风险: 指评估单个临床试验在设计、实施和分析 过程中防止或减少系统误差(偏倚)和随机
1. 评价纳入研究的偏倚风险: 指评估单个临床试验在设计、实施和分析 过程中防止或减少系统误差(偏倚)和随机 误差的程度,以作为纳入原始文献的阈值、 解释不同文献结果差异的原因、进行系统综述 敏感性分析和定量分析(Meta-分析) 时给予 文献不同权重值的依据。
26
2. 文献评价应包括三方面内容 (1)内部真实性 指单个研究结果接近真值的程度,即受各种偏倚 因素,如:选择偏倚、实施偏倚、失访偏倚和
2. 文献评价应包括三方面内容 (1)内部真实性 指单个研究结果接近真值的程度,即受各种偏倚 因素,如:选择偏倚、实施偏倚、失访偏倚和 测量偏倚的影响情况; (2)外部真实性 指研究结果是否可以应用于研究对象以外的其他 人群,即结果实用价值与推广应用情况,主要与 研究对象的特征、研究措施的实施方法和结果的 选择标准密切相关; (3)影响结果解释的因素 如:治疗性试验中药物的剂量、剂型、用药途径 和疗程及依从性等因素。
27
3. 偏倚的种类及来源 偏倚是导致研究结果偏离真值的现象,存在于 临床试验中从选择和分配研究对象、实施干预 措施、随访研究对象、测量和报告研究结果的 每个阶段(图5-3)。偏倚主要分为五种: (1)选择性偏倚; (2)实施偏倚; (3)随访偏倚; (4)测量偏倚; (5)报告偏倚。
28
图 偏倚来源
29
目前采用由Cochrane协作网要求使用的文献质量“偏倚风险评估”工具:
表5-2
30
4. 避免选择文献和评价文献质量人员偏倚的方法
4. 避免选择文献和评价文献质量人员偏倚的方法 (1)可考虑一篇文章多人或盲法选择和评价。 (2)可采用专业与非专业人员相结合的共同选择和 评价办法,对于选择和评价文献中存在的意见 分歧可通过共同讨论或请第三方的方法解决。 (3)多人选择文献时,可计算不同评价者的一致性 (Kappa值)。 (4)应进行预试验,以摸索经验,标化和统一选择、 评价方法。
31
五、收集数据 1. 一般资料 评价的题目、评价者的姓名、原始文献编号和来源、评价的日期等; 2. 研究特征
1. 一般资料 评价的题目、评价者的姓名、原始文献编号和来源、评价的日期等; 2. 研究特征 研究的合格性、研究对象特征和研究地点、文献的设计方案和质量、研究措施的具体内容和实施方法、有关偏倚防止措施、主要的试验结果等。 3. 结果测量 随访时间、失访和退出情况、分类资料应收集每组总人数及事件发生率、连续资料应收集每组的研究人数、均数和标准差或标准误等。 所有数据均要输入RevMan
32
六、分析资料和报告结果 1. 定性分析 采用描述的方法,总结四要素列成表格,浏览各研究情况、方法和不同研究间的差异,计划定量合成和结果解释。 是定量分析前必不可少的步骤 2. 定量分析 (1)同质性检验(或异质性检验) (2)Meta-分析 (3)敏感性分析
33
(1)异质性检验 临床异质性,指不同研究中研究对象、干预措施和结果测量等存在的差异; 方法学异质性,指试验设计和质量在不同研究中存在的差异; 统计学异质性,指不同研究中干预措施的效应值存在的差异,是临床异质性和方法学异质性导致的结果。
34
异质性检验方法: 1)作图:观察各效应值和可信区间是否有重叠 2)异质性检验(Q test,Ch-square test) I2定量估计异质性大小 0-40%表示异质性可能不重要 30%~60%表示有中度异质性 50%~90%表示有显著异质性 75%-100%表示有很大异质性
35
(2)Meta-分析 根据资料类型及评价目的选择效应量并对其进行定量合成分析。 分类变量:比值比、相对危险度、危险度差值和 NNT
连续性变量:MD、SMD 固定效应模型 随机效应模型 森林图(forest plot)
36
(3) 敏感性分析 指改变某些影响结果的重要因素,如:纳入标准、研究质量的差异、失访情况、统计方法(固定效应或随机效应模型)和效应量的选择(比值比或相对危险度)等,以观察同质性和合成结果是否发生变化,从而判断结果的稳定性及程度。
37
七、解释系统综述的结果 1. 系统综述的论证强度 纳入的原始研究设计方案、质量、方法学缺陷 合成结果的效应值大小和方向 剂量-效应关系
1. 系统综述的论证强度 纳入的原始研究设计方案、质量、方法学缺陷 合成结果的效应值大小和方向 剂量-效应关系 2. 推广应用性 干预措施对患者的利弊 纳入系统综述的研究其研究对象是否与你的患者情况相似? 3. 对干预措施的利弊和费用进行卫生经济分析 4. 对医疗和研究的意义
38
八、 更新系统综述 系统综述的更新:指在系统综述发表以后,定期收集新的原始研究,按前述步骤重新进行分析、评价,以及时更新和补充新的信息,使系统综述更完善。
39
第三节 Meta-分析 一、概述 将两个或多个相似研究结果进行定量综合分析的方法。即系统综述的定量评价。
40
二、基本过程 1.数据提取 2.数据类型及效应量的表达 3.异质性检验 4.合并效应量估计及其假设检验
41
1. 数据提取 (1)多途径收集,确保数据全面完整 (2)采取有效的质控措施 (3)对数据资料的真实性进行严格评价
42
2. 数据类型及效应量的表达 (1)二分类变量资料 如:存活、死亡,复发或不复发等。 (2)数值变量/连续性变量资料
2. 数据类型及效应量的表达 (1)二分类变量资料 如:存活、死亡,复发或不复发等。 (2)数值变量/连续性变量资料 如:血压值、尿糖、CD4/CD8数等 (3)等级资料/有序多分类变量资料 如:疗效判定用痊愈、显效、有效、无效等 (4)计数数据 (5)生存资料
43
3. 异质性检验 Q检验法 目测图形法
44
Q检验法的原理 Q检验法的无效假设为所有纳入研究的效应量均相同 (即H0: θ1 = θ2 =…= θk )
Q定义为:Q=∑wi(θi-θ)2,θ = Q=∑wiθi2 - , wi 为第 i个研究的权重值 θi 为第 i 个研究的效应值 θ 为合并效应量 k 为纳入的研究个数 Q 服从于自由度为k-1的 χ2分布。 若Q> χ2 (1-α), 则P<α,表明纳入研究间的效应量存在异质性,进一步计算异质指数I 2定量描述异质程度 ∑wi θi ∑wi (∑wi θi)2 k i -1
45
异质性检验实例5-1:Marinho收集了有关含氟牙膏预防 青少年龋齿的 7个临床随机对照试验,试用Meta-分析综合
评价含氟牙膏的防龋效果。资料见表5-4。 表5-4
46
以例5-1为例,Q检验法的计算过程见 表5-5,其中 θi =lnORi,wi=1/Var(lnORi), Var(lnORi)=1/ai+1/bi+1/ci+1/di。 Q=34.76-[(-36.61)2/117.71]=23.37, v=7-1=6, P<0.01 异质性检验有统计学意义,说明研究间 效应量是不同质的,I 2=74.3%。
47
实例:Q统计量计算过程 表5-5
48
Q检验法的检验效能较低 若在纳入研究数目较少,出现假阴性结果,可考虑提高检验水准,如:α=0.10,以增大检验效能。 若纳入研究过多,即使研究间结果是同质的,也能出现P<α情况,即异质性检验有统计学意义
49
图表法: 标准化 Z分值图、Radial图、Forest图(森林图)、L’Abbe图等。 若可信区间大部分重叠,无明显异常值一般可认定同质性较高。
50
4. 合并效应量估计及其假设检验 异质性不明显,采用固定效应模型估计合并效应量。 若存在异质性且效应量服从正态分布时,可用随机效应模型。 若异质性过于明显 ,可考虑亚组分析、meta 回归分析、敏感性分析或放弃汇总分析,只对结果进行简单描述。
51
(1)估计合并效应量及95%可信区间 表5-6 表5-7 51
52
∑aidi /Ni ORMH = ∑bici /Ni
∑PiRi ∑(PiSi+QiRi) ∑QiSi Var(lnORMH)= + + (∑Ri ) (∑Ri )(∑Si ) (∑Si )2 其中ai,bi,ci,di为四格表的实际频数,Ei为ai的理论频数,Ri= aidi /Ni ;Si= bici /Ni ; Pi=(ai+di)/Ni ; Qi =(bi+ci)/Ni 则ORMH的95%可信区间为: exp(lnORMH)±1.96√Var(InORMH) 52
53
aidi/Ni 本例ORMH= =104.07/142.61=0.73, bici/Ni ORMH的方差为: =0.0082
∑PiRi ∑(PiSi+QiRi) ∑QiSi Var(lnORMH)= + + (∑Ri ) (∑Ri )(∑Si ) (∑Si )2 53
54
u分布(外文文献常用Z分布),用于检验合并 效应量是否有统计学意义。
(2)合并效应量的假设检验 lnORMH Z检验 Z= , Var(lnORMH) 统计量Z服从于 u分布(外文文献常用Z分布),用于检验合并 效应量是否有统计学意义。 本例:Z= /0.0906=-3.48,查Z表P<0.001, 表明合并效应量有统计学意义。 54
55
图中“ ”为合并效应量图示,“0.73[0.61,0.87]”表示 合并效应量及95%可信区间;“Z=3.48(P=0.0005)”表示假设
图中“ ”为合并效应量图示,“0.73[0.61,0.87]”表示 合并效应量及95%可信区间;“Z=3.48(P=0.0005)”表示假设 检验中的统计量及其 P值。“Chi2=23.37,df=6 (P=0.0007)”, 表示异质性检验的 Q值及 P值,异质指数 I 2=74%。 图 RevMan计算结果Forest 图 55
56
三 、固定效应模型与随机效应模型的选择 模型选择取决于异质性检验结果以及对理论 效应量的假设。 若异质性检验无统计学意义且异质性小到可
忽略时,可直接选用固定效应模型 若异质性较大且假定理论效应量变化呈正态 分布,则应选用随机效应模型。其结果比固定效应模型结果更稳健。
57
表5-3 常用Meta-分析方法和效应指标 模型假设 统计方法 效果测量形式
模型假设 统计方法 效果测量形式 固定效应模型 Mantel-Haenszel法 比(OR、RR) Peto法 比值比(OR) General Variance 比(所有类型),差值(RD、 -Based法 平均数差值等)和回归系数 随机效应模型 Dersimonian and 比(所有类型)和差值(RD、 Laird法 平均数差值等) 57
58
1. 固定效应模型 计数资料——MH法:RR值、OR值等。 计量的资料——方差倒置法:均数差值(MD)、 标准化均数差值(SMD) (例)
59
si*= 。di 的标准误为 (1)单个研究SMD及95%可信区间估计 SMD为标准均数差值,可表示为 ,
第 i 个研究对照组的均数。si*为第 i 个研究的 两组合并标准差。 si*= 。di 的标准误为 di=(xi-xi )/si* t c xi t xi c (ni-1)(si )2+(ni -1)(si )2 t c ni+ni -2 Ni di 2 ni ni t c 2(Ni -2) + 。
60
(2)合并效应量(SMD合并值)及95%可信区间 1 d合并±1.96= , ∑wi ∑widi d合并= ∑wi ,其95%可信区间为
(3)异质性检验 (∑widi)2 Q=∑widi- ∑wi 2 ,进一步可计算异质指数 I 2 , Q-(k-1) I 2= ×100%。 Q (4)合并效应量的假设检验 d合并 Z= SEd 合并 ,SEd 合并 1 = 。 ∑wi
61
实例5-2 Marinho 收集了13个有关含氟漱口剂预防青少年龋齿发生的 RCT研究,分别测试干预组与对照组龋失补指数增加值,试分析
含氟漱口剂的防龋效果,具体结果如表5-10. 表5-10
62
本例合并SMD(标准化均数差值)为-0.28,其95%可信区间
为-0.34~ -0.23。合并SMD假设检验Z=9.86,P<0.01;异质性检验: Q=26.24,P<0.01,有统计学意义, Q-(k-1) I 2= ×100%=54.3%。 Q 因本例异质性检验仍有统计学意义,考虑选用随机效应模型。 同样,以该资料为例,使用RevMan的固定效应模型分析结果见 图5-8。 图中“ ”为合并效应量图示,“-0.28[-0.34,-0.23]”表示合并 标准化均数差SMD合并及其95%可信区间;“Z=9.84(P< )” 表示假设检验中的统计量及其P值。“Chi2=26.13,df=12(P=0.01)”, 表示异质性检验的Q值及P值,异质指数I2=74%。由于RevMan 的估计过程中对SMD及标准误进行了Hedges校正,结果与人工 计算略有差别。
63
固定效应模型结果实例 图5-8 使用RevMan软件的Meta-分析结果
64
2. 随机效应模型 在固定效应模型的方差倒置法或MH法基础上采用了DerSimonian-Laird校正。 两类模型区别在于加权方式不同: 固定效应模型以每个研究内方差的倒数作为权重; 随机效应模型是以研究内方差与研究间方差之和的倒数作为权重
65
该校正法由DerSimonian和Laird于1986年提出,假设原始
(1)二分类变量资料 该校正法由DerSimonian和Laird于1986年提出,假设原始 研究的效应量不尽相同,以研究内方差及研究间方差之和 的倒数为权重,并以此估计合并效应量。与固定效应模型 相比,主要步骤相同,依次估计单个研究效应量、合并 效应量及95%可信区间,最后进行假设检验。唯一不同的 是需事先计算研究间方差τ2。校正权重 wi*=(wi +τ2) 。 其中, ,Q为异质性检验 统计量,k为纳入分析的研究个数。若Q<k-1,τ2=0,若 Q>k-1, -1 Q-(k-1) τ2=max 0, ∑wi-(∑wi2/ ∑wi) Q-(k-1) τ2= ∑wi-(∑wi2/ ∑wi ) 。
66
∑wi*InOR OR合并=exp( ) ∑wi* 1.96 exp( In OR合并 ± ) ∑wi* Q-(k-1)
仍以四格表资料为例,使用随机效应模型估计合并效应量及 95%可信区间: 95%可信区间为 ∑wi*InOR OR合并=exp( ) ∑wi* 1.96 exp( In OR合并 ± ) ∑wi* Q-(k-1) τ2= ∑wi-(∑wi2/ ∑wi ) 以例5-1为例,Q=23.37>6,故 23.37-(7-1) 17.71-25.77 =0.189 =
67
随机效应模型具体估计过程如下(表5-11) 表5-11
68
其中OR合并为exp(-7.67/24.43)=0.73,其95% 可信区间为0.49~1.09。 当异质性不明显时,两种模型估计相同。 若存在较明显的异质性时,结果会有差异。 本例随机效应模型估计的可信区间为(0.49~1.09)明显 宽于固定效应模型的估计结果(0.61~0.87),且OR 合并假设检验无统计学意义。
69
(2)数值变量(连续性变量)资料 对于数值变量(连续性变量)资料,固定效应模型采用 方差倒置法进行估计,而随机效应模型是在此基础上 进行DerSimonian-Laird校正。 随机效应模型的校正权重 wi*=(wi +τ2) , 其中 -1 Q-(k-1) τ2=max 0, ∑wi-(∑wi2/ ∑wi) ,wi=1/vdi, 2( ) ni +ni t c di 2 ni ni + vdi = ∑wi*di dDL= , ∑wi* dDL Z= / wi* -1 研究间方差 ,Q为异质性检验统计量, k 为纳入分析的研究个数。进而SMD合并值 1.96 dDL± ∑wi* 其假设检验统计量 ,95%可信区间:
70
以例5-2为例,使用随机效应模型,重新分析13个预防 龋齿的随机对照研究,具体结果如表5-12。
71
26.24-(13-1) 1096 本例 = =0.013 合并标准化均属差值:-28;合并效应量假设检验: =-6.41,P<0.001,说明有统计学 意义;其95%可信区间为-0.37~0.20。同时,可以利用RevMan 完成上述分析。由于本例的异质性检验同样有统计学意义, 相对于固定效应模型的结果 (0.34~-0.23),显然随机效应模型 结果的区间范围更宽。 Q-(k-1) τ2= ∑wi-(∑wi2/ ∑wi ) dDL Z= / wi* = / /2
72
对于无统计学意义的研究,研究者可能认为 作为杂志编辑更有可能对无统计学意义的论文
四、发表偏倚的识别与分析 发表性偏倚:指有统计学意义的研究结果比 无统计学意义的研究更容易投稿和被发表,由此 而产生的偏倚。 1. 产生原因 对于无统计学意义的研究,研究者可能认为 意义不大,不发表或推迟发表。 作为杂志编辑更有可能对无统计学意义的论文 退稿。
73
2. 发表偏倚的类型 (1)临床试验阴性结果时,因缺乏信心向国际知名的 医学杂志投稿,而转投地方性杂志。 (2)非英语国家研究者,可能发表于本国的地方性杂志, 但阳性结果更愿意在国际性杂志上用英文发表,被 称为语言性偏倚 (3)有些论文不能发表,如:博士、硕士读完学位而 离开原来研究单位而未能发表。 (4)一些研究结果可能违背了经费提供方(如:制药商) 的利益,被迫搁浅不能发表。 (5)一些作者为提高知名度而一稿多投或多中心研究的 参研单位,同时报告各自部分结果,造成多重发表。
74
3. 处理和识别发表偏倚的方法 漏斗图法 剪补法 公式法 基于样本含量(或效应量标准误的倒数)与效应量(或效应量对数)所绘制的散点图。
3. 处理和识别发表偏倚的方法 漏斗图法 基于样本含量(或效应量标准误的倒数)与效应量(或效应量对数)所绘制的散点图。 其形状类似一个对称倒置的漏斗,故称为漏斗图。 绘制漏斗图,需纳入较多研究,原则上要求5个点以上才能进行 剪补法 公式法
75
图5-9所示假设为漏斗图的两种情况,左图中所有研究围绕中心线 对称排列,表明没有发表偏倚,图中空心散点代表结果无效的小样本
1 2 3 OR值或OR的对数 标 准 误 的 倒 数 图 5-9 漏 斗 示 意 图5-9所示假设为漏斗图的两种情况,左图中所有研究围绕中心线 对称排列,表明没有发表偏倚,图中空心散点代表结果无效的小样本 研究,小样本研究估计的效应量变异较大,出现效应量极端值机会要 多于大样本研究;右图,呈不对称分布,表示存在发表偏倚,所缺失 部分恰恰为结果无统计学意义的小样本研究。
76
图5-10 显示所有研究围绕中心线对称排列,表明 发表偏倚不明显,对合并效应量的影响可以忽略。
图 显示所有研究围绕中心线对称排列,表明 发表偏倚不明显,对合并效应量的影响可以忽略。 OR 0.2 0.4 0.6 0.8 1 SE(log[OR]) 图 实例5-1漏斗图
77
漏斗图提供了效应量和精度之间关系的视觉感, 但解释时则带有很大主观性,若提示可能存在出版 偏倚的检验方法有两种:一种是Begg’s等级相关
秩相关和回归分析法 漏斗图提供了效应量和精度之间关系的视觉感, 但解释时则带有很大主观性,若提示可能存在出版 偏倚的检验方法有两种:一种是Begg’s等级相关 检验,另一种是Egger’s回归分析。 Begg’s秩相关检验的统计量为秩相关系数(Kendall’st),分析标准化效应量及其方差或标准误 之间的相关性。t的解释与任何相关系数一样,0值 意味着效应量和精度之间没有关联性,偏离0值 意味着它们之间存在着相关性。 77
78
Egger’s线性回归法与秩相关检验一样,当漏斗图提示可能存在 发表偏倚时,也是一种检验偏倚大小的方法。与Begg’s秩相关检验
方法不同的是Egger采用效应量和精度的实际值而不是秩。在Egger 检验中,精度(定义为标准误的倒数)对标准正态离差进行回归。 图5-5 图5-6 78
79
五、meta回归及其他方法学进展 1. meta回归 在临床研究中,即使研究目的完全相同,总会
或多或少存在一些差别,如:药物生产厂家、剂量、 研究对象年龄、病情轻重、测量时间、随访时间等 方面有所不同,这些是结果异质性的潜在来源。若 这些因素能够被准确测量,可以选用meta回归模型 估计合并效应量。 Ti=β0+β1+Xi1+…+βpXip+ei Xi1,...,Xip为混杂因素,β0为固定效应,β1, ...,βp为偏回归系数。
80
meta回归模型可适用于RCT及病例-对照 研究等研究类型的Meta-分析,也可用于敏感性 分析。但meta回归容易产生聚集性偏倚,特别
若无异质性的影响,β1,...,βp=0,则 meta回归模型可简化为固定效应模型。 meta回归模型可适用于RCT及病例-对照 研究等研究类型的Meta-分析,也可用于敏感性 分析。但meta回归容易产生聚集性偏倚,特别 是当资料不齐或纳人分析的研究数目较少时, 不宜进行meta回归分析。 尽管上述回归模型中考虑了一些混杂因素, 仍不能完全解释研究间的变异,可进一步在模型 中加入随机效应项,该模型就成为混合效应模型。 T1=β0+β1+Xi1+…+βpXip+ui+ ei ui为随机效应项,其他与meta回归模型相同。 80
81
二乘法或极大似然估计法,能够最大限度解释 异质性来源。 缺点: 1. 若研究数目较少不能建立混合效应模型; 2. 不能进行剂量反应回归分析。
混合效应模型的参数估计可采用加权最小 二乘法或极大似然估计法,能够最大限度解释 异质性来源。 缺点: 1. 若研究数目较少不能建立混合效应模型; 2. 不能进行剂量反应回归分析。 除meta回归模型与混合效应模型外,其他 相关方法有《累积Meta-分析》,《迭代随机 效应模型》,《多水平Meta-分析》及《贝叶斯 Meta-分析》。 81
82
2.Meta分析常用软件 1)Stata Stata是目前 Meta-分析最受推崇的软件,国外高质量 杂志更倾向于接受Stata Meta分析图形界面。其下载地址: 2) R R软件是通过相应的程序包完成Meta-分析,具有功能完整、 作图精美等优点,有取代SPSS而与Stata、SAS并列为新的三大 统计学软件的趋势。下载地址: 3)RevMan软件简介 Review Manager(简称RevMan)是国际 Cochrane协作网为系统评价工作者所提供的专用免费软件,是 Cochrane系统评价的撰写与分析的一体化、标准化软件。它 包括了Cochrane系统评价的英文文字处理与Meta分析两大功能。 可以从网上免费下载,其地址为 “
83
六、慎重应用与评价Meta-分析的结果 1. 异质性检验与处理 若存在异质性且来源已知,采用meta回归模型或亚组分析
1. 异质性检验与处理 若存在异质性且来源已知,采用meta回归模型或亚组分析 若存在异质性,但异质性来源末知,可同时采用两类模型分别计算结果,其中,随机效应模型的估计结果更保守一些(即可信区间较宽)。 当假设研究间效应量虽不固定、但服从正态分布时,应选择随机效应模型的估计结果。 若异质性过大,只对结果进行一般统计描述。 83
84
2. 考察Meta-分析结果的稳健性 敏感性分析:通过改变纳入标准(特别是尚有争议的研究)、排除低质量的研究或采用不同统计方法/模型分析同一组资料,观察Meta-分析结果变化情况,借以考察其稳定性如何。
85
敏感性分析主要包括: 1) 不同效应模型 2) 不同效应尺度指标 3)剪补法 4)考察单项研究对总合并效应量的影响 5)失安全数法
6)选择模型分析法 85
86
图 5-4 合并效应量结果 以“考察单项研究对总合并效应量的影响”为例。图5- 4是合并效应量
结果,其中,中间的数值为1.31的垂直线表示总的合并效应量,左右两条 垂直线表示总的合并效应量95%CI;每项研究对应的横线表示删除该研究后剩余其他研究的合并效应量。结果发现所有研究去掉后对总合并效应量影响不大。 图 合并效应量结果 86
87
注意个体对象的特征及生物学或文化变异、干预场所、干预措施及依从性、有无辅助治疗等。
3. Meta-分析结果的适用性 多个原始研究效应量的加权平均值 注意个体对象的特征及生物学或文化变异、干预场所、干预措施及依从性、有无辅助治疗等。 不宜推荐没有Meta-分析证据支持的建议。 在无肯定性结论时,应注意区别两种情况 (1)证据不充分而不能定论 (2)有证据表明确实无效。 87
88
4. Meta-分析结果的时效性 Meta-分析的结论不是一成不变的,只是对现有资料综合分析的结果。随着新的研究资料的不断纳入充实,其结论应加以更新。
89
第四节 系统综述的评价原则 一、系统综述的结果是否真实 1. 是否是根据随机对照试验进行的系统综述? 若能很好地控制各种偏倚的影响,由此产生
第四节 系统综述的评价原则 一、系统综述的结果是否真实 1. 是否是根据随机对照试验进行的系统综述? 若能很好地控制各种偏倚的影响,由此产生 同质性好的系统综述,目前仍被认为是论证强度 最高的研究证据。
90
2. 是否采用广泛详细的检索策略检索相关文献?
从作者报告的文献检索方法中可明确收集的 文献是否全面。 全面的文献检索应包括手检相关杂志、检索 会议论文集、学位论文、厂家数据库和与已发表 文献作者联系。 如果文献检索时限制语种,也可能影响系统 综述结论。收集的文献越系统、全面,则结论受 发表偏倚的影响就越小,可信度就越大。
91
3. 是否评估纳入的单个研究的真实性? 由于系统综述多为对原始文献资料的再 分析和总结,故,除进行系统综述要严格外, 原始文献的质量非常重要,故,文中应详细 描述评价文献质量的方法。
92
4. 是否采用单个病例资料(或每个研究的合成结果)进行Meta-分析?
采用单个病例资料进行的Meta-分析被认为是Meta-分析的标尺。
93
二、系统综述的结果是否重要 1. 不同研究的结果是否一致?
1. 不同研究的结果是否一致? 若纳人系统综述的每个临床研究,其治疗效果相似或至少疗效的方向一致,则由此合成的结果可信度较高。
94
2. 系统综述的疗效大小?疗效的精确性如何? 不能通过简单比较阳性研究结果和阴性研究结果的研究个数 应该根据研究的质量和样本量的大小对不同研究给予不同的权重值并采用恰当的指标和统计方法 计算相应的可信区间
95
三、系统综述的结果是否能应用于我的病人 1. 我的病人是否与系统综述中的研究对象差异 较大,导致结果无法应用?
1. 我的病人是否与系统综述中的研究对象差异 较大,导致结果无法应用? 可通过比较自己的病人与系统综述中的研究 对象的性别、年龄、伴随疾病、疾病严重程度、 病程、依从性、文化背景、社会因素、生物学及 临床特征等方面的差异并结合临床专业知识综合 判断结果的推广应用性。
96
2. 系统综述中的干预措施在我的医院是否可行?
由于技术力量、设备条件、社会经济等因素 的限制,即使系统综述中的干预措施效果明显, 有时在自己所在的医院却不能实施,难以应用于 病人。
97
3. 自己的病人从治疗中获得的利弊如何? 任何临床决策必须权衡利弊和费用,只有 利大于弊且费用合理时才有价值应用于病人。 如:告诉一患者其患病的真实情况有助于早期 治疗和获取患者的配合,但增加了患者的心理 负担,可能降低生活质量。
98
4. 对于治疗的疗效和不良反应,自己的病人 的价值观和选择如何? 循证医学强调任何医疗决策的制订应结合 个人的专业知识和经验、当前最佳的研究 证据和患者的选择进行综合考虑,应以“ 病人”为中心而不是单纯治病,目前,越 来越强调病人参与医疗决策。
99
第五节 系统综述的应用 一、临床医疗的需要 二、科研工作的需要 三、反映学科新动态 四、医学教育的需要 五、卫生决策的需要 The end
Similar presentations