黄建始,MB,MHPE,MPH,MBA 中国医学科学院/中国协和医科大学 流行病学特聘教授,博士生导师 院校长助理, 继续教育学院院长 如何批判性地阅读流行病学文献? 黄建始,MB,MHPE,MPH,MBA 中国医学科学院/中国协和医科大学 流行病学特聘教授,博士生导师 院校长助理, 继续教育学院院长 Pumcjesse@yahoo.com.cn
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
庞迪亚克故事(1) 美国通用汽车公司庞迪亚克厂收到一封投诉信: 尊敬的总裁先生:您好。 这是我第二次给您写信。我不埋怨您不给我回信,因为我信中的投诉有点让人觉得我可能有点“神经”。但这确实是事实: 我们家有个习惯,就是每天晚饭后大家都喜欢吃冰激淋。而且,喜欢饭后全家人投票决定吃什么类型的冰激淋。然后,我开车去超市买。
庞迪亚克故事(2) 最近我买了贵厂的庞迪亚克新车。从此,我每次去买冰激淋就会发生一件怪事。 我每次买香草素冰激淋,车就发动不了,买其他任何种类的冰激淋都没有问题,车照常发动。 我想告诉您我不是没事找事和您开玩笑,这是真的。 我想请教您:庞迪亚克轿车里有什么东西造成买香草素冰激淋车就发动不了,买其他任何种类的冰激淋都没有问题? 难道庞迪亚克轿车对香草素冰激淋“过敏”?
庞迪亚克故事(3) 庞迪亚克厂厂长很自然怀疑这封信是不是一个正常人写的。但他还是派了一个工程师去了解情况。 工程师很惊奇地发现写信人是一个很有教养的成功人士,住在一个豪华小区。 他于是安排晚饭后跟车主人一起去买冰激淋。正好,那天晚上是买香草素冰激淋。自然,车发动不起。
庞迪亚克故事(4) 工程师又去了三个晚上。第一晚,买巧克力冰激淋。车顺利发动。第二晚,买草莓冰激淋。车顺利发动。第三晚,又买香草素冰激淋。车又发动不了了。 难道他的轿车真的对香草素冰激淋“过敏”?!
庞迪亚克故事(5) 工程师是个很理性的人。他不相信轿车会对香草素冰激淋“过敏”。 怎么办? 他决定每晚都跟车观察,直到解决问题。同时,他开始记录所有的观察过程:每天时间,汽油型号,来回所需时间,等等。 在收集了几天的资料后,他发现一个规律:买香草素冰激淋的时间要比买其他的短。 为什么?
庞迪亚克故事(5) 超市商品的摆放:香草素冰激淋放在前面。 现在问题是为什么停车时间短就难发动而不是香草素冰激淋的问题了。 工程师很快就有答案了:雾化装置需要足够时间冷却才能重新发动。 亲眼看到的不一定是对的。
庞迪亚克故事告诉我们: Observation guided by scientific thinking are still the best safeguard against baloney and superstition. 科学思维指导的观察至今仍然是抵抗胡说八道和迷信的最好保证。
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
Is Epidemiology of Health An Oxymoron? “健康的流行病学”是矛盾修饰吗? 50. Act naturally 49. Found missing 48. Resident alien 47. Advanced BASIC 46. Genuine imitation 45. Airline Food 44. Good grief 43. Same difference 42. Almost exactly 41. Government organization
Oxymoron and Epidemiology of Health矛盾修饰法和健康的流行病学 40. Sanitary landfill 39. Alone together 38. Legally drunk 37. Silent scream 36. British fashion 35. Living dead 34. Small crowd 33. Business ethics 32. Soft rock 31. Butt Head
Oxymoron and Epidemiology of Health矛盾修饰法和健康的流行病学 30. Military Intelligence 29. Software documentation 28. New York culture 27. New classic 26. Sweet sorrow 25. Child proof 24. "Now, then ..." 23. Synthetic natural gas 22. Christian Scientists 21. Passive aggression
Oxymoron and Epidemiology of Health矛盾修饰法和健康的流行病学 20. Taped live 19. Clearly misunderstood 18. Peace force 17. Extinct Life 16. Temporary tax increase 15. Computer jock 14. Plastic glasses 13. Terribly pleased 12. Computer security 11. Political science
Oxymoron and Epidemiology of Health矛盾修饰法和健康的流行病学 10. Tight slacks 9. Definite maybe 8. Pretty ugly 7. Twelve-ounce pound cake 6. Diet ice cream 5. Rap music 4. Working vacation 3. Exact estimate 2. Religious tolerance 1. Microsoft Works
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
One thing I have learned in a long life: that all our science, measured against reality, is primitive and childlike — and yet it is the most precious thing we have. 在我这生中学到的一件事是:我们所有的科学, 对现实的测量, 是原始的和幼稚的, 但它仍然是我们拥有的最宝贵的东西. Albert Einstein 爱恩斯坦
All scientific work is incomplete - whether it be observational or experimental. All scientific work is liable to be upset or modified by advancing knowledge. That does not confer upon us a freedom to ignore the knowledge we already have, or to postpone the action that it appears to demand at a given time. 所有的科学工作都是未完成的-无论是观察性或实验性研究。所有的科学工作都有可能被新的知识否认或修正。这并没有赋予我们忽视现有知识的自由,也没有赋予我们在需要行动的时候延迟行动的自由。 Bradford Hill (1965)
A scientist is one who, when he does not know the answer, is rigorously disciplined to speak up and say so unashamedly, which is the essential feature by which modern science is distinguished from primitive superstition, which knew all the answers except how to say, “I do not know.” 科学家就是这样的人:当他不知道答案时,他会严谨律己毫无羞愧地公开承认。这是现代科学和原始迷信的区别。原始迷信无所不知,除了不知怎么说“我不知道。” Homer W. Smith (1895-1962)
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
Cross-sectional study Manipulation 人为操纵 实验类 观察类 描述型 分析型 Hypothesis 假说 社区试验 Community trial 相关性研究Correlational study 病例对照研究 Case-control study 横截面研究 Cross-sectional study 队列研究 Cohort study 临床试验 Clinical trial
不同流行病学研究方法证明因果关系的能力 弱 强 临床试验Clinical trial 社区试验Community trial 队列研究Cohort study 病例对照研究Case-control study 横截面研究Cross-sectional study 相关性研究Correlational study 弱
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
Statistical association is a matter of fact, whereas causality is a matter of judgment . 统计学的关联是事实的问题,因果关系则是判断的问题。
确定流行病学因果关系的框架思路 有无真实的统计学意义上的关联? 能否判断该真实的关联是否有因果关系(Hill标准)? 1.机率(Chance)? 排除偶然性 2.偏倚(Bias)? 排除虚假 3.混杂(Confounding)?排除虚假 能否判断该真实的关联是否有因果关系(Hill标准)? 1.关联的强度 (RR OR) 2.关联的合理性(是否与现有知识吻合) 3.关联的生物学可能性 4.关联的时间顺序 5.关联的剂量-反应关系 6.关联的特异性 7.关联的实验室证据
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
如何批判性评价研究文章?(1) 1.作者要回答的主要问题是什么? 主要问题下的子问题是什么? 研究目的 (什么是研究假说, 或者是提出假说的研究?) 研究问题必须在文章的第一段和摘要中清楚地阐明
如何批判性评价研究文章?(2) 2.为什么这个问题很重要? 或者说,为什么这篇文章会发表? 3.做这个研究的原因是什么: 疾病爆发,疾病聚集,或以前研究的继续? (背景资料) 4.该文章的主要结论是什么? 5.您能接受作者的研究结果吗? 能接受的理由(根据) 不能接受的理由(根据)
如何批判性评价研究文章?(3) 为什么接受或不接受? (20个要考虑的问题)
如何批判性评价研究文章?(4) 1) 研究设计是什么? (研究方法) 是否该研究设计是最合适的设计? 能否从该设计推断因果关系? 1) 研究设计是什么? (研究方法) 六个C: 相关性研究 横截面研究 病例对照研究 队列研究 社区研究 临床试验 是否该研究设计是最合适的设计? 能否从该设计推断因果关系? 是否有对照? 是否采取随机取样(是否实验性的)?
如何批判性评价研究文章?(5) 2) 研究人群的特点有哪些? 3) 研究对象是如何选择的? 4) 病例有无代表性? 是否是随机样本? 什么是符合选择条件的标准? 是否有某些疾病不在选择范围内? 4) 病例有无代表性? 5) 对照组是否除了要研究的因素外与病例基本相同有可比性? 有无配对? 6) 对照组是否能代表参照人群?
如何批判性评价研究文章?(6) 7) 参照人群是选择的人群还是普通人群? 8) 样本量是否足够大? 9) 什么是样本的取样框架? 7) 参照人群是选择的人群还是普通人群? 8) 样本量是否足够大? 有无计算把握度/检验效能? 9) 什么是样本的取样框架? 10) 统计方法用的是否正确? 11) 作者是否充分利用了资料? 是否可能做更多的分析?
如何批判性评价研究文章?(7) 12) 资料是否正确地予以分析/解释? 有无过度分析/解释? 既作者的解释是否和资料一致? 12) 资料是否正确地予以分析/解释? 有无过度分析/解释? 既作者的解释是否和资料一致? 是否超过资料过度发挥? 对资料有无其他同样站得住脚的解释? 13) 病例或研究终点是怎么决定的? 决定疾病状态的标准是否合适?
如何批判性评价研究文章?(8) 14) 暴露是怎么决定的? 决定暴露状态的标准是否合适? 面试的资料是否经过其他方法确认? 14) 暴露是怎么决定的? 决定暴露状态的标准是否合适? 面试的资料是否经过其他方法确认? 15) 如果使用了实验室手段,实验室手段是否合适? 16) 采用了什么样的盲法? 单盲法? 双盲法? 三盲法?
如何批判性评价研究文章?(9) 17) 是否随机? 怎么随机? 需要随机吗? 18) 随访是否完整? 时间是否足够长? 时间是否太长了? 17) 是否随机? 怎么随机? 需要随机吗? 18) 随访是否完整? 时间是否足够长? 时间是否太长了? 19) 随访中有多少失访, 有多少无应答? 应答率或参与率是否合适? 是否各组(类)研究对象的失访率或不参与率有明显不同?
如何批判性评价研究文章?(10) 20) 该研究结果提示还应做什么样的进一步研究?
如何批判性评价研究文章?(11) 是否很明显,即是否会使研究结果不真实(虚假)? 6. 列出所有实际发生了的和潜在的偏倚。 是否很明显,即是否会使研究结果不真实(虚假)? 作者是否坦率地讨论了潜在的偏倚并回答了您试图处理这些偏倚时存在的疑问? 7.列出所有实际发生了的和潜在的混杂。 测量和控制了那些混杂? 这些测量和控制是否合适? 有无可能存在的没有测量和控制的混杂?
如何批判性评价研究文章?(12) 8. 统计学方法是否合适? 在分析中有没有控制混杂? 是否有更好的统计学方法? 8. 统计学方法是否合适? 在分析中有没有控制混杂? 是否有更好的统计学方法? 9. 表格是否设计合理,是否信息一目了然? a. 表格中有无错误? b. 表格有无标题和标记? c. 表格是否正确标记?
如何批判性评价研究文章?(13) 10. 图表和图象是否信息一目了然? a. 图表的标记有无不成比例? b. 图表有无完整的标记? 10. 图表和图象是否信息一目了然? a. 图表的标记有无不成比例? b. 图表有无完整的标记? c. 图表标记是否正确? 11. 文章讨论部分是否涉及其他相关重要研究以助于您更好地理解本研究? a. 讨论部分是否提出进一步需要探讨的问题? b. 讨论部分是否提到其他不同的解释或不同的观点?
如何批判性评价研究文章?(14) 12. 文章中的所有引文能否在文后的参考文献中找到? 所有列出的参考文献是否完整? 12. 文章中的所有引文能否在文后的参考文献中找到? 所有列出的参考文献是否完整? 如果您想进一步阅读是否可以找到? 参考文献是否尽可能广泛地包括了已发表的文献? 是否有许多未发表的或非公开的材料? 作者是否仅仅引用自己的文章?
如何批判性评价研究文章?(15) 13. 该研究是谁买单的? 研究赞助者和研究结果有无利益关系? 14. 现在您能接受作者的研究结果吗? 13. 该研究是谁买单的? 研究赞助者和研究结果有无利益关系? 14. 现在您能接受作者的研究结果吗? 能接受的理由(根据) 不能接受的理由(根据)
今晚要讨论的内容 庞迪亚克故事 矛盾修饰法和健康的流行病学 三句我喜欢的话 流行病学研究方法分类 确定流行病学因果关系的框架思路 如何批判性评价研究文章? 批判性地评价文章:中国男性和女性的主要死亡原因 He, J Gu, DF et al.Major Causes of Death among Men and Women in China,N Engl J Med, 353:11, p1124-34,2005
如何批判性评价研究文章?(简明版) 暴露: 危险因素 表 1 结果: 死亡 假说: 表 3 2. 研究设计 观察性/实验性: 观察性 1. 研究目的 p1125 暴露: 危险因素 表 1 结果: 死亡 假说: 表 3 2. 研究设计 观察性/实验性: 观察性 描述型/分析型: 分析 研究类型 (6 个C): 前瞻性队列研究 研究人群: p1125 分析: p1126
3.发现/结论(1) 如何批判性评价研究文章?(简明版) 有无真实的统计学意义上的关联? 1.机率(Chance)? CI 表 3 2.偏倚(Bias)? p1132-3 3.混杂(Confounding)?控制
3. 发现/结论(2) 如何批判性评价研究文章?(简明版) 能否判断该真实的关联是否有因果关系(Hill标准)? 3. 发现/结论(2) 能否判断该真实的关联是否有因果关系(Hill标准)? 1.关联的强度 (RR OR) 表 3 2.关联的合理性(是否与现有知识吻合) 合理 3.关联的生物学可能性 有 4.关联的时间顺序 有 5.关联的剂量-反应关系 无证据 6.关联的特异性 无证据 7.关联的实验室证据 其他研究
表1. 169,871名研究对象的基线特征* 年龄 (岁) 55.5±10.6 56.2±11.0 高等教育比例(%) 31.0 17.2 目前吸烟(%) 63.0 13.7 目前饮酒(%) 37.4 2.8 体力活动分类(%) † 低 38.9 34.5 中 15.0 33.3 高 46.2 32.2 体重指数(%) 22.4±3.4 22.8±3.9 <18.5 10.8 12.5 18.5-24.9 67.9 61.4 ≥25.0 21.3 26.1 血压(mmHg) 收缩压 126.2±21.1 126.8±23.9 舒张压 78.4±12.0 76.3±12.2 高血压(%) ‡ 27.4 28.0 自报糖尿病(%) 1.7 1.8 北方居民(%) 61.9 59.0 表1. 169,871名研究对象的基线特征* 基线特征* 男性(N=83,533) 女性(N=86,338) 城市居民(%) 60.5 56.0
表3 各危险因素的全死因相关危险度(RR)和人群归因危险度(PAR)* 总 体 合计 1.48(1.44-1.53) 11.7 1.23(1.18-1.27) 7.9 1.20(1.16-1.24) 6.8 1.47(1.42-1.53) 5.2 男性 1.48(1.43-1.55) 1.18(1.13-1.23) 10.0 1.21(1.16-1.27) 7.7 1.45(1.38-1.53) 4.6 女性 1.48(1.41-1.55) 11.8 1.27(1.19-1.34) 3.5 1.20(1.14-1.26) 6.5 1.49(1.41-1.58) 5.8 居住地 城市 1.48(1.42-1.55) 13.2 1.32(1.26-1.38) 10.5 1.13(1.08-1.18) 6.3 1.63(1.53-1.73) 4.3 1.50(1.42-1.58) 13.6 1.29(1.22-1.37) 14.3 1.07(1.01-1.14) 3.6 1.61(1.49-1.76) 4.1 1.47(1.38-1.57) 12.8 1.36(1.26-1.46) 5.0 1.19(1.12-1.27) 9.1 1.63(1.50-1.78) 4.5 农村 1.49(1.42-1.56) 1.10(1.04-1.16) 3.9 1.43(1.35-1.51) 4.2 1.40(1.33-1.47) 6.9 1.48(1.39-1.57) 1.08(0.02-1.16) 5.7 1.49(1.39-1.60) 5.3 1.39(1.30-1.48) 1.50(1.40-1.61) 10.8 1.12(1.02-1.23) 1.5 1.34(1.23-1.45) 3.1 1.41(1.31-1.52) 7.5 地 域 北方 1.43(1.38-1.48) 11.6 1.23(1.18-1.28) 8.2 1.20(1.15-1.25) 1.47(1.40-1.56) 3.4 1.44(1.37-1.51) 1.17(1.11-1.23) 9.2 1.17(1.11-1.24) 5.9 1.45(1.35-1.56) 3.0 1.42(1.34-1.51) 11.5 1.28(1.20-1.37) 4.7 1.25(1.17-1.33) 8.1 1.49(1.38-1.62) 南方 1.59(1.51-1.68) 12.0 1.25(1.18-1.33) 8.0 1.21(1.14-1.28) 7.3 1.48(1.40-1.56) 8.5 1.59(1.48-1.71) 1.23(1.14-1.32) 13.3 1.36(1.25-1.49) 13.5 1.46(1.36-1.58) 表3 各危险因素的全死因相关危险度(RR)和人群归因危险度(PAR)* 变 量 高血压 吸烟 较少体力活动 体重过低 RR(95% Cl) PAR (%) RR (95% Cl) 1.59(1.47-1.72) 12.2 1.23(1.10-1.38) 1.6 1.12(1.03-1.21) 1.50(1.39-1.63) 9.0
如何批判性评价研究文章?(简明版) 证明因果关系的能力 中等 5. 评论 设计严谨,科学合理,可谓样板 样本量很大 4. 研究结果的效益 中等 证明因果关系的能力 中等 5. 评论 设计严谨,科学合理,可谓样板 样本量很大 填补了国内/发展中国家的空白 发现/证明了中国死亡谱的变化 公共卫生意义重大
评价表 ____________________________________________________________________________ Rating Scale 10 Superior, outstanding 5 Not quite what was expected 9 Very good 4 Less than expected 8 Much better than expected 3 Much less than expected 7 Better than expected 2 Considerably less than expected 6 What was expected 1 Pure charity 0 Better left unsaid Factor Strong Weak 1. Organization There is a statement of purpose, 10 0 methodology and a summary statement Comments:______________________ 2. Planning There is evidence of rehearsing; the 10 0 presentation flowed smoothly and was properly paced Comments:_______________________ 3. Visual Aids Adequate use of overhead projector, 10 0 handouts. flipcharts, video tapes and/or other demonstrations Comments:________________________ 4. Speaker Enthusiasm Displayed adequate knowledge of the 10 0 subject, and exhibited sufficient Comments:________________________ self-confidence 5. Voice Projection Good articulation, proper delivery rate, 10 0 no distracting gestures (i.e. chewing gum, Comments:_______________________ too many “uhs”, etc) 6. Contents 10 0 Provide good substantial public health Comments:_______________________ information
谢谢 欢迎宝贵意见