研究生教学用书《医学统计学(第三版)》 第一章 绪论
一、什么是医学统计学? 统计活动、统计工作 统计指标(statistic) 统计学(statistics) 关于数据(data)收集(collection)、整理(organization)、分析(analysis)、解释(interpretation)与表达(presentation)的科学。 Statistics is the study of the collection, organization, analysis, interpretation, and presentation of data.. ---Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms OUP. ISBN 0-19-920613-9
医学统计学(medical statistics): 用统计学的原理和方法研究生物 医学现象的应用科学。 根据研究领域和研究对象,统计学又分为: 数理统计、经济统计、生物统计、 医学统计、卫生统计、…… 医学统计学(medical statistics): 用统计学的原理和方法研究生物 医学现象的应用科学。 教材:医学科研的数据收集、整理和分析的应用科学
1. 描述统计学(descriptive statistics ) 卫生统计学(health statistics):用统计数字(指标)描述社会、人群乃至于生态的“健康”问题(见本书附录一)。
人口统计 期望寿命(岁) 人口总数(千) 年增长率 (%) 负担系数 (per 100) 60岁以上老年人口比(%) 总和 生育率 男女合计 2003 1993-2003 1993 不确定性 中国 1 311 709 0.9 49 43 9.0 10.5 1.9 1.8 71 70 - 72 新加坡 4 253 2.6 38 40 8.9 11.4 1.7 1.3 80 79 印度 1 065 462 68 61 7.0 7.8 3.8 3.0 62 日本 127 654 0.2 19.3 25.0 1.5 82 澳大利亚 8 116 48 47 19.8 21.6 77 81 美国 294 043 1.1 52 51 16.3 2.1 78 英国 59 251 0.3 54 21.0 20.8 1.6 德国 82 476 46 20.5 24.4 1.4 观察单位为“国家”,60岁以上老年人口比超过10%,为老龄化社会。期望寿命(岁)的不确定性说明地区差异。 负担系数:非劳动人口的比例(<14,>64),总和生育率:平均每个妇女生育子女数(活产)pp790-791
2. 推论统计学(inferential statistics ) 用样本试验结果推断是否对总体适用? 1948年,BMJ发表了107名患者肺结核患者的治疗结果: 试验组:链霉素+卧床,n=55,p=93% 对照组:单纯卧床,n=52,p=73% 对所有肺结核患者都有同样效果?
二、统计学是什么? 1. 是关于收集和分析数据的科学和艺术 《不列颠百科全书》 首先,统计学是科学,不是像音乐、美术那样属于艺术的范畴。 http://math.cersp.com/Specialty/ChuZh/Subject/200611/2581.html “艺术”是“对令人困惑费解的问题作出数字设想”。
统计学是医学科研工作者必须掌握的通用语言。 2. 是一个现代人知识结构中应具备的成分,是一个人的人文素质的一部分。正如英国学者威尔斯所说:“统计的思维方法,就像读和写的能力一样,将来有一天会成为效率公民的必备能力”。 陈希孺 http://math.cersp.com/Specialty/ChuZh/Subject/200611/2581.html 统计学是医学科研工作者必须掌握的通用语言。
统计是用数字反映真实世界,尽管有误差。统计学希望误差越小越好,艺术家希望误差越大越好。 统计与艺术的区别: 统计是用数字反映真实世界,尽管有误差。统计学希望误差越小越好,艺术家希望误差越大越好。 http://www.jstor.org/discover/10.2307/2277875?uid=16798288&uid=3737800&uid=2129&uid=2&uid=70&uid=4&uid=62&sid=21101032630053
"There are three kinds of lies: lies, damned lies, and statistics". 3. 是谎言? "There are three kinds of lies: lies, damned lies, and statistics". Darrell Huff,(1954) How to Lie With Statistics, WW Norton & Company, Inc. New York, NY. ISBN 0-393-31072-8 http://en.wikipedia.org/wiki/How_to_Lie_With_Statistics
统计指标误用! (1)用相关表示“因果联系” (2)样本没代表性,群众“被代表” (3)图表的“误导”读者 (4)错误使用统计指标 龙年春天得一子,同时植树一颗, 每月测小孩身长和树高, 身长和树高相关系数=0.78, 该子为神童,能控制树木生长? http://math.cersp.com/Specialty/ChuZh/Subject/200611/2581.html
某企业员工10人, 服务员月薪2000元,总经理月薪22000元, 员工平均工资=4000元?
三、为什么要学习 医学统计学? 1.学会驾驭变异性(variation) 变异性是社会和生物医学中的普遍现象。 变异有规律吗? WHO报告中国期望寿命:平均 71(岁) 实际上每个人的实际寿命是不确定,有些用现有的知识可以解释,有些不能解释。统计试图为不能解释的问题(困惑费解的问题)提供线索和依据。 变异有规律吗?
120名正常成年男子红细胞计数值(1012/L) 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.24 5.45 4.32 4.84 4.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.46 4.66 4.20 4.21 3.73 5.17 5.79 4.49 4.85 5.28 4.78 4.94 5.21 4.68 5.26 3.84 4.17 4.56 3.52 6.00 4.05 4.92 4.87 4.28 4.46 5.03 5.69 5.53 4.86 4.97 4.70 4.37 5.33 4.75 5.39 5.27 6.18 4.13 5.22 4.44 4.43 4.02 5.86 5.36 3.86 5.48 5.31 4.53 4.83 4.11 3.29 4.18 4.06 3.42 4.52 5.19 3.70 5.51 4.93 3.92 5.04 4.54 3.95 4.40 3.77 4.16 5.35 3.71 4.80
算术均数=4.72,标准差=0.57。 最大值=6.18, 最小值=3.29, 极差=2.89。 红细胞正常值男性为4~5.5×1012/L,女性为3.5~5.0×1012/L 最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。
在许多研究领域,特别是在生物医学研究领域,实验或观察结果往往是不确定现象。描述不确定现象、通过重复观察发现不确定现象背后隐藏的统计学规律是统计方法的显著特征。
2. 设计你的研究 随机对照试验,Randomized Controlled Trial(RCT) 按试验对象划分(实验室、动物、临床、现场),按研究的方向性划分(纵向研究、断面研究) 按是否施加干预划分(实验性、观察性)。按是否随机对照划分(RCT、非RCT)。 RCT不一定是最好的医学研究方法(伦理学限制) 随机对照试验,Randomized Controlled Trial(RCT) 不一定是最好的医学研究方法, 但是最好的试验方法。
3. 论文的统计学审查(作者\编者\读者) 国际生物医学杂志编辑协会一般要求(包含了统计学要求): Uniform Requirements for Manuscripts Submitted to Biomedical Journals 国际医学杂志编辑委员会对随机对照试验论文报告要求: CONSORT (Consolidated Standards of Reporting Trials) http://www.consort-statement.org/Statement/revisedstatement.htm#ref5
论文段(主题) 序号 题目与摘要 1 统计方法 12 序言 (研究背景) 2 结果 参与方的流程图检查 13 方法与参与方 3 入组 14 干预 4 基线数据 15 研究对象 5 分析例数 16 6 描述统计量与估计值 17 样本量 7 辅助的分析 18 随机分组(随机数) 8 不良反应 19 随机分组(密封的方案) 9 讨论与结果解释 20 随机分组(处理) 10 推论的一般性 21 盲法实施(遮蔽) 11 综合结论(证据) 22
在全世界报告的122 个关于Selective Serotonin Reuptake Inhibitors (SSRI) 抗抑郁作用的RCT研究报告中,仅有一个(0.8%)报告符合CONSORT的描述规范。 The costs and consequences of small trials in depression: a systematic review of methodology. J Epidemiol Community Health 1997;51:354-358.
4. 统计学结论是重要的科学证据之一 “良好愿望的医学”(well-meaning medicine)转入“基于证据的医学” (evidence-based medicine,EBM)。 所有临床试验的结果都是先有统计学结论(统计指标比较、P 值),再给出专业结论。 全世界的医学期刊每年大约刊登600万学术论文,但不一定都是可靠“证据”。 90年代中期,仅一半RCT的研究论文能被检索到;1999底,还有 10万RCT的研究论文不能被检索到。Egger M, Smith GD, Altman DG, eds. Systematic reviews in health care: meta-analysis in context. London: BMJ Books: 2001:69-86.
有关教学安排 练习与作业: 作业本:姓名、学号、英语分班 成绩:平时作业+期末考试 课代表:研究生、课程班、7年制 姓名、电话
教学课件下载网址: SPSS v13.0下载链接: 数据文件 exceldata.exe SPSS计算程序 exercise2010.sps http://statistics.fmmu.edu.cn/ 课程资源-电子讲稿 教学ppt, 数据文件 exceldata.exe SPSS计算程序 exercise2010.sps SPSS v13.0下载链接: ftp://ftp.fmmu.edu.cn/software/%CD%B3%BC%C6%BC%C6%CB%E3/SPSS14.rar
计算器(推荐) CASIO fx-180P, CASIO fx-3600P X, Y, XY, X, ,r
运行exceldata.exe 在目录“exceldata”下 运行文件:教学实习数据 获取你的第一批数据资料: 3. 填写姓名、学号
SN=序号,group=分组,OBS=病历号, X1=住院费用,X2=年龄,X3=身高,X4=性别, 5. 在C盘temp文件夹找到Excel数据文件 exceldata SN=序号,group=分组,OBS=病历号, X1=住院费用,X2=年龄,X3=身高,X4=性别, X5=费别,X6=治疗结果,X7=死亡标志, 6. 描述试验结果: 观察人数?平均费用?男性人数,女性人数, 费别分布?治疗结果分布?死亡人数?男性平均身高、体重?女性平均身高、体重? 7. 统计方法: 手工、计算器、Excel函数、SPSS,SAS,R,……
练习题 1.作为硕士研究生,为什么要学习医学统计学? 2.下载相关教学课件,获得你的临床观察数据,做描述性统计。