医学期刊统计学审稿 应注意的问题 卫生统计学教研室 易 东
医学论著的基本结构 摘 要 Abstract 引 言 Introduction Results Discussion 2. 结 果 摘 要 Abstract 引 言 2. 结 果 Introduction Results 1. 材料与方法 3. 讨 论 Materials and Methods Discussion
摘 要 Abstract 对处理组和对照组的主要统计结果进行概述: 均数(中位数、率),标准差(标准误), P 值; 两组均数(率)之差或者OR值,95%可信区间(CI); 多个观察指标的相关系数及其P 值等.
材料与方法 Materials and Methods 研究设计方案 (Design of Research Methods) 统计表达 统计分析方法及软件 (Analysis Methods and Software) 目的:以使读者确认论文中所有统计分析结果的 可靠性和研究结论的合理性。
材料与方法 Materials and Methods (Design of Research Methods) 科研设计涉及的方面 (Design of Research Methods) 研究对象的来源和选择方法,包括观察对象的基本情况;病例入选标准、剔除标准; 对照的设置; 随机化分组情况; 样本量; 均衡性原则:影响因素(如年龄、性别、病情)
完全随机分组 Completely
完全随机分组 Completely
临床随机分组 Completely
临床随机分组
均衡性分析结果 表 三组观察对象的性别、年龄、病程的比较 组别 观察例数 年龄(岁) 病程(年) 总 男 女 正常对照组 29 15 14 表 三组观察对象的性别、年龄、病程的比较 组别 观察例数 年龄(岁) 病程(年) 总 男 女 正常对照组 29 15 14 59±10 — 糖尿病无微血管病变组 24 10 62±8 4.4±3.2 糖尿病有微血管病变组 27 19 8 67±7 6.8±3.9
样本量估计的依据(Sample Size) 估计样本含量的条件: 第一类错误的概率α,即检验水准; 检验效能1-β。β为第二类错误的概率; 1-β是指备择假设正确时将发现它的能力。 容许误差或差值δ; 总体标准差σ或总体率;
科研设计问题 随机分组问题 例1 我科采取随机原则,将2004 年3 —6 月间来我院呼吸门诊看病的患儿归为治疗组, 将同年7 —10 月间来我院呼吸门诊看病的患儿归为对照组,通过给予两组不同的处理方法,最终得出治疗组疗效优于对照组的结论。
科研设计问题 随机分组问题 例2 某研究共有小鼠40 只,实验人员用手在笼中随机抓取20 只作为实验组,剩下的20 只作为对照组,两组分别给予不同的药物治疗,最终得出实验组疗效优于对照组的结论。
试验的样本量非常小
试验的对照设计 例3 在一项探讨颈椎病疗效的研究中,给予一组患者电针刺激及牵引治疗,经过半年治疗后,与治疗前进行比较,发现患者颈椎功能及相关症状均较治疗前有明显好转,然后得出电针刺激及牵引治疗颈椎病有效的结论。
材料与方法 Materials and Methods (Analysis Methods and Software) 统计分析方法及软件 (Analysis Methods and Software) 常用统计方法简单说明: 如 检验、t 检验、单因素方差分析(ANOVA)、多因素方差分析; 特殊的统计方法给出相应的参考文献: 如聚类分析(Cluster)、生存分析(Survival Analysis)等;
材料与方法 Materials and Methods (Analysis Methods and Software) 统计分析方法及软件 (Analysis Methods and Software) 一般统计计算软件给出名称 如SPSS、SAS、STATA等,EXCEL不能作为处理软件 特殊的计算软件要给出软件的过程名
统计方法的正确选择
统计学方法问题
t检验不是处理计数资料的万能方法
卡方检验不是处理计数资料的万能方法 双向无序,两个分类变量皆为无序分类变量,一般用卡方检验。 单向有序资料,采用秩和检验。 双向有序且属性相同,研究目的通常是分析两种检测方法的一致性,此时应用一致性检验。 双向有序属性不同,根据具体情况可选择秩和检验,等级相关分析或者线性趋势检验。
卡方检验
秩和检验或Ridit分析
Mc-Nemar检验、一致性检验
线性趋势检验、秩和检验
错误应用统计学方法 I — 将多个组比较的ANOVA 错误应用统计学方法 II — 将重复测量数据处理 “材料与方法”统计表达的常见问题 统计方法问题 错误应用统计学方法 I — 将多个组比较的ANOVA 误用t检验处理 错误应用统计学方法 II — 将重复测量数据处理 误用t检验或ANOVA处理 错误应用统计学方法 III — 非参数检验 误用t检验或ANOVA处理
错误应用统计学方法 I — 将多个组比较的ANOVA 误用t检验处理
错误应用统计学方法 II — 将重复测量数据处理 误用t检验或ANOVA处理
错误应用统计学方法 II — 将重复测量数据处理 误用t检验或ANOVA处理
大豆黄酮对肿瘤细胞合成影响效应关系 数据不满足方差分析的条件,对于重复测量数据应该采用重复测量数据的方差分析。
错误应用统计学方法 III — 非参数检验 误用t检验或ANOVA处理
错误应用统计学方法 III — 非参数检验 误用t检验或ANOVA处理
错误应用统计学方法 IV —非参数检验用卡方检验代替
结 果 Results 统计表达 统计图表 (Statistical Graphs & Tables) P 值的表达 (Suitable Expression of P) 统计表达 数据精度 (Numerical Precision) 统计指标 (Statistical Indexes)
结 果 Results 统计表的应用: ▲三线表 ▲自明性
统计表的应用:三线表
统计表的应用:自明性
统计表的应用:自明性
(Non-normal Distribution) (Normal Distribution) 原则:选择最恰当的统计指标准确描述资料的特征。 非正态分布 (Non-normal Distribution) 计量资料 (Measurement Data) 正态分布 (Normal Distribution) 计数资料 (Count Data) 率或比 (Rate or Ratio)
关于 应用条件:只有属于正态分布的数据才可以表示为 ,虽属于正态分布,但 出现负数 (即 <s时,如血清 出现负数)时不能用 表示,此时宜用最大值、最小值、四分位间距和中位数。
P 值的表达 传统表达 P >0.05 记为“NS”, P≤0.05 记为“*”, P≤0.01 记为“**” 提倡表达
P 值的表达 编辑审查的重点应在对P值含义的描述上。常有作者把P < 0.05描述为2组有显著差异( P < 0.05) ,实际上P < 0.05 的含义在于说明有理由认为对比事物间存在差异,而非说明差异的大小;因此,规范化的描述应为差异具有显著性意义( P < 0.05) 。 在P >0.05即尚无理由认为存在差异时只能描述为无统计学意义,但绝不能解释为无差异。当作者认为P >0.05但临床上有实际意义时,不可主观认定其临床意义,编辑应要求作者在分析P > 0105但有临床意义的可能原因(如例数过少、研究深度不够等)后对结果进行客观描述。
THANKS