Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM 翻译:acred(DXY) 统计学傻瓜指南! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM 翻译:acred(DXY)
定义 统计学是搜集、整理、 总结、分析数据以及 依据数据进行推断的科学 统计描述,包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来 统计推断,包括进行推测、假设检验、确定关系然后作出预测
变量 定量的(Quantitative) 离散的(Discrete) 连续的(Continuous) 定性的(Qualitative) 有序的(Ordinal) 分类的(Categorical)
参数检验与非参数检验 参数检验:需要知道样本统计量的分布才能作出决断 非参数检验:不需要知道样本统计量的分布就可以作出决断
t-检验 在样本中比较连续变量的平均数,以检验两个均值之间的差异是否大于能被机遇所解释的差异 均值有差异,概率是多少?
应用条件 观测值(变量)相互独立 从正态分布的总体中抽样得到 样本量<30;如果>30,则使用正态曲线的z检验(二项检验,binomial test)
t-检验的类型 单样本t检验:某个变量的样本均数与给定总体的已知均数相比,其差异是否有意义
χ2检验 用来检验定性变量间关联的强度 用于分类数据
应用条件 数据应以频数的形式呈现 被观察的病例总数应大于20 任一类别或单元格内的理论频数应>5(当任一单元格观测频数<5:yate’s 校正)或(当任一单元格理论频数<5:fisher精确概率) 相比较的组别应大致相似
相关与回归 研究两个或两个以上变量之间关联的强度以及函数关系的方法
相关 指明变量间关联的强度 r=+1 r=-1 r=0 曲线
回归 揭示一个因变量与一个或多个自变量间数学关系的方法 简单线性回归和多重回归适用于连续变量如血压、体重 Logistic回归适用于二值响应,如生/死
测量值 若为参数 若为非参数 Pearson相关系数 Spearman等级相关 Kendall等级相关 (Kendall’s τ) 连续变量 线性关系 若为非参数 Spearman等级相关 两个均为连续变量 Kendall等级相关 (Kendall’s τ) 两个均为有序变量或一个有序另一个连续
方差分析(ANOVA) 用来揭示作用于一个因变量的几个分类自变量(称为因素)的主效应和交互效应
方差分析的类型 单因素方差分析(One-way ANOVA):检验一个因变量在一个分类自变量两组、三组或多组类别间的差异
两因素方差分析(Two-way ANOVA):分析一个因变量在两个自变量所形成的组间的差异,其中一个自变量可看作处理变量 多因素方差分析*(n-way ANOVA):简言之,多因素方差分析处理多个自变量。应当注意,自变量的个数越多,可能的交互作用的数量也随之增多
如何选择恰当的统计检验方法 变量类型 所研究问题的类型 数据的构成 定量的(血压) 定性的(性别) 关联 比较 危险因素 独立的 配对的 匹配的
所研究的中心问题 两变量(因变量,自变量)之间的联系 变量类型 检验方法 因变量 自变量 分类 χ2 定量 Logistic回归 2个结局:T检验 3个以上结局:方差分析 Spearman相关 线性回归
变量间比较(差异) 变量 自变量的个数 2组 配对数据 >2组 定量 T检验 配对T检验 方差分析 有序 Mann-Whitney Wilcoxon Kruskal-wallis 分类 χ2 * McNemar χ2 *有1个单元格理论频数<5,用fisher精确概率法 有1个单元格观测频数<5,用yate’s校正
寻找危险因素 变量类型 检验方法 因变量 多个自变量 分类 logistic回归 定量 方差分析 线性回归,logistic回归