医用多元统计分析 MEDICAL MULTIVARIATE STATISTICAL ANALYSIS 1 主讲人 陶育纯 2014.4.22
第一讲 课程名称:多元统计分析 参考教材: «医学统计学与电脑实验» 年级、专业:2013公卫学院研究生 授课时间:2014年4月22日 (第二版) 方积乾 主编 上海科学技术出版社 年级、专业:2013公卫学院研究生 授课时间:2014年4月22日 授课时数:4h 2014.4.22 教案
目录 第一部分 多元统计分析简介 一、多元统计分析简介 二、医用多元统计分析简介 ㈠ 多元统计分析的概念 ㈡ 多元统计分析与单变量统计分析的区别 ㈢ 多元统计分析的重要性 二、医用多元统计分析简介 ㈠ 多元统计分析在医学上的重要性 ㈡ 医学上常用的多元统计分析方法 ㈢ 如何学好医用多元统计分析方法 2014.4.22
一、多元统计分析简介 第一部分 多元统计分析简介 ㈠ 多元统计分析概念 多元统计分析(Multivariate Statistical Analysis) 定义:是研究客观事物中多种指标间相互依赖, 相互影响的统计规律性的一种数理统计学分支。 2014.4.22
۞多元分析(Multivariate Analysis) 英国统计学家M. Kendall著名论著的书名。 二者绝大多数情况下是同一的。 因变量(Dependent Variable)指效应、指标或反应变量。即受其它因素影响的变量。 自变量(Independent Variable)指影响因素[因子(factor)]或干预措施。即不受其它因素影响的变量。 因变量 自变量 2014.4.22
۞变量水平(Level of Variable)指影响因素(因子)的水平数或干预措施的种类数。 性别 2 水平(男、女)。 性别 2 水平(男、女)。 降温方法 2 水平(甲法、乙法); 3 水平(甲法、乙法、丙法)。 个体因素 k 水平(张三、李司、王五、…)。 年龄 2 水平(青年、老年); 3 水平(少年、青年、老年) k 水平(10岁组、20岁组、 30岁组、…)。 2014.4.22
or ㈡ 多元统计分析与单变量统计分析的区别 单变量统计分析(Univariate Statistical Analysis) 1个因变量 1个自变量 or 1个因变量 k个自变量 体重 减肥药 (配对 t 检验) 红细胞计数 性别 (两样本 t 检验) 某病发病率 性别 (四格表 χ2 检验) 2014.4.22
体温 降温方法 体温 降温方法 个体因素 体温 降温方法 个体因素 年龄 (两样本 t 检验) 甲法和乙法 甲法、乙法和丙法 (单因素方差分析) 体温 降温方法 个体因素 (两个两样本 t 检验?) 甲法和乙法 甲法、乙法和丙法 (双因素方差分析? ) (配伍组方差分析? ) 体温 降温方法 个体因素 年龄 (三个两样本 t 检验?) 甲法和乙法 甲法、乙法和丙法 (三因素方差分析? ) (配伍组方差分析? ) 2014.4.22
降温方法和个体因素只能各自独立地影响体温吗? No. ۞交互作用(Interaction)指不同影响因素(因子) 的不同水平之间的搭配对因变量的影响作用。又 称交互效应。 降温方法×个体因素 称一阶(级)交互效应。 降温方法×个体因素×年龄 称二阶(级)交互效应。 依此类推。 2014.4.22
۞常常降温方法是研究者主要关心的试验(或 处理)因素,而个体因素常常是干扰(或混杂 因素),是研究者不得不关心的,常常把它 降温方法和个体因素的研究地位相同吗? Usually No. ۞常常降温方法是研究者主要关心的试验(或 处理)因素,而个体因素常常是干扰(或混杂 因素),是研究者不得不关心的,常常把它 作为区组因素处理。配伍组设计的方差分析 就是处理此类研究的方法之一。 2014.4.22
降温方法和个体因素一定存在交互作用吗? Not always. ۞当不同影响因素的不同水平之间的搭配只有 一个结果(即没有重复试验)时,不存在交 互作用。配伍组设计的方差分析就是最简单 的双因素方差分析,即没有重复实验的双因素 方差分析。 2014.4.22
晕! 降温方法和个体因素各自能独立地影响体温吗? Certainly. ۞主效应(Main Effect)指影响因素(因子)独立 地影响因变量的作用。 晕! 2014.4.22
具体以后讲吧, 降温方法和个体因素若存在交互作用,如何 处理? Analyze it. ۞现成的统计软件都提供交互作用的分析功能。 只需选择相应的选项或命令,你就可以得到 交互作用对因变量的影响程度。 具体以后讲吧, 若有时间的化 2014.4.22
到底讲什么?! 降温方法和个体因素若研究地位相同,如何 处理? Analyze it should be analyzed. ۞应该用两因素析因设计(Factorial Design )方法。 关于析因设计方法的细节参见本课程推荐的 教材的第十二章第四节。 到底讲什么?! 2014.4.22
or 三因素方差分析是多元分析吗? No. ۞只要因变量只有一个,不管有多少影响因素, 都不是严格意义的多元分析方法。 多元统计分析(Multivariate Statistical Analysis) k个因变量 k个自变量(k>1) or k个变量之间的相互影响关系(k>2) 2014.4.22
例1 用益寿宁治疗5名高血脂病人,治疗结果见下表1。 此资料若用单变量统计分析方法,可分别对x1和x2的均数与0比较。两次单样本t 检验。 2014.4.22
SPSS 结果显示,x1和x2的均数分别与0比较无统计学意义。 2014.4.22
样本均数向量(Mean Vector) p个反应变量的样本均数向量为 此资料若用多元统计分析方法,首先介绍几个跟多元统计分析有关的概念。 2014.4.22
样本协方差矩阵(Variance-covariance Matrix) x1和x2的方差分别为: x1和x2的协方差为: 2014.4.22
x1和x2的样本协方差矩阵为: p个反应变量的样本协方差矩阵为: p×p矩阵 2014.4.22
样本相关矩阵(Correlation Matrix) x1和x2的相关系数为: 变量自身的相关系数为1,即r11=r22=1。 x1和x2的相关矩阵为: 2014.4.22
p个反应变量的样本相关矩阵为: 总体均数向量( μ Vector) 2014.4.22
总体协方差矩阵( σ Matrix) p维正态分布 2014.4.22
检验均数向量 μ = μ0 检验统计量Hotelling T2 检验假设 ۞两个均数向量的比较---Hotelling T2检验 2014.4.22
SPSS General Linear Model 结果显示,P=0.048<0.05,有统计学意义,可认为益寿 宁有降血脂效果。 2014.4.22
Sum-up 1.没有全面利用多个因变量的信息。 2.当不同因变量所表现的趋势不一致时,得 不出一个概括性结论,难以作出有无统计学意义 通过上例可以看出,单变量统计分析针对多个因变量只能逐一进行分析,其存在的缺点有: 1.没有全面利用多个因变量的信息。 2.当不同因变量所表现的趋势不一致时,得 不出一个概括性结论,难以作出有无统计学意义 的明确判断。 3.不能觉察多个因变量之间的相互关系。 2014.4.22
多元统计分析针对多个因变量能统一地进行分析,其存在的优点有: 1.可以全面利用多个因变量的信息。 2.可以整合不同因变量所表现的不同趋势,得 出一个概括性结论,对整体能作出有无统计学意 义的明确判断。 3.可以觉察多个因变量之间的相互关系。 2014.4.22
没联系的因素单独或共同或协同影响的千 变万化的统一体,我们为什么要割裂它呢? 既然多元统计分析能使我们对所研究 ㈢ 多元统计分析的重要性 既然事物是由诸多可能有联系、可能 没联系的因素单独或共同或协同影响的千 变万化的统一体,我们为什么要割裂它呢? 既然多元统计分析能使我们对所研究 的事物更全面、更深刻的认识,帮助我们 透过现象看本质,发观事物之间内在的本 质规律,我们何乐而不为呢?! 2014.4.22
吸烟 饮酒 食盐量 二、医用多元统计分析简介 少量 少量 ㈠ 多元统计分析在医学上的重要性 一句话:它能帮助我们活得更长 ! 成功的案例:肺癌的影响因素分析 吸烟 饮酒 食盐量 少量 少量 2014.4.22
多因子方差分析(Univariate ANOVA) 多变量方差分析(Multivariate ANOVA) ㈡ 医学上常用的多元统计分析方法 多因子方差分析(Univariate ANOVA) 多变量方差分析(Multivariate ANOVA) 多重回归和相关(Multiple Regression and Correlation) Logistic回归 判别分析(Discriminant Analysis) 聚类分析(Cluster Analysis) 主成分分析(Principal Component Analysis) 2014.4.22
因子分析(Factor Analysis) 生存分析(Survival Analysis) 对数线性模型(Log-linear Model) 2014.4.22
⑴ 面临的困难和挑战 ㈢ 如何学好医用多元统计分析方法 ① 多元统计分析的数学理论十分复杂; ② 多元统计分析的计算步骤复杂; ③ 多元统计分析要求掌握至少一种统计软件。 ④ 多元统计分析要求掌握基本统计分析方法。 … … 2014.4.22
只要功夫深,铁棒能磨没 ! ⑵ 学习指南 ① 了解各种多元统计分析方法的适用前提条件和应用领域。 ② 掌握一种统计软件。SAS或SPSS ① 了解各种多元统计分析方法的适用前提条件和应用领域。 ② 掌握一种统计软件。SAS或SPSS ③ 正确解释软件输出的主要结果及结论。 ④ 不要该问的不问,不该问的去问。 只要功夫深,铁棒能磨没 ! 2014.4.22
⑶ 学习参考书 有关SPSS使用方法的参考书如下: 1. SPSS 与统计分析 宇传华 主编 电子工业出版社 2007.2 宇传华 主编 电子工业出版社 2007.2 2. 医学统计学与SPSS 软件应用 王彤 主编 北京大学医学出版社 2008.8 3. SPSS统计分析基础教程 张文彤 等编 高等教育出版社 2004 4. SPSS统计分析高级教程 张文彤 等编 高等教育出版社 2004 2014.4.22
有关SAS使用方法的参考书如下: 5. SPSS在医学科研中的应用 王乐三 主编 化学工业出版社 2007.7 王乐三 主编 化学工业出版社 2007.7 6. SPSS V10.0 for Windows实用基础教程 三位工作室编 北京希望电子出版社 2001 有关SAS使用方法的参考书如下: 1. SAS for Windows 统计分析系统教程 洪楠等编 电子工业出版社 2001 2. Windows SAS 6.12 & 8.0实用统计分析教程 胡良平编 军事医学科学院 2001 3. 分类数据的统计分析及SAS编程 刘勤编 复旦大学出版社 2002 2014.4.22
有关多元统计分析使用方法的参考书如下: 4. 医用统计学中的SAS统计分析 贺佳编 第二军医大学出版社 2002 5. 医学统计学与电脑实验(第二版) 方积乾编 上海科学技术出版社 2001 6. SAS 8.2统计应用教程 薛富波编 北京希望电子出版社 兵器工业出版社 2004 有关多元统计分析使用方法的参考书如下: 1. 医学统计学与电脑实验(第三版) 方积乾编 上海科学技术出版社 2006 2014.4.22
2. 现代统计学与SAS应用 胡良平 主编 军事医学科学出版社 2002 3. 卫生统计学 第6版 胡良平 主编 军事医学科学出版社 2002 3. 卫生统计学 第6版 方积乾 主编 人民卫生出版社 2008 4. SPSS统计分析高级教程 张文彤 等编 高等教育出版社 2004 5. 医用多元统计方法 张家放 主编 华中科技大学出版社 2002 6. 医用多元统计分析方法 (第二版) 陈峰 编著 北京:中国统计出版社 2007 2014.4.22
C ⑷ 学习参考网站 http://cc.jlu.edu.cn/ms.html 吉林大学课程中心《医学统计学》网站 http://cc.jlu.edu.cn/ss.html 吉林大学课程中心《统计软件应用》网站 http://www.wikipedia.org/ 维基百科 C 2014.4.22