第12章 连续变量的统计推断(二)――单因素方差分析 (续)
第12章 连续变量的统计推断(二)――单因素方差分析(续) 12.2 均数间的多重比较 12.3 各组均数的精细比较 12.4 组间均数变化的趋势检验 12.5 本章小结
12.2 均数间的多重比较 12.2.1 直接校正检验水准 12.2.2 专用的两两比较方法 12.2.3 两两比较方法的选择策略 12.2 均数间的多重比较 12.2.1 直接校正检验水准 12.2.2 专用的两两比较方法 12.2.3 两两比较方法的选择策略 12.2.4 多重比较结果出现矛盾时的解释 12.2.5 分析实例
12.2.1 直接校正检验水准 例12.3比较产自美国,日本,欧洲的汽车,考察其每千米耗油量有无差异。 12.2.1 直接校正检验水准 例12.3比较产自美国,日本,欧洲的汽车,考察其每千米耗油量有无差异。 方差分析结果拒绝原假设H0,表明各国汽车耗油量有显著性差异的。 拒绝原假设 即均值之间有显著性差异,这是个整体结论,究竟哪些均值之间有显著性差异?哪些均值之间没有显著性差异?方差分析并没有回答。这需要做: 多重比较检验 对比检验和趋势检验
12.2.1 直接校正检验水准 现在问题回到了两两比较上,关键就是如何控制好第一类错误的大小。 Sidak校正: 12.2.1 直接校正检验水准 现在问题回到了两两比较上,关键就是如何控制好第一类错误的大小。 Sidak校正: 将总的alpha水平控制到0.05,按各次比较的一类错误与总错误累乘的关系,反推得出每一个检验所使用的 其中两两比较次数c=k(k-1)/2。
12.2.1 直接校正检验水准 Bonferroni校正: 12.2.1 直接校正检验水准 Bonferroni校正: 将总的alpha水平控制到0.05,按各次比较的一类错误与总错误累加的关系,反推得出每一个检验所使用的alpha/c,其中两两比较次数c=k(k-1)/2。 Bonferroni校正等直接校正方法是各次比较分别进行,使用上比较麻烦。它保证最大试验误差概率不大于alpha,所得结论比较保守。
12.2.2 专用的两两比较方法 除了相对粗糙的直接矫正法外,针对不同的分析需求,统计学上还发展出了一系列专用的两两比较方法。 12.2.2 专用的两两比较方法 除了相对粗糙的直接矫正法外,针对不同的分析需求,统计学上还发展出了一系列专用的两两比较方法。 多重比较分为两种类型: 计划好的: 事先设定考察的特定组,在Contrast 中进行。 非计划好的: 探索性分析,在Post Hoc 对话框中进行。
12.2.2 专用的两两比较方法 非计划的多重比较方法 LSD法: 12.2.2 专用的两两比较方法 非计划的多重比较方法 LSD法: 即最小显著差法(Least Significance Difference Method),是最简单的比较方法之一。 用t检验完成各组均值间的配对比较,对多重比较误差率不进行校正。
12.2.2 专用的两两比较方法 非计划的多重比较方法 Sidak法: 实际上是Sidak校正在LSD法上的应用。 12.2.2 专用的两两比较方法 非计划的多重比较方法 Sidak法: 实际上是Sidak校正在LSD法上的应用。 用t检验完成各组均值间的配对比较,对多重比较误差率进行校正。 Sidak法比LSD法保守得多。
12.2.2 专用的两两比较方法 非计划的多重比较方法 Bonferroni法: 实际上是Bonferroni校正在LSD法上的应用。 12.2.2 专用的两两比较方法 非计划的多重比较方法 Bonferroni法: 实际上是Bonferroni校正在LSD法上的应用。 用t检验完成各组均值间的配对比较,对多重比较误差率进行校正。 Bonferroni法比Sidak法保守一些。
12.2.2 专用的两两比较方法 非计划的多重比较方法 Scheffe法: Dunnett法: 12.2.2 专用的两两比较方法 非计划的多重比较方法 Scheffe法: 对多组均数间的线性组合是否为0进行检验,即(Contrast) Dunnett法: 常用于多个实验组与一个对照组间的比较 设定此法后,激活Control Category 参数框,展开小菜单,选择对照组。
12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: S-N-K法: 全称Student-Newman-Keuls法 12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: S-N-K法: 全称Student-Newman-Keuls法 利用Studentized Range 分布进行所有各组均值间的配对比较。 根据所要检验的均数个数调整总的一类错误概率不超过alpha.
12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: Tukey法: 12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: Tukey法: 全称Tukey’s Honestly Significant Difference 利用Studentized Range 分布进行所有各组均值间的配对比较。 与S-N-k法不同地是,它控制所有比较中最大的一类错误概率不超过alpha.
12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: Duncan法: 在方差不齐时,一般不进行方差分析。 12.2.2 专用的两两比较方法 寻找同质亚组的检验方法: Duncan法: 与S-N-k法类似,利用Duncan’s Multiple Range 分布进行所有各组均值间的配对比较 在方差不齐时,一般不进行方差分析。 Significance level 框定义多重比较的检验水准,默认为0.05.
12.2.3 两两比较方法的选择策略 计划好的 如两个均数间的比较是独立的,或者虽有多个样本均数,但事先计划好要作某几对均数的比较,则不管方差分析的结果如何,均应进行比较。 一般采用LSD法或者Bonferroni法。
12.2.3 两两比较方法的选择策略 非计划好的 多个实验组与一个对照组的比较,一般采用Dunnett法。 12.2.3 两两比较方法的选择策略 非计划好的 多个实验组与一个对照组的比较,一般采用Dunnett法。 需要进行任意两组间的比较而各组样本含量相同,选用Tukey法。 需要进行任意两组间的比较而各组样本含量不相同,选用Scheffe法。
12.2.3 两两比较方法的选择策略 最后需要提醒的是,如果组数较小,如3组、4组,比较方法的选择可能结果差异不大,如果组数很多,则一定要慎重选择两两比较方法。
12.2.4多重比较结果出现矛盾时的解释 有时,方差分析拒绝H0,但方差分析却找不到有差异的任何两个样本。这是因为方差分析的差别有统计学意义有时候仅仅保证诸多对比中的某一个或某几个不为零,但这些对比却不一定是分析者所关心的。 此时最好增加样本含量进行重新试验。
12.2.5 分析实例 由例12.3可知,各国生产的汽车耗油量有差别,借助多重比较,可以看出究竟各组之间的差别如何? 12.2.5 分析实例 由例12.3可知,各国生产的汽车耗油量有差别,借助多重比较,可以看出究竟各组之间的差别如何? 这是一个非计划的多重比较(Post Hoc),由于各组样本含量不同,因此在多重比较的对话框中选择“Scheffe”。
12.2.5 分析实例 两两比较,如果均数差别有统计学意义,则自动加“*”作为标记。 可见三组汽车的mpg均数两两有差异。
上表是用S-N-K法进行两两比较的结果 ,S-N-K法目的是寻找同质子集(Homogeneous Subsets)。
12.2.5 分析实例 简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,即即子集之间的各组间有差别,而同一亚组内的各组均数比较的P值则大于0.05,即子集内的各组间无差别。
从表可见,美国、欧洲、日本被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1(自己和自己比较,当然绝对不会有差异了)。
12.3 各组均数的精细比较 12.3.1 方法原理 12.3.2 分析实例 12.3.3 事先计划的比较
12.3.1 方法原理 多重比较实际上等价于均数的线性组合的假设检验,即对比检验或者多项式检验。 多项式比较检验就是要检验假设: 12.3.1 方法原理 多重比较实际上等价于均数的线性组合的假设检验,即对比检验或者多项式检验。 多项式比较检验就是要检验假设: H0:由 组成的多项式等于零。 如要检验 相当于检验 是否为 的2倍。
12.3.2 分析实例 例12.4 比较4种强心剂的毒性。将稀释过的药物注入豚鼠的体内,记录导致豚鼠死亡时药物的剂量。每种药物各进行了10次试验。 药物 样本含量 豚鼠死亡时药物的剂量 1 10 29,28,23,26,26,19,25,29,26,28 2 17,25,24,19,28,21,20,25,19,24 3 17,16,21,22,23,18,20,17,25,21 4 18,20,25,24,16,20,20,17,19,17
12.3.2 分析实例 数据文件为guineapig.sav,其中x为药物剂量,g为药物种类。 检验假设: 12.3.2 分析实例 数据文件为guineapig.sav,其中x为药物剂量,g为药物种类。 检验假设: ContrastPolynomialLinear(线性) 指定系数,在Coefficients中输入3,-1,-1,-1,每次输入完后点击Add按钮。
12.3.2 分析实例 SPSS分别给出了方差齐与方差不齐时的检验统计量和p值,此处是方差齐的。 12.3.2 分析实例 SPSS分别给出了方差齐与方差不齐时的检验统计量和p值,此处是方差齐的。 由于p<0.001,说明假设不成立,即第一种药物的效力不相当于后三种药的效力的平均。
12.3.2 分析实例 注意: 可以同时检验多个多项式,一个多项式的系数输入结束,激活Next键,单击该键后,将Coefficients框中清空,准备接受下一个多项式的系数数据。 如想修改已经输入的系数,可以分别单击Previous或者Next键前后翻找出相应的一组数据。
12.3.3 事先计划的比较 对于汽车耗油量与厂家之间的关系案例,在调查的设计阶段就计划好了美产与日产汽车的比较,以及日产与欧产汽车的比较。 12.3.3 事先计划的比较 对于汽车耗油量与厂家之间的关系案例,在调查的设计阶段就计划好了美产与日产汽车的比较,以及日产与欧产汽车的比较。 检验:
按方差齐的结果,对子一(美产与日产汽车),以及对子二(日产与欧产)的p值均小于0.05,拒绝H0,得到了有差别的结论。
12.4 组间均数变化的趋势检验 往往分组变量的取值体现顺序的意义,比如,多个时间点上的某个指标的比较,不同PH值下某些化学物质转化率的比较等。 对于这类资料,可以利用线性模型的有关原理对数据作进一步的分析,以考察因变量与处理因素之间是否存在着某种依存关系,统计学上称为趋势(线性或者多项式关系)检验(Trend Analysis)。
12.4 组间均数变化的趋势检验 例12.5 研究高粱的不同播种深度与出苗时间之间的关系。共试验了4个深度, 12.4 组间均数变化的趋势检验 例12.5 研究高粱的不同播种深度与出苗时间之间的关系。共试验了4个深度, 数据文件为anova3.sav,在Contrast对话框中选择Polynomial复选框,并在Degree列表中选择Cubic(三次型)。
12.4 组间均数变化的趋势检验 均数图揭示了天数和深度的关系
12.4 组间均数变化的趋势检验 一次项、二次项和三次项对应的p<0.05,拒绝原假设。表明播种深度和发芽天数间的关系要使用高次项关系来描述。
12.5 本章小结 单因素方差分析针对多组均数间的比较。 12.5 本章小结 单因素方差分析针对多组均数间的比较。 方差分析拒绝H0 ,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。 多重比较分为事前计划好的比较和事后比较,前者借助于Contrast,后者借助于Post Hoc 提供的许多方法。
12.5 本章小结 在分组变量包含次序信息时,如果方差分析做出了各组间差异有统计学意义的结论,并且Means-Plot均数图提示各组均数的某种趋势时,可以利用趋势分析讨论观察值与分组变量取值间的数量依存关系。借助于Contrast完成。