统计软件应用 5 主讲人 陶育纯 http://cc.jlu.edu.cn/ss.html SPSS统计分析 http://cc.jlu.edu.cn/ss.html http://cc.jlu.edu.cn/ms.html 统计软件应用 5 主讲人 陶育纯 2013.12.20 教案
第五讲 课程名称:统计软件应用 主要教材: «SPSS (PASW) 17.0 马斌荣 编著 科学出版社 在医学统计中的应用» 马斌荣 编著 科学出版社 年级、专业:2010级预防、卫检、信息专业 授课时间:2013年12月20日 授课时数:2h 2013.12.20
目录 第六章 t 检验 第七章 方差分析 一、单样本 t 检验 二、配对 t 检验 三、两组独立样本的 t 检验 一、单因素方差分析 二、方差分析中均数的两两比较 2013.12.20
目录 三、随机区组设计的方差分析(自学) *四、多因素方差分析 *五、析因分析(有重复的两因素方差分析) * 附加讲 2013.12.20
一、单样本 t 检验 第六章 t 检验 ㈠ 使用One-Sample T Test命令 ㈡ 例题及分析过程 SPSS主要通过Analyze → Compare Means → One-Sample T Test…检验完成对某资料的单样本 t 检验。 ㈡ 例题及分析过程 下面通过对教材第35页例3.1的数据做单样本 t 检验 来讲述操作步骤及结果的判读。 2013.12.20
1. 建立数据文件 2. 适用条件判断 利用前述的正态性检验方法对样本数据进行正态性检 验。 Analyze →Nonparametric Tests →1-Sample K-S… 打开One-Sample Kolmogorov-Smirnov Test对话框。选择检验变量,再点击OK按钮完成。从输出结果表3.1中可以判断出“脉搏数”变量数据服从正态分布。 3. 单样本 t 检验 Next page 2013.12.20
Analyze → Compare Means →One-Sample T Test…打开One-Sample T Test对话框,点击“脉搏数”变量并移入Test Variable(s):列表栏里, 在Test Value:列表栏里,将标准值72输入, OK完成。 4. 结果判读 输出结果见表3.2~3.3,在表3.3中可以得到单样本 t 检验的统计量 t 值为1.590,检验概率P为Sig. (2-tailed)的值, 即P=0.118>0.05,则无统计学意义,即还不能认为该山区成年男子的脉搏数的总体均数与一般健康成年男子的脉搏数的总体均数有差异。 2013.12.20
二、配对 t 检验 ㈠ 使用Paired-Samples T Test命令 ㈡ 例题及分析过程 SPSS主要通过Analyze → Compare Means → Paired-Samples T Test…检验完成对某资料的配对 t 检验。 注意:SPSS的配对 t 检验要求资料建立配对的两个 变量数据。 ㈡ 例题及分析过程 Next page 2013.12.20
1. 建立数据文件(见exp6.1.sav) 下面通过对教材第38页例3.2的数据做配对 t 检验来讲述操作步骤及结果的判读。 2. 适用条件判断 利用前述的正态性检验方法对样本数据进行正态性检 验。Analyze → Descriptive Statistics →Explore… 打开Explore对话框。选择配对的两个变量的差值作为检验变量,并选择Plots…按钮中的 Normality plots with tests 选项, 点击Continue按钮,再点击OK按钮完成。从输出结果表6.2中可以判断出本例治疗前与治疗后的血红蛋白含量差值数据服从正态分布。 2013.12.20
3. 配对 t 检验 Analyze → Compare Means →Paired-Samples T Test…打开Paired-Samples T Test对话框,点击两个变量形成配对变量并移入Paired Variables:列表栏里, OK完成。 4. 结果判读 输出结果见表6.3~6.5,在表6.5中可以得到配对 t 检验的统计量 t 值为-0.364,检验概率P为Sig. (2-tailed)的值, 即P=0.722>0.05,则无统计学意义,即还不能认为该药能引起患者的血红蛋白含量的显著变化。 三、两组独立样本的 t 检验 2013.12.20
㈠ 使用Independent-Samples T Test命令 SPSS主要通过Analyze → Compare Means → Independent-Samples T Test…检验完成对某资料的两组独立样本的 t 检验。 注意:SPSS的两组独立样本的 t 检验要求资料建立分组变量。 ㈡ 例题及分析过程 下面通过对教材第42页例3.3的数据做两组独立样本的 t 检验来讲述操作步骤及结果的判读。 2013.12.20
1. 建立数据文件(见exp6.2.sav) 2. 适用条件判断 利用前述的SPSS的数据文件的形式拆分命令Split File 把数据文件中的分组变量(group)设置成分组比较变量,从而使得正态性检验方法可以对分组样本数据进行正态性检验(即一箭双雕)。 Data → Split File … → Split File 对话框,点击选择Compare groups选项,再从左侧数据库变量列表中选择分组变量(group),移动到Groups Based on选项框里, OK即可。Analyze → Descriptive Statistics → Explore…打开 2013.12.20
从输出结果表6.7中可以判断出本例急性克山病组与健康组的血磷测定值数据均服从正态分布。 Explore…对话框,选择血磷值变量(xl)作为检验变量,点击 Plots…按钮打开Explore: Plots对话框, 选择 Normality plots with tests选项, → Continue → OK完成。 从输出结果表6.7中可以判断出本例急性克山病组与健康组的血磷测定值数据均服从正态分布。 3. 两组独立样本的 t 检验 Analyze →Compare Means →Independent–Samples T Test…打开Independent -Samples T Test对话框,选择分 析变量和分组变量, 点击Define Groups…按钮打开Define Groups对话框输入分组标志值,→ Continue → OK完成。 2013.12.20
输出结果见表6.8~6.9,表6.8显示的是每组血磷值的描述统计分析结果;在表6.9中同时显示方差齐性检验结果和 t 检验结果。 4. 结果判读 输出结果见表6.8~6.9,表6.8显示的是每组血磷值的描述统计分析结果;在表6.9中同时显示方差齐性检验结果和 t 检验结果。 首先通过Levene‘s test for equality of variances(即 Levene方差齐性检验)结果判断此数据的方差齐性结果,本例 F 值为0.072,P=0.791>0.05,则方差齐。 然后在Equal variances assumed(即等方差假设)一行找出t 检验结果。本例 t = 2.576,P=0.017<0.05,则有统计学意义,即认为急性克山病患者与健康人的血磷测定值(总体)不同。 2013.12.20
一、单因素方差分析 第七章 方差分析 ㈠ 使用One-Way ANOVA命令 ㈡ 例题及分析过程 SPSS通过Analyze → Compare Means → One-Way ANOVA…检验完成对某资料的单因素方差分析。 注意:SPSS的方差分析都要求资料建立分组变量。 ㈡ 例题及分析过程 下面通过对教材第49页例4.1的数据做单因素方差分析 来讲述操作步骤及结果的判读。 2013.12.20
1. 建立数据文件(见exp7.1.sav) 3. 单因素方差分析 2. 适用条件判断 仿前述分组进行正态性检验方法可以得到每组样本数据的正态性检验结果(即一箭三雕)。 具体过程略。 本例用Shapiro-Wilk检验得到group=1的P=0.600, group=2的P=0.074,group=3的P=0.221,三组数据均服从正态分布。 3. 单因素方差分析 Analyze → Compare Means → One-Way ANOVA… 打开One-Way ANOVA对话框, 选择分析变量和分组变量, 2013.12.20
点击Options…按钮,打开One-Way ANOVA: Options对话框选择 Homogeneity of variance test (方差齐性检验)选项, → Continue → OK完成。 4. 结果判读 输出结果见表7.4~7.5,在表7.4中显示的是方差齐性检验的结果。本例P=0.053,P>0.05,则方差齐。 表7.5显示的是方差分析的结果。本例F = 5.564,P= 0.008<0.05,即认为三组大鼠肾组织液中NO水平存在着不同。 二、方差分析中均数的两两比较 2013.12.20
⑴ S-N-K法(Student-Newman-Keuls):又称q检验。常用于多个均数间每两个均数的比较。 当方差分析结论拒绝H0时,得到的多组样本的总体均数不同只是笼统的,而研究者往往需要知道多个均数间到底哪些存在不同,这就需要借助多重比较(Multiple Comparisons)的方法。 SPSS提供了多达18种的多重比较方法,我们这里只介绍常用的S-N-K法、LSD法、Dunnett法和Bonfferoni法。 ⑴ S-N-K法(Student-Newman-Keuls):又称q检验。常用于多个均数间每两个均数的比较。 ⑵ LSD法(Least Significant Difference):即最小显著差法。常用于多个处理组与对照组的均数比较。 2013.12.20
㈠ 使用Post Hoc…按钮 ㈡ 例题及分析过程 ⑶ Dunnett法:常用于多个处理组与对照组的均数比较。 ⑷ Bonfferoni法:常用于多个均数间每两个均数的比较。 ㈠ 使用Post Hoc…按钮 SPSS通过Analyze → Compare Means → One-Way ANOVA…打开One-Way ANOVA对话框并点击Post Hoc…按钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框来选择使用某种多重比较方法。 ㈡ 例题及分析过程 2013.12.20
1. 打开数据文件(见exp7.2.sav) 下面通过对教材第52页例4.2的数据做多重比较来讲述操作步骤及结果的判读。 2. 选用多重比较方法 Analyze →Compare Means → One-Way ANOVA…打开One-Way ANOVA对话框并点击Post Hoc…按钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框, 分别选择 LSD、 S-N-K、 Bonfferoni和 Dunnett选项, Continue → OK完成。 3. 结果判读 2013.12.20
S-N-K法是通过寻找同质子集(Homogeneous Subsets)的方法得出比较结果。子集之间的各组间有差别(P<0.05), 输出结果见表7.6~7.7,表7.6显示的是S-N-K法的分析结果;表7.7显示的是LSD法、 Bonfferoni法和Dunnett法的分析结果。 S-N-K法是通过寻找同质子集(Homogeneous Subsets)的方法得出比较结果。子集之间的各组间有差别(P<0.05), 子集之内的各组间无差别(P>0.05)。 LSD法、 Bonfferoni法和Dunnett法是通过在对比的两组均数差值(Mean Difference (I-J))的右上角标记“ * ”来表示此两组均数有差别(P<0.05),未标的则无差别(P>0.05)。 本例用上述四种多重比较方法得到的两两比较结果见下表7.6-7。 2013.12.20
三、随机区组设计的方差分析(自学) ㈠ 使用Univariate命令 ㈡ 例题及分析过程 SPSS通过Analyze → General Linear Model → Univariate …命令完成随机区组设计的方差分析。 ㈡ 例题及分析过程 2013.12.20
1. 建立数据文件(见exp7.3.sav) 下面通过对教材第55页例4.3的资料做随机区组设计的方差分析来讲述操作步骤及结果的判读。 2. 适用条件判断 具体过程略。 3. 随机区组设计的方差分析 Analyze → General Linear Model → Univariate …打开Univariate对话框, 将尿氟排出量变量(nf)调入Dependent Variable (因变量) 中,将时间变量(group)、区组变量(block)调入Fixed Factor(s)(固定因素)中,点击 2013.12.20
输出结果见表7.10a,结果显示: Model…按钮打开Univariate: Model对话框, 选择Custom( 自定义)选项,再点击 Build Term(s)下的下拉框并从中选择Main Effects,然后把左侧的group、block调入右侧的Model栏,去掉栏下的Include intercept in model选项, → Continue → OK完成。 4. 结果判读 输出结果见表7.10a,结果显示: group组(不同时间):F=7.033, P=0.004 < 0.05 ,即 工前、工中和工后的氟作业工人尿氟排出量存在不同。 block组(不同区组):F=1.642, P=0.155 > 0.05,即工人之间的差异对尿氟排出量影响不大。 2013.12.20
5. 多重比较 Analyze → General Linear Model → Univariate …打开Univariate对话框, 点击Post Hoc…按钮打开Univariate: Post Hoc Multiple Comparisons for Observed Means对话框, 选择group为多重比较变量, 再分别选择 LSD、 S-N-K、 Bonfferoni和 Dunnett选项,Continue → OK完成。 输出结果见表7.12和表7.13。用上述四种多重比较方法得到的两两比较结果见下表7.12-13。 2013.12.20
* 四、多因素方差分析 前面讲授的随机区组设计的方差分析实质就是一个最简单的多因素方差分析(两因素无重复数据),因为它不存在交互效应(interaction),当某因素的各单独效应随另一因素变化而变化时,则称这两个因素存在交互效应。 由于从总变异中分解的变异项目增多,多因素方差分析计算和输出结果就更为复杂。 本节内容略。 附加内容啊! 2013.12.20
*五、析因分析(有重复的两因素方差分析) 析因分析实质就是有重复数据的两因素方差分析。它可以存在单独效应(Simple effect)、主效应(main effect)和交互效应(interaction)。 SPSS通过Analyze → General Linear Model → Univariate …命令完成析因分析。 下面通过对《卫生统计学》第5版教材第157页例9-3的资料做析因分析来讲述操作步骤及结果的判读。 1. 建立数据文件(见wstjx5exp9-3.sav) 2. 析因分析 2013.12.20
Analyze → General Linear Model → Univariate …打开Univariate对话框,将吞噬指数变量调入Dependent Variable (因变量) 中,将升白细胞药物、纯苯调入Fixed Factor(s) (固定因素) 中,点击Model…按钮打开Univariate: Model对话框,选择Custom选项,选择Build Term(s)中的interaction ,点击左侧的升白细胞药物和纯苯则将二者的交互效应项(纯苯*升白细胞药物)调入右侧的Model栏,再选择Build Term(s)中的Main Effects,点击左侧的升白细胞药物和纯苯则将二者的主效应项(纯苯、升白细胞药物)调入右侧的Model栏,→ Continue,点击 2013.12.20
Options…按钮打开Univariate: Options对话框,选择 Descriptives statistics 选项,→ Continue → OK完成。 3. 结果判读 输出结果见表7.28~7.29。 表7.28显示的是“升白细胞药物”和“纯苯”两因素在单独效应、主效应和交互效应下的“吞噬指数”的均数、标准差等大小。 表7.29显示的是“升白细胞药物”和“纯苯”两因素在主效应和交互效应下的“吞噬指数”的假设检验结果。结果为: 升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322 2013.12.20
思考题 C 1. 分组变量和分组标志值的区别。 2. 单因素方差分析、随机区组设计的方差分析和析因 > 0.05,即两因素的交互效应无统计学意义; 升白细胞药物的主效应: F=1.5192, P=0.2355 > 0.05,即升白细胞药物的主效应无统计学意义; 纯苯的主效应: F=1857.0087, P < 0.001,即纯苯的主效应有统计学意义。 思考题 1. 分组变量和分组标志值的区别。 2. 单因素方差分析、随机区组设计的方差分析和析因 分析的区别。 C 2013.12.20
表 3.1 2013.12.20
表 3.2 表 3.3 2013.12.20
2013.12.20
2013.12.20
输出结果 此结果是用 1 Sample K-S 检验得到的 正态检验结果 表 6.2 2013.12.20
需要点击两个变量名 形成变量对,移动按 钮方可使用。 配对变量 2013.12.20
t = -0.364, P=0.722 > 0.05 输出结果 Differences — 差值 表 6.3~6.5 表 6.3 表 6.4 Differences — 差值 表 6.5 t = -0.364, P=0.722 > 0.05 表 6.3~6.5 2013.12.20
分组变量 血磷测定值变量 group=1 代表 急性克山病组 group=2 代表 健康组 2013.12.20
2013.12.20
被检验变量 选此项可以得到 Shapiro-Wilk 正态检验结果 2013.12.20
输出结果 表 6.7 2013.12.20
被分析变量 分组变量 分组标志值 点击此钮可以 输入分组标志值 2013.12.20
方差齐性检验F = 0.072, P=0.791 > 0.05, 方差齐。选用等方差假设下的检验结果: 输出结果 表 6.8 表 6.9 等方差假设 方差齐性检验F = 0.072, P=0.791 > 0.05, 方差齐。选用等方差假设下的检验结果: t = 2.576, P=0.017 < 0.05,有统计学意义。 方差不等假设 2013.12.20
分组变量 NO值变量 group=1 代表 正常对照组 group=2 代表 肾缺血60min组 group=3 代表 肾缺血60min 再灌流组 2013.12.20
被分析变量 分组变量 选此项可作多样本 方差齐性检验 2013.12.20
F = 5.564, P=0.008 < 0.05 Sum of Squares — 离均差平方和 df — 自由度 输出结果 Sum of Squares — 离均差平方和 df — 自由度 Mean Square — 均方 表 7.4 方差齐性检验结果, 若P>0.05,则方差齐。 表 7.5 F = 5.564, P=0.008 < 0.05 表 7.4~7.5 2013.12.20
Equal Variances Assumed — 等方差假设 表明第一组为对照组 Equal Variances Assumed — 等方差假设 Equal Variances Not Assumed —方差不等假设 2013.12.20
正常对照组与肾缺血60min组:P=0.611 > 0.05; 输出结果 表 7.7 * 表示P < 0.05 附加说明Dunnett法是多个处理组 与一个对照组进行比较 2013.12.20
Homogeneous Subsets — 同质子集 输出结果 表 7.6 肾缺血60min再灌流组与肾缺血60min组:P < 0.05; 肾缺血60min再灌流组与正常对照组:P < 0.05。 正常对照组与肾缺血60min组:P=0.611 > 0.05 2013.12.20
尿氟排出量 变量 group=1 代表工前组 区组变量 group=2 代表工中组 group=3 代表工后组 2013.12.20
被分析变量(即实验指标) 模型设置按钮 Two-way ANOVA 2013.12.20
Main effects(主效应) 2013.12.20
2013.12.20
group组:F=7.033, P=0.004 < 0.05 block组:F=1.642, P=0.155 > 0.05 输出结果 表 7.10a group组:F=7.033, P=0.004 < 0.05 block组:F=1.642, P=0.155 > 0.05 2013.12.20
2013.12.20
输出结果 表 7.12 2013.12.20
输出结果 工前组与工后组:P=0.070 > 0.05 工前组与工中组:P < 0.05 表 7.13 工前组与工中组:P < 0.05 工中组与工后组:P=0.137 > 0.05 2013.12.20
2013.12.20
2013.12.20
升白细胞药物和纯苯的交互效应项 升白细胞药物和纯苯的 各自主效应项 2013.12.20
2013.12.20
输出结果 表 7.28 通过此项结果可以得到 “升白细胞药物”和“纯 苯”在单独效应、主效应 和交互效应下的“吞噬指 数”的均数大小。 2013.12.20
升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322 > 0.05; 输出结果 表 7.29 升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322 > 0.05; 升白细胞药物的主效应: F=1.5192, P=0.2355 > 0.05; 纯苯的主效应: F=1857.0087, P < 0.001。 2013.12.20