统计软件应用 4 主讲人 陶育纯 http://cc.jlu.edu.cn/ss.html SPSS统计分析 http://cc.jlu.edu.cn/ss.html http://cc.jlu.edu.cn/ms.html 统计软件应用 4 主讲人 陶育纯 2018.10.31 教案
第四讲 课程名称:统计软件应用 主要教材: «SPSS (PASW) 17.0 马斌荣 编著 科学出版社 在医学统计中的应用» 马斌荣 编著 科学出版社 年级、专业:2015级放射医学专业、 医药信息专业 授课时间:2018年10月31日 授课时数:2h 2018.10.31
目录 第二章 清理数据(自学) 第二+章 基本描述统计 一、异常数据的检查和清理 二、相关变量之间的逻辑检查和清理 一、正态性检验 ㈠ 利用Frequencies命令 ㈡ 利用Explore命令 二、相关变量之间的逻辑检查和清理 第二+章 基本描述统计 一、正态性检验 ㈠ 原始资料 ㈡ 频数表资料 2018.10.31
目录 二、基本描述统计 ★ ㈠ 使用Frequencies命令 ㈡ 使用Descriptives命令 2018.10.31
一、异常数据的检查和清理 第二章 清理数据(自学) ㈠ 利用Frequencies命令 此命令主要针对分类变量或离散变量,通过选择 Display frequency tables(列频数表)来发现异常数据的有无。 通过Edit→Find…命令或Data→Select Cases…命令 查找异常数据所在的记录,修改或删除。 2018.10.31
二、相关变量之间的逻辑检查和清理 ㈡ 利用Explore命令 此命令主要针对定量变量或连续变量,通过选择 Outliers(异常点)来发现异常数据的有无,也可通过其输出的Stem-and-Leaf Plot(茎-叶图)或Boxplot(箱图)来直观发现异常数据的有无。 通过Edit→Find…命令或Data→Select Cases…命令 查找异常数据所在的记录,修改或删除。 二、相关变量之间的逻辑检查和清理 具体方法参见教材第25页第二节相关内容。 2018.10.31
一、正态性检验 第二+章 基本描述统计 ㈠ 原始资料 1. 建立数据文件(见exp5.1.sav) SPSS主要通过Analyze → Nonparametric Tests → 1-Sample K-S…检验(即One-Sample Kolmogorov-Smirnov Test)完成对某变量所有数据的正态性检验。 下面通过对(第三版)教材第58页例5.1的数据做正态性检验来讲述操作步骤及结果的判读。 1. 建立数据文件(见exp5.1.sav) 2018.10.31
输出结果见表5.2,若Asymp. Sig. (2-tailed)的值大于 2. 正态性检验 Analyze →Nonparametric Tests →1-Sample K-S… 打开One-Sample Kolmogorov-Smirnov Test对话框。选择检验变量并选择 Normal(正态分布)选项, OK完成。 3. 结果判读 输出结果见表5.2,若Asymp. Sig. (2-tailed)的值大于 检验水准(0.05),则该变量服从正态分布;反之不服从。 注意:在One-Sample Kolmogorov-Smirnov Test对话 框中的Exact…按钮,一般当被检验变量的例数小于30时,点击可选择精确检验方法来得到精确检验概率。 2018.10.31
→Explore…分析方法(即探索性分析)完成对某变量所有数据的正态性检验。 SPSS还可以通过Analyze → Descriptive Statistics →Explore…分析方法(即探索性分析)完成对某变量所有数据的正态性检验。 下面通过对(第三版)教材第59页例5.2的数据做正态性检验来讲述操作步骤及结果的判读。 1. 建立数据文件(见exp5.2.sav) 2. 正态性检验 Analyze → Descriptive Statistics → Explore…打 开Explore…对话框,选择检验变量并点击 Plots…按钮打 开Explore: Plots对话框, 选择 Normality plots with tests 选项, 点击Continue按钮,再点击OK按钮完成。 2018.10.31
㈡ 频数表资料 输出结果见表5.4a。本例数据经Lilliefors检验水准下 3. 结果判读 的Kolmogorov-Smirnov检验和Shapiro-Wilk检验,检验概 率P均小于0.001,则不服从正态分布。 注意:当样本含量≤50时,选择Shapiro-Wilk检验结果为准。 ㈡ 频数表资料 方法同上。只需把频数表的组中值当成变量值x,把频数 f 用SPSS的加权命令Weight cases选上, 其余操作步骤同上。 2018.10.31
二、基本描述统计 ★ ㈠ 使用Frequencies命令 方法: SPSS可以使用Frequencies命令完成对连续变量数据的频数分布分析,可以绘制直方图(histogram);对离散变量进行频数列表并绘制直条图(Bar chart)或饼图( Pie chart );对数据可以求均数、标准差、最大值、最小值、 标准误、中位数和百分位数等。 方法: Analyze → Descriptive Statistics → Frequencies … 2018.10.31
1. 打开数据文件(见exp5.1.sav) 2. 选择分析变量和基本统计分析项 打开Frequencies对话框, 首先选择分析变量, 选择 Display frequency tables选项则输出变量的频数表。点击Statistics… 按钮打开Frequencies: Statistics对话框,里面有百分位数值、 集中趋势、离散趋势以及分布四类的指标,每个指标的具体含义参见教材第63页“一、使用Frequencies作基本统计分析”内相关内容;点击Charts…按钮打开Frequencies: Charts对话框,可选择绘制条图、饼图或直方图。 例5.4 对例5.1的数据作基本统计分析。 1. 打开数据文件(见exp5.1.sav) 2. 选择分析变量和基本统计分析项 2018.10.31
输出结果见表5.7和图5.9,从图5.9 可见该变量基本服从正态分布。 Analyze →Descriptive Statistics → Frequencies … 打开Frequencies对话框,选择检验变量男性红细胞量blood并点击 Statistics …按钮打开Frequencies: Statistics对 话框,选择Mean、Sum、Std.deviation、Minimum、 Maximum和S.E.mean,点击Continue按钮,点击Charts… 按钮打开Frequencies: Charts对话框,选择Histograms并选择 With normal curve选项, 点击Continue按钮,再点击OK按钮完成。 3. 结果判读 输出结果见表5.7和图5.9,从图5.9 可见该变量基本服从正态分布。 2018.10.31
㈡ 使用Descriptives命令 操作步骤见教材第29页内容。(自学) 方法: 例5.5 对例2.1的数据文件中time变量作基本统计描述。 操作步骤见教材第29页内容。(自学) ㈡ 使用Descriptives命令 SPSS可以使用Descriptives命令完成对连续变量数据的基本描述统计量的计算,与Frequencies命令相比,除不提供中位数、众数(Mode)、百分位数的计算和统计图的输出外,其余功能相同。 方法: Analyze → Descriptive Statistics → Descriptives … 2018.10.31
1. 打开数据文件(见exp2.1.sav) 2. 选择分析变量和基本描述统计分析项(略) 打开Descriptives对话框, 首先选择分析变量, 点击Options… 按钮打开Descriptives : Options对话框,里面有各种基本描述统计量供选择,每个统计量的具体含义参见教材第64 ~ 65页内相关内容。 即使不点击Options…按钮,SPSS默认选择Mean、Std.deviation、Minimum、Maximum四个统计量进行计算。 例5.6 对例2.1的数据中的月龄变量(age)和红细胞压 积变量(hct)作基本描述统计分析。 1. 打开数据文件(见exp2.1.sav) 2. 选择分析变量和基本描述统计分析项(略) 2018.10.31
思考题 C 输出结果见表5.9。 1. Frequencies命令和Descriptives命令的区别。 3. 结果判读 输出结果见表5.9。 思考题 1. Frequencies命令和Descriptives命令的区别。 2. SPSS对数据进行正态性检验的方法有几种? 3. 在用Frequencies命令对连续型变量进行分析时, 为什么常常应不选Display frequency tables项? C 2018.10.31
Uniform —均匀分布 Poisson — 泊松分布 Exponential — 指数分布 被检验变量 当被检验变量的例数小于30时, 选择此项可得到精确检验概率。 2018.10.31
Sig.—Significance,即检验概率P Asymp.—Asymptotic, 近似的 输出结果 Sig.—Significance,即检验概率P Asymp.—Asymptotic, 近似的 检验统计量Z 即检验概率P,若 P>0.05,则服从正态分布。 表 5.2 只有选择Exact选项时才有。 2018.10.31
被检验变量 带正态检验 的正态概率图 2018.10.31
部分输出结果 表 5.2a 表示P非常小,可表达为P<0.001。 调整输出值小数位数后的输出结果 2018.10.31
Bar chart — 条图Pie chart — 饼图Histogram — 直方图 列频数表 任意百分位数的选择 值是组中值 2018.10.31
对于连续变量 不选此项 2018.10.31
输出结果 S 表 5.7 2018.10.31
输出结果 图 5.9 2018.10.31
Z-scores (standardized value) -- SPSS默认选项 Z-scores (standardized value) -- Also known as a standardized value. To obtain z-scores for a variable, for each case subtract the variable's mean value and divide by the standard deviation. Z-scores are useful for finding outliers and comparing values of variables that are measured on different scales. 2018.10.31
输出结果 月龄: = 25.06, S=30.815, Max=144, Min=1, n=86 表 5.9 2018.10.31