统计软件应用 2 主讲人 陶育纯 http://cc.jlu.edu.cn/ss.html SPSS http://cc.jlu.edu.cn/ss.html http://cc.jlu.edu.cn/ms.html 统计软件应用 2 主讲人 陶育纯 2013.6.3 教案
第二讲 课程名称:统计软件应用 主要教材: «SPSS (PASW) 17.0 马斌荣 编著 科学出版社 年级、专业:2009级放射医学专业 在医学统计中的应用» 马斌荣 编著 科学出版社 年级、专业:2009级放射医学专业 2012级公卫研究生 授课时间:2013年6月4日 授课时数:4h 2013.6.3
目录 第一章 数据文件的建立 一、SPSS基础知识 二、SPSS数据录入和数据获取 ㈠ SPSS的常用名词和术语 ㈡ SPSS的常用函数 2013.6.3
一、SPSS基础知识 第一章 数据文件的建立 ㈠ SPSS的常用名词和术语 1. 常数(constant) 在运行中保持不变的数据。如、e等。 2. 变量(variable) 变化数据的代表。SPSS对变量有如下规定: ⑴ 变量名最多由8个字符组成(12.0以前版本),首字符必 须为字母或@, 其后可以是字母、数字、下划线、句点、 $,#,但不允许把句点(.)作为变量名的尾字符。 2013.6.3
10.0版本以上可以取汉字变量名;12.0版本开始支持长 文件名,允许最长64个字符,但单词之间不允许以空格 分隔。 ⑵ 变量有数值型与字符型。SPSS提供的8种类型中,前 七种均视为数值型。 ⑶ 变量名不区分大小写字母。 ⑷ 变量名不能使用SPSS的关键字。有: AND、OR、 NOT、ALL、TO、BY、EQ、GE、GT、 LE、LT、 NE、WITH。 ⑸ 变量名必须唯一,不允许重复。 2013.6.3
3. 表达式(expression) 4. 关键字(keywords) 用运算符和括号把常数、变量和函数按一定的规则连 接起来的有意义的式子。如: COMPUTE y=sin(x). COMPUTE x=x+1. SPSS用 ** 代表乘方运算符。 4. 关键字(keywords) SPSS定义的用于标识命令、子命令、函数、运算符和 其它设定的特殊词汇。 5. 样品(case) 是组成数据文件的基本单元。又称记录(record)或观 测( observation )。 2013.6.3
㈡ SPSS的常用函数 6. 缺失值(missing value) 1. 算术函数(Arithmetic Functions) 指统计中不合格项(因缺失或遗漏)或给出规定值以 外的数值。SPSS有系统缺失值和用户缺失值两种。SPSS 用句点(.)代表缺失值。 ㈡ SPSS的常用函数 SPSS 12.0共提供12种类型177个常用函数(function)。 1. 算术函数(Arithmetic Functions) ABS(X) 取绝对值函数 RND(X) 四舍五入取整函数 TRUNC(X) 取整函数(小数点后数字舍去) 2013.6.3
2. 统计函数(Statistical Functions) SUM(X) 求和函数 SQRT(X) 平方根函数 EXP(X) ex LG10(X) lgx LN(X) lnx SIN(X) 正弦函数 COS(X) 余弦函数 等等 2. 统计函数(Statistical Functions) SUM(X) 求和函数 SD(X) 求标准差函数 MEAN(X) 求算术平均数函数 2013.6.3
4. 日期和时间函数(Date and Time Functions) CTIME.DAYS(timevalue) 计算天数 3. 转换函数(Conversion Functions) NUMBER(strexpr,format) 把字符转换成数值 STRING(numexpr,format) 把数值转换成字符 其中format常取f?或f?.?格式,? 代表数字。 4. 日期和时间函数(Date and Time Functions) CTIME.DAYS(timevalue) 计算天数 XDATE.YEAR(datevalue) 返回四位整数年份 CTIME.SECONDS(timevalue) 计算秒数 DATE.DMY(day,month,year). Numeric in date format. Returns a date value corresponding to the indicated day, month, and year. To display this value correctly, assign it a DATE format. The arguments must be integers, with day between 1 and 31, month between 1 and 13, and year a four-digit integer greater than 1582.. (1582年10月 14日及更早的时间在SPSS中是无效的) 参见SPSS数据文件date.sav。 等等 2013.6.3
6. 随机变量函数(Random Variable Functions) 5. 字符串函数(String Functions) LENGTH(strexpr) 计算strexpr的长度(包括结尾的空格) LOWER(strexpr) 小写转换函数 等等 6. 随机变量函数(Random Variable Functions) RV.NORMAL(mean, stddev) Numeric. Returns a random value from a normal distribution with specified mean and standard deviation. 7. 缺失值函数(Missing-value Functions) NMISS(X[,…]) 计算变量中的缺失值的个数 其它种类函数略,详情请见SPSS的帮助文件。 2013.6.3
二、SPSS数据录入和数据获取 ㈠ SPSS数据录入 1. 按部就班式 ① 定义变量。即在变量编辑窗口(Variable View) 定义变量的十大属性Name、Type、Width、Decimals、 Label、Values、Missing、Columns、Align、Measure。 参见例2.1的数据文件exp2.1.sav的变量编辑窗口。 2013.6.3
① 输入数据。SPSS默认从var00001、var00002 、…、 ② 输入数据。即在数据编辑窗口(Data View)录入 原始数据。一列为一个变量,一行为一个记录。 参见例2.1的数据文件exp2.1.sav的数据编辑窗口。 2. 先斩后奏式 ① 输入数据。SPSS默认从var00001、var00002 、…、 开始自动启变量名。 ② 修改变量。 SPSS的数据文件经存储后,其默认的文件名后缀为: “ .sav” 。 SPSS的数据文件还可以存成其它类型的数据文 件,如Excel(*.xls)、dBASE(*.dbf)等。 2013.6.3
㈡ SPSS数据获取 方法: ★ SPSS可以调入由其它软件生成的数据文件。如常用的 Excel、dBASE等数据库文件。 File → Open → Data…,在打开的Open File对话框中 打开“文件类型”下拉框,选择外部数据文件相应的文件类型,再找到文件的相应存储位置,即可找到并调入该数据文件。 SPSS可打开的数据文件类型参见图2.8a。 2013.6.3
思考题 C 1. 变量的标签( variable labels)和变量值标签( value label)的区别。 SPSS可以存储多达22种格式的数据文件(12.0以上版本)。SPSS可存储的数据文件类型参见图2.8b。 思考题 1. 变量的标签( variable labels)和变量值标签( value label)的区别。 2. 变量宽度(Width)和变量显示宽度(Columns) 的区别。 3. 系统缺失值和用户缺失值的区别。 C 2013.6.3
COMPUTE date=DATE.DMY(day,month,year). 2013.6.3
2013.6.3
2013.6.3
2013.6.3
Discrete missing values — 离散缺失值 2013.6.3
Align — 对齐 Scale — 数值尺度 Ordinal — 等级尺度 Nominal — 分类尺度 2013.6.3
2013.6.3
2013.6.3
2013.6.3
2013.6.3
图2.8a 2013.6.3
图2.8b 2013.6.3