第二章 SPSS数据文件的 建立和管理
一份简单的调查问卷 单项选择题 填空题 提供几个备选择答案,从其中选择一个答案 变量类型:分类数据、定序数据 数据类型:字符型 变量类型:定距数值型 数据类型:数值型
如何利用SPSS组织数据 SPSS数据文件是一种有结构的数据文件。 用字符或数字表示字符型数据 SPSS数据文件一般只能通过SPSS软件打开 文件结构 年级 性别 问题1…… 问题n 变量名 个案case 1 1 ………. 4 2 2 ……… 2 …………………………………... 3 1 ………… 1 数据 变量 用字符或数字表示字符型数据 SPSS数据文件一般只能通过SPSS软件打开
一份简单的调查问卷 多项选择题 提供几个备选择答案,从其中选择多个答案 如:在下列品牌中您信任哪些品牌? 被诊断为高血要后你采取了以下哪些辅助治疗手段? 如:高考时报考学校 (1)北京大学 (2)清华大学 (3)人民大学 (4)北京理工大学 (5)北京师范大学 (6)北京外国语大学 多项选择题不能在SPSS中直接存储,因为SPSS的一个变量只能有一个取值
如何利用SPSS组织数据 多项选择题的处理方法 思路: 将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。 编码方式: 多选项二分法(multiple dichotomize method) 多选项分类法(multiple category method)
如何利用SPSS组织数据 多选项二分法 将每个答案作为一个变量,每个变量只有两个取值(0或1)。 例如:
如何利用SPSS组织数据 多选项分类法: 预先估计多选项问题可能被选择的最多答案数.为每个答案建立一个变量,取值为多选项问题的可选答案. 例如:
如何利用SPSS组织数据 频数数据: 男 女 统计 10 23 精算 12 20 设置三个变量: 专业方向、性别、人数
SPSS数据文件的结构 变量名是变量存取的唯一标志。 起名规则: (一)变量名(Variable name): 不多于8个字符组成 不区分大小写 允许汉字作为变量名 默认变量名为VARn,如:var00001
SPSS数据文件的结构 (二)变量的类型(type)和显示宽度(width) 1、数值型: 标准数值型(Numeric):默认类型 8.2 如: 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号8.2 如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 8.2 如:1.2E+05 带美元符号(Dollar):表示货币 格式很多,如:$12.30
SPSS数据文件的结构 2 、字符型(String): 存储字符数据 8位 如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他: 如:圆点数值型(dot)、用户自定义型(customer) 注意:显示宽度不影响数据的存储
SPSS数据文件的结构 对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。 (三)变量名标签(Variable label) : 对变量名的一些解释说明,增强分析结果的可视性。可以省略。 (四)变量值标签(Value label) 对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。 一般用于品质数据 如:1-男 2-女、1-高 2-中 3-低
SPSS数据文件的结构 (五)变量列格式(Column Format) 对齐方式(Text Alignment) 左对齐(Left):字符型默认。 右对齐(Right):数值型默认。 居中对齐(Center) 列宽度(Column Width) 默认值为变量的总长度。
SPSS数据文件的结构 (六)缺失值(Missing Values) 1、什么是缺失值? 漏填数据 明显错误的数据 2、对缺失值的一般处理 事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等 3、SPSS缺失值 用户缺失值 系统缺失值:点 (•)
SPSS数据文件的结构 (七)变量计量尺度(Measurement) scale: 定距数据,一般为数值型数据。 如:收入、人数。 ordinal: 有固有顺序的顺序水准的数值型或字符型数据。 如:职称、年龄段 nominal: 无固有顺序的名义水准的数值型或字符型数据。 如:性别、民族
SPSS数据文件结构(虚线中的内容可以省略) 变量名 变量类型 标签 变量名标签 变量值标签 变量列格式 变量缺失值 变量计量尺度
定义SPSS数据文件结构 操作方法:利用变量视图 如何查看变量定义的情况 菜单选项: Utilities -> Variables
SPSS数据的录入与保存 录入时应注意: 数据保存: 黑框确定当前数据单元。 录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签。 操作 保存格式: (1)*.sav :SPSS数据文件(默认)。 (2)*.dbf : dbase数据文件。 (3)*.xls : Excel工作表文件。 注意:有些信息会丢失
SPSS数据的编辑 菜单选项:File -> Open -> .sav (一)打开数据文件 (二)数据定位 按个案号码定位 菜单: Data -> Go to case -> 输入样本号 按值定位 光标定位到某列变量上 -> Edit -> Find...
SPSS数据的编辑 (三)插入和删除一个个案 (四)插入和删除一个变量 插入:data->insert case 删除:选定待删行,鼠标右键找到Cut (四)插入和删除一个变量 插入:光标定位到某列变量上 -> Data -> Insert Variable (插到某列前) 或鼠标右键 删除:选定列,鼠标右键Cut项
SPSS数据的编辑 (五)数据移动、复制和删除 定义源数据块 鼠标右键:cut copy clear 确定目标单元 鼠标右键:paste
数据文件的合并 目的: 将两个SPSS数据文件合并到一个数据文件中。 文件合并的方式: 纵向合并 横向合并
数据文件的合并 (一)纵向数据合并 (1)含义: 将磁盘上的一个SPSS数据文件追加到当前data editor窗口中的数据文件中。 (2)前提: 两个SPSS数据文件应可以合并的内容,且最好有相同的变量名和变量类型。 (3)菜单选项: data -> merge file -> add cases
数据文件的合并 (二)横向数据合并 (1)含义: 将磁盘上的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中。 (2)前提: a.两个数据文件必须有一个共同的变量名为关键字段---合并的依据; b. 两个数据文件应事先按关键字段升序排序。
数据文件的合并 (二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: math cases on key variables in sorted files:以关键字作为合并标志。 Both files provide cases:合并后的文件的数据由两个文件共同提供。 External file is keyed table:以data editor的数据为基础。 Working data file is keyed table:以磁盘文件的数据为基础。
与其他软件数据共享 共享dbf和xls格式文件 菜单选项: Data -> Open (1)*.dbf : dbase数据文件。字段名、字段类型自动转成SPSS数据文件中的变量名和类型。一条记录为一个个案。 (2)*.xls : Excel文件 (Read variable name选项)