数数据的基本操作 电子工业出版社
提 纲 1. 建立数据文件 2. 编辑数据文件 3. 数据加工 4. 数据文件的保存或导出 5. 本章小结
建立数据文件 在进行数据处理之前,首先要建立数据文件。建立数据文件的方式主要有四种:人工输入数据、打开Excel等数据文件、使用数据库查询和导入数据文件。下面将分别通过这四种方式来建立数据文件。
建立数据文件 如果需要在已有数据的SPSS数据编辑窗口中新建数据文件,则需要将原有的数据进行保存,然后单击“文件(File)”菜单下的“新建(New)”→“数据(Data)”命令,即可新建一个数据文件。
建立数据文件 单击“文件(File)”菜单下的“打开(New)”→“数据(Data)”,即可打开一个其他格式的数据文件。
建立数据文件 单击“文件(File)”菜单,选择“打开数据库(Open Database)”下的“新建查询(New Query)”命令,系统会弹出“数据库向导(Database Wizard)”窗口
建立数据文件 打开“文件(File)”菜单,选择“检索(Read Text Data)”命令,系统就会弹出“打开数据(Open File)对话框
编辑数据文件 在数据视图(Data View)中,用鼠标单击数据视图左边框的个案序号,对应行就会被选中,用鼠标单击上边框的变量名,对应列就会被选中。与其他Windows中的操作类似,用鼠标选中行、列、部分单元格后,单击鼠标右键,可以对它们进行复制(Copy)、删除(Delete)、剪切(Cut)、清除(Clear)等操作。 数据输入完毕后,需要对已经存在的数据进行修改和整理,这就需要用到SPSS的数据编辑功能。
编辑数据文件 输入数据 SPSS和其他常用统计软件一样,也提供了直接输入数据的功能。SPSS数据文件中的数据是在SPSS数据编辑窗口中以表格的形式进行输入的。数据编辑窗口中的黑色边缘的单元格即为当前数据单元格,表示用户正在对单元格进行数据输入或数据修改。因此,在数据输入时,用户首先应确定哪个单元格为当前单元格。确定当前单元格后,只要将鼠标指针定位在需要进行数据编辑的单元格上,然后单击鼠标左键即可。
编辑数据文件 输入数据 数据输入时,可以逐行输入或者逐列输入。逐行输入时,只需输完一个数据后,按回车键或者↓键,当前单元格将跳到本行的下一列变量上。逐列输入数据时,只需输完一个数据后,按Tab键或者→键,当前单元格将跳到同一列变量的下一行个案上。 SPSS数据界面最大的优势就是支持鼠标的拖放操作,以及复制、粘贴等命令,这样就大大提高了用户的数据输入速度。这里,需要提及几个比较常用的数据输入的技巧。
编辑数据文件 输入数据 1.连续多个相同值的输入 2.将Excel数据直接复制到SPSS中
编辑数据文件 定义数据属性 数据的属性主要包括每列数据变量的变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量量度方法等信息。
编辑数据文件 插入或删除数据 插入或删除数据包括插入或删除个案(Case)和变量(Variable)。在数据编辑过程中,常常需要在数据编辑窗口的某个个案(变量)之前或之后插入一个新个案(变量),或者删除某些不再有用的个案(变量)。
编辑数据文件 数据的排序 数据编辑窗口中个案数据的顺序是由数据输入时的先后顺序决定的,一般是随机的。但在实际数据处理过程中,有时用户希望将个案数据按照某种顺序进行排列,以便进行观察和分类,此时就要用到SPSS中的排序命令。
编辑数据文件 数据的排序 SPSS的排序个案就是根据用户指定的一个或多个变量的变量值的大小,按照升序或降序将个案数据进行重新排列。这里用户所指定的变量称为排序变量。当排序变量只有一个时的排序称为单值排序;当排序变量有多个时的排序称为多重排序。
编辑数据文件 选择个案 在数据处理过程中,有时需要从数据文件中选取一部分个案,将筛选出的个案进行统计分析的操作、处理和分析,而未被选取到的个案将不参与之后的操作。选择个案的操作步骤如下。
编辑数据文件 转置数据 数据文件的转置就是将数据编辑窗口中数据的行列互换,即将个案转换为变量,将变量转换为个案,然后重新显示在数据编辑窗口中。
编辑数据文件 合并数据文件 在SPSS中,数据文件的合并是指将一个已储存在磁盘上的SPSS数据文件与当前SPSS数据编辑窗口中的数据文件进行合并,并在当前数据编辑窗口中显示合并后数据的过程。因此,实行两个SPSS数据文件的合并时,首先应打开当前数据编辑窗口中的一个数据文件,然后再实行与另一数据文件的合并。 SPSS数据文件的合并方式分为两种:纵向合并和横向合并。
编辑数据文件 合并数据文件
编辑数据文件 合并数据文件
编辑数据文件 数据的分类汇总 所谓数据分类汇总,就是按照用户指定的分类变量对个案进行分组,并对每组个案的各变量值计算指定的描述统计量(如求和、平均值等)。
数据加工 数据转换 数据转换就是在原有数据文件的基础之上,根据用户所给出的SPSS算术表达式和函数,对某个变量的所有个案进行计算,并将计算结果保存至数据编辑窗口中的一个指定变量中。这个指定的变量可以是生成的一个新变量,也可以替代原来已经存在的变量。
数据加工 数据手动分组 在实际工作中,人们经常需要将统计数据进行分组,以进一步整理数据。对变量数据的分组(也可以称为编码),是指给每个变量观测值重新赋予一个码来描述它们的某些属性,并把码数相同的分为一组。
数据加工 数据自动分组 除了通过手动对数据进行重新分组(编码)外,SPSS还提供了自动对数据进行重新分组(编码)的功能。
数据加工 产生计数变量 在进行数理统计时,常常需要针对满足一定条件的个案数据进行计数,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果保存在一个指定的新变量中。
数据加工 数据秩(序)的确定 所谓“秩”,就是等级,即按照数据大小排定的次序号。数理统计中,常常需要对个案进行排秩。SPSS软件的“个案排秩(Rank Cases)”命令就提供了这一功能。
数据加工 替换缺失值 在进行数理统计分析时,经常需要将带有缺失值的数据剔除后再进行分析。
数据的保存或导出 保存数据文件 由于SPSS能够与多种数据文件进行连接,数据文件也可以保存为不同的类型。但如果今后仍需使用SPSS对数据进行统计分析,建议用户将数据保存为SPSS默认的.sav数据格式。
数据的保存或导出 导出数据文件 除了可以直接将数据保存为许多类型的数据文件外,SPSS还提供了另一个适用范围更广、但使用也更为专业的数据保存方式——导出到数据库。
本章小结 本章主要介绍了数据编辑管理的方法和过程,包括建立数据文件、编辑加工数据和保存数据文件。本章的重点在于数据的编辑加工部分。通过对本章的学习,读者可以自行建立数据文件,并对数据进行整理、转换,也为正式进入数理统计分析学习铺平道路。