第1讲 SPSS基础 联系Email:yuxl@shfc.edu.cn
1.1 SPSS简介 在国际学术界有一条不成文的规定:在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不用说明算法。仅从这点就足以说明在国际上使用SPSS的广泛程度。
1.1.1 SPSS的产生和发展 SPSS原意是Statistical Package for the Social Sciences,意为社会科学统计软件包。但是最近,伴随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已决定将其英文全称改为Statistical Product and Service Solutions,即统计产品与服务解决方案。 1968年由美国斯坦福大学的三个学生开发; 1975年成立SPSS公司总部,推出了SPSS中小型机版本SPSSX;
1984年推出了世界上第一个统计分析软件微机版本SPSS/PC; 20世纪90年代,SPSS又推出了Windows版本,从SPSS5.0开始,到现在的SPSS18.0,它的功能一直在不断增强,以满足各种客户的不同需求。
1.1.2 SPSS的特点 SPSS最突出的特点就是它使用Windows的窗口方式展示各种管理和分析数据的功能,使用对话框展示各种功能选择项。它可以直接读取Excel和DBF数据文件,而且现在已经推广到各种操作系统上。它的操作界面非常友好,输出的结果清晰、直观,整个系统易学易用。
1.2 SPSS的窗口简介 SPSS主要有四个窗口:数据编辑窗口、结果浏览窗口、程序编辑窗口和VBs宏程序编辑窗口。其中,最常用的是前两种窗口。
1.2.1 数据编辑窗口 变量名栏 编辑栏栏 菜单栏 标题栏栏 工具栏 内容区 状态栏 窗口切换标签
该窗口下方有两个标签:“数据视图”和“变量视图”。 如果使用过电子表格,如Microsoft Excel等,那么对数据编辑窗口中“数据视图”所对应表格感觉上有点熟悉。但是它和一般的电子表格处理软件还有以下区别: (1) 一个列对应一个变量,即每一列代表一个变量或一个被观测量的特征。例如问卷上的每一项就是一个变量。 (2) 行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case)。例如,问卷上的每一个人就是一个观测。
(3)数据文件是一张长方形的二维表。数据文件的范围是由观测个体和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS将数据长方形延长到可包括那个单元和文件边界之间的任何行和列。
1.标题栏 显示当前所打开的数据文件名,现在的SPSS版本允许同时打开多个数据编辑窗口,这些数据窗口可以显示不同的数据文件,也可以显示同一个数据文件的多个数据集。在多个打开的数据编辑窗口中,只有当前活动的数据编辑窗口在标题栏最左边有一个绿色的加号表示,方便在进行窗口切换的时候找准当前数据编辑窗口。
2.菜单栏 【文件(F)】 文件管理菜单。负责新建文件或数据库、保存文件、标记文件 为只读文件、重命名数据库、显示数据文件信息、打印等操作。 值得一提的是【最近使用过的其他文件】和【最近使用过的 数据文件】两个子菜单,为用户提供了便捷的打开常用文件的 方式。 【编辑(E)】 编辑菜单。对文件数据进行选择、复制、粘帖、删除、查找、还 可以插入新变量和新的观测值,以及利用【选项】子菜单修改整 个SPSS设置等操作。
【视图(显示)】 显示菜单。进行串口外观控制、自定义工具栏、显示字体设置、显示或隐藏格子、显示变量标签、在数据浏览和变量浏览之间切换等操作。 【数据(D)】 数据整理菜单。进行数据变量的定义、复制数据或数据集、定位观测量、分类观测量、转换、重构变量、合并其他文件数据等操作。 【转换(T)】 变量整理菜单。进行数值计算、重新编码、缺失值替代、创建时间序列、产生随机数等操作。 【分析(A)】 统计分析菜单。应用各种统计方法对当前窗口中的数据进行分析。
【图表(G)】 图表菜单。根据当前数据绘制和编辑各种统计图表。 【实用程序(U)】 使用选项菜单。进行变量列表、控制输出管理系统、输出文件信息、定义和使用变量集合、运行菜单编辑器等操作。 【窗口(W)】 窗口管理窗口。进行窗口拆分、最小化、切换窗口等操作。 【帮助(H)】 帮助菜单。提供SPSS系统帮助、在线指南、统计分析指导等 功能。
3.工具栏 工具栏中的按钮都能在菜单中找到相应的命令。工具栏显示的 都是最常用的菜单,当然,根据不同的需要,用户也可以自定 义工具栏。具体方法是:先执行【视图】/【工具栏】/【设定 】,这时弹出如下图所示的对话框,
然后单击【编辑】按钮,就弹出右下图的对话框,这时就可以根据自己的需要清除不需要的按钮,添加需要的按钮。
4. 数据编辑窗口 在工具栏的下方是数据编辑窗口,可以在其中进行数据的编辑 操作。 5 4.数据编辑窗口 在工具栏的下方是数据编辑窗口,可以在其中进行数据的编辑 操作。 5.状态栏 状态栏处在整个页面的右下端,显示SPSS程序此时的工作状 态,此时SPSS程序的状态是“SPSS Processor is ready”, 即SPSS程序已经做好准备。
1.2.2 结果浏览窗口
SPSS的一个显著特点就是其输出结果简洁易读,便于编辑。输出结果编辑窗口被分成了左右两个部分。左边部分称为 “结构视图”或“大纲视图”,右边部分显示详细的统计结果。
1.2.3 程序编辑窗口 可以通过【文件】/【打开】或【新建】/【脚本】等打开“程序编辑窗口 ”, SPSS中的任何操作过程都可以转化成相应的程序语句在 “程序编辑窗口”中输出。
SPSS的测量尺度 名称 符号 说明 对应的变量类型 举例 度量 测量水平最高,包括的信息最多。测量值之间即可以做加法也可以做出法运算来比较大小。 只能是数值型 学生分数、人的身高的具体值。 序号 信息量低于“度量”度量标准,只能保存测量值之间的一种有序关系。 可以是数值型,也可以是字符型。 人的身高等级:“高”、“中”、“矮”。 名义 测量水平最低,取值仅代表一定的分类和标识,测量值之间没有大小可言。 人的性别分为“男”和“女”。无法比较哪个优于哪个。
数据文件的创建与保存 数据录入的技巧 直接录入 连续录入多个相同变量 从其它表格文件中COPY ◆问题: 数据和变量这两个概念有什么不同?
2.2 数据文件的创建与保存 SPSS创建数据文件共有四种方法:新建数据文件、直接打开已有数据文件、使用数据库查询方式打开数据文件、从文本导入数据文件。
5、Measure栏 定义量测尺度,如下图所示
1.3 数据文件整理 为什么数据文件还需要整理? 整理数据文件要达到什么目的? 数据变换是正式分析前的重要一步,通过数据变换,一个优秀的统计分析员可以将原始记录整理成所需的任何格式,从而为后面的精确分析打下坚实的基础——这正式他与普通分析人员的区别所在。 ——张文彤 ◆ 问题:整理数据能否不需要?
数据整理主要包括以下两方面 数据文件的整理,常用包括以下几类: 1、插入变量,插入数据 2、数据文件的排序、拆分等。 数据变量的整理 其中最常用的就是对变量进行四则运算。
数据文件整理案例: 例:假设一个公司甲,它有很多的子公司A、B、C…分别处在全国的各大城市。每个子公司都有各自的销售记录,保存在各自的数据文件中,也就是说一个子公司对应着一个销售记录信息文件。到了年底,总公司想要总结全年的销售业绩,不仅要将各个子公司的业绩加起来统计,还要将各个子公司业绩分别做对比。
1.3.1 数据变量的整理 插入新变量——Insert Variable过程 插入新数据——Insert Case过程 在当前单位格的上方插入新数据,左方插入新变量
1.1.2 数据录入 数据录入的技巧 直接录入 连续录入多个相同变量 从其它表格文件中COPY ◆问题: 数据和变量这两个概念有什么不同?
1.2 导入和保存数据文件 数据文件的3种导入方式 直接打开其它类型数据文件: 【File】/【Open】/【Others】命令 查询方式打开大型数据库文件: 执行【File】/【Open Database】/【New Query】命令 打开文本文件: 执行【File】/【Read Text Data】命令
数据文件的保存 【File】/【Save】或【File】/【Save As】 选择性保存:仅保存部分变量
1.3 数据文件整理 为什么数据文件还需要整理? 整理数据文件要达到什么目的? 数据变换是正式分析前的重要一步,通过数据变换,一个优秀的统计分析员可以将原始记录整理成所需的任何格式,从而为后面的精确分析打下坚实的基础——这正式他与普通分析人员的区别所在。 ——张文彤 ◆ 问题:整理数据能否不需要?
数据整理主要包括以下两方面 数据文件的整理,常用包括以下几类: 1、插入变量,插入数据 2、数据文件的排序、拆分等。 数据变量的整理 其中最常用的就是对变量进行四则运算。
1.3.1 数据文件的整理 插入新变量——Insert Variable过程 插入新数据——Insert Case过程 【Edit】菜单下过程,在当前单位格的上方插入新数据,左方插入新变量
观测量排序——Sort Case过程
数据文件转置——Transpose过程
数据分类汇总——Aggregate过程 数据分类汇总功能能够将观测量按照某几个变量进行分组,并根据需要对每一组的变量求其统计量值。
常见汇总函数
数据文件的拆分——Split File过程(常用) 数据文件的拆分是指将数据按某个或某几个变量分成一些供统计分析的分组。 ◆ 注意:一旦执行了数据拆分之后,如果没有取消,此拆分会一直存在!
选择观测量——Select Cases过程 选择观测量过程是指从数据文件中选取符合要求的观测量作为样本参与数据的分析。
观测量加权——Weight Cases过程
1.3.2 变量的整理 变量计算——Compute过程(常用)
变量值标识——Count过程 Count过程用于标识某个值或某些值在某个变量的取值中是否出现
新生成一列标识变量
变量重新赋值——Recode过程 变量重新赋值功能是指将数据文件中的原变量按照某种一一对应关系生成新变量值,可以分成两种情况 1、用这个新变量值替代原变量值
2、生成一个新变量
感谢您的关注