第二章 SPSS数据文件的建立和管理 §2.1 数据文件的特点与结构 一.数据文件的特点 文件结构:对每个变量及相关属性的描述。 数据:所有个案组成数据部分 注意:SPSS数据文件与一般文本的不同点是:一般文本文件仅有纯数据部分,而没有关于结构描述的部分。因此只能在SPSS软件中打开。
包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等。 二. 数据文件的结构 每列变量及其相关属性的描述。 包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等。 1.变量名(Variable Name) 变量名是变量存取的唯一标志。 变量起名规则: l 变量名不能多于8个字符; l 首字符以英文字母或者中文开头,后面可跟除!、?、*之外的字母或者数字;_和.不能为最后 一个字母; l 不区分大小写字母; l 不能与保留字符相同; l 默认以VAR开头,后跟5位数字
2. 变量的类型(Type)和宽度(Width) (1) 数值型 由0~9和其他特殊字符(美元符号、逗号、圆点)组成。如:成绩。 1) 标准数值型(Numeric) 系统默认的数据类型。 系统默认最大显示宽度是8位(包括小数点),小数位2位;用户可修改。 整数的大显示位:正整数8位,负整数7位; 若数值总宽度超过所设的显示宽度,SPSS将自动调整数据的显示,但不影响真正数据的存取 2) 逗号数值型(Comma) 整数部分从个位开始每3位加逗号分隔。 系统默认最大显示宽度是8位(包括小数点),小数位2位;用户可修改 若数值总宽度超过所设的显示宽度,SPSS将自动调整数据的显示:首先,去掉逗号,再按标准数值型的显示调整方式调整。
3) 圆点数值型(Dot) 和逗号型相似 4)科学记数法型(Scientific Notation) 以指数形式显示 默认宽度为8,小数2位; 指数部分可以用E,也可以用D,也可以不用字母 指数部分可以带正负号,也可以不带 如:3.14E2 314 3.14D2 3.14E+2 3.14+2 5)美元数值型(Dollar) 用来表示货币数据,在数据前附加美元符号$。 格式很多:如$#、$###、$###,###、$#,###.##等 6) 用户自定义型(Custom Currency) 不超过5钟表示方式。CCA、CCB、CCC、CCD、CCE
4. 变量值标签(Value Label) 7) 字符型(String) l 由字符串组成,默认宽度为8,不能够进行算术运算, 8)日期型(Date) 3. 变量名标签(Variable Label) 对变量名含义进一步解释说明,可用中文 l 总长度可达120个字符; l 可省略定义,但最好给出标签 4. 变量值标签(Value Label) 对变量取值含义的解释说明信息。可用中文。可省略定义。 对顺序水准和名义水准变量值最好给出标签
5. 变量列格式(Column Format) (1) 变量列宽度(Column Width) l 变量列宽度的默认值是各变量类型的默认宽度; l 变量列宽度随变量显示宽度的改变而自动改变; l 以下情况应调整列宽度: 1) 变量名宽度>变量显示宽度 2) 数据值总宽度>定义的显示宽度 (2) 数据的对其方式(Text Alignment) 左对齐(Left),右对齐(Right),中间对齐(Center) l 字符型数据默认为左对齐显示 l 数值型数据默认为右对齐显示 6. 变量缺失值(Missing Values)
7. 变量度量方法(Measurement) (1) 定距度量 定距数据(Scale):定量测量的数据 (2)非定距度量 顺序水准数据(Ordinal):次序测量的数据 如年龄段用1,2,3表示 名义水准数据(Nominal):定性测量的数据 如性别用1,2分别表示男,女;民族用汉,回等表示 系统默认值为定距度量。 总结:描述数据文件结构时,变量名和变量类型时必须定义的,其他则可省略。
如何录入带有变量值标签的数据 §2.2 定义数据文件的结构 演示(注意:课本中的定义方法在新版本中不适用) §2.3 数据的录入与保存 演示(注意:课本中的定义方法在新版本中不适用) §2.3 数据的录入与保存 如何录入带有变量值标签的数据 数据的保存格式:sav,xls,dbf,dat 注意:在实际工作中,可保存成两种类型。 §2.4 数据的编辑 一.打开数据文件 二.数据定位 三.插入和删除一个个案 四.插入和删除一个变量 五.数据单元中数据的复制