庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw 数据的选取与操作 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw SPSS之应用(庄文忠副教授) 2019/9/5
课程大纲 数据选取与操作的意涵 选择观察值(Select) 分割档案(Split files) 变量的重新编码(Recode) 计算(Compute) 计数(Count) SPSS之应用(庄文忠副教授) 2019/9/5
数据选取与操作的意涵 研究者在进行数据分析时,有时可能需要对数据的 结构做某些改变或创造新的变数,以符合研究的需 求,尤其是研究者所使用的原始资料文件是他人基 于不同研究目的而搜集的资料,例如ICPSR数据库、 中研院学术调查数据库。 即使是研究者自己所搜集的资料,为了进行某些较 为特殊的分析,也有可能需要对数据的格式或变量 的属性作某些改变,例如政治世代的比较;甚至有 些「根本」的改变可能在资料搜集之初,就已经有 所预期或规划,例如指数(index)或量表(scale)的建构。 SPSS之应用(庄文忠副教授) 2019/9/5
数据选取与操作的意涵 在数据操作过程中,个案的个数保持不变, 变量的数目也不会减少(事实上,变量的数 目反而会增加)。数据操作涉及到现有变量 的处理,例如: 1.利用某种方式变更变数的原始数值/编码; 2.利用某种方式结合2个或2个以上变数的数 值/编码的逻辑条件陈述来建立一个新的变 量。 SPSS之应用(庄文忠副教授) 2019/9/5
选择观察值(Select) 研究者有时会发现在进行某项研究或特定分析 时,并不见得需要使用数据文件中所包含的全 部信息,分析时必须选择某些值得分析的个案 或变量 。 操作的步骤: 1.设定筛选的标准; 2.选取所需要的观察值; 3.暂时或永久的删除未选择的观察值。 在完成特定的分析之后,记得恢复选择「全部 观察值」。 SPSS之应用(庄文忠副教授) 2019/9/5
选择观察值 SPSS之应用(庄文忠副教授) 2019/9/5
「有」工作(v27=1)且学历为「专科以上」(degree >=4) SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
选择观察值:V27=1 & degree>=4 全部观察值 选择观察值:V27=1 & degree>=4 SPSS之应用(庄文忠副教授) 2019/9/5
分割档案(split files) 有时利用类别变量的组别来切割一个档案是 非常有帮助的,如此一来,计算机就会自动 地分别对每一层别的数据进行分析。 最多可以设定8个分组变数。 两种分割档案方式: (1)比较群组 (2)依群组组织输出 在完成特定的分析之后,记得恢复选择「分 析所有观察值,勿建立群组」。 SPSS之应用(庄文忠副教授) 2019/9/5
(1)比较群组 SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
(2)依群组组织输出 SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
变量的重新编码(Recode) 利用改变实际的单一编码数值或将一群 编码合并成较大之集合体的方式,来变 更变量的单一编码或一组编码,这是数 据操作的基本形式之一。 重新编码的类型: 1.重新编码成同一变数(不建议) 2.重新编码成不同变数 3.自动重新编码 SPSS之应用(庄文忠副教授) 2019/9/5
例:年龄重新编码 年龄-岁数 年龄-类别 18 19 29 (1)年轻人 30 31 64 (2)壮年人 65 92 (3)老年人 18 19 29 (1)年轻人 30 31 64 (2)壮年人 65 92 (3)老年人 SPSS之应用(庄文忠副教授) 2019/9/5
重新编码成同一变数(不建议) SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
重新编码成不同变量 —数字变量 SPSS之应用(庄文忠副教授) 2019/9/5
重新编码成不同变量—数字变量 SPSS之应用(庄文忠副教授) 2019/9/5
原始数值 重新编码后 SPSS之应用(庄文忠副教授) 2019/9/5
重新编码成不同变量—类别变量 SPSS之应用(庄文忠副教授) 2019/9/5
重新编码成不同变量—类别变量 SPSS之应用(庄文忠副教授) 2019/9/5
原始分类 重新编码后 SPSS之应用(庄文忠副教授) 2019/9/5
自动重新编码 SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
计算(Compute) 如果一个或多个变量的数字编码是代表真实的 数量而非只是类别的标记,那么,这些编码就 可以成为算术运算的标的。 计算是产生新变量的方法之一,也可以提供更 有意义的变量,例如以身高和体重的比值换算 成「身体质量指数」(BMI)。 BMI=(体重)/(身高)2 如果有些个案是遗漏值,在计算时便会被排除, 成为「系统遗漏值」。 SPSS之应用(庄文忠副教授) 2019/9/5
简单的计算-周工作时数转换为年工作时数 SPSS之应用(庄文忠副教授) 2019/9/5
利用计算建立量表-工作成就感 SPSS之应用(庄文忠副教授) 2019/9/5
年工作时数 工作成就感 SPSS之应用(庄文忠副教授) 2019/9/5
计数(Count) 在许多不同的变量之中,有时可能会想 要知道某一个编码或某一范围内的编码 发生的次数。 计数的结果也可用以建立新的量表。例 如:各种参与政治的行为(投票、投书、 联署、call-in),可结合成政治参与量表 SPSS之应用(庄文忠副教授) 2019/9/5
计数 SPSS之应用(庄文忠副教授) 2019/9/5
SPSS之应用(庄文忠副教授) 2019/9/5
操作练习&提问时间 SPSS之应用(庄文忠副教授) 2019/9/5
作业: 利用「观察值摘要」、「选择观察值」 和「分割档案」的作法,比较男性和女 性的教育程度(degree)和接受教育年数 (educyrs)有何不同? 找一组题目,利用「计算」的指令建立 一个量表,并说明此一量表的意义。 找一组题目,利用「计数」的指令建立 一个量表,并说明此一量表的意义。 SPSS之应用(庄文忠副教授) 2019/9/5
作业:将变数v66重新编码成新变量whyjobend SPSS之应用(庄文忠副教授) 2019/9/5