Presentation is loading. Please wait.

Presentation is loading. Please wait.

SPSS在教育统计中的应用 刘爱萍 liuaiping.psy@163.com 2012.12.05.

Similar presentations


Presentation on theme: "SPSS在教育统计中的应用 刘爱萍 liuaiping.psy@163.com 2012.12.05."— Presentation transcript:

1 SPSS在教育统计中的应用 刘爱萍

2 主要内容 SPSS统计软件概述 1 SPSS统计数据的创建与编辑 2 SPSS数据分析 3 SPSS数据输出 4

3 主要内容 SPSS统计软件概述 1 SPSS统计数据的创建与编辑 2 SPSS数据分析 3 SPSS数据输出 4

4 1.1 概述 SPSS—Statistical Package for the Social Science(社会科学统计软件包)
Statistical Product and Service Solutions (统计产品与服务解决方案) SPSS是世界上最优秀的统计软件之一,广泛应用于各科学研究领域(尤其是社会科学研究领域),因而是研究人员必备的科研工具。 最新版本 20.0 是一种集成化的计算机数据处理应用软件。

5 1.2 SPSS软件的特点 1 集数据录入、 资料编辑、数 据管理、统计 分析、报表制 作、图形绘制 为一体 2
统计功能囊括了 《教育统计学》 中的所有项目 3 界面友好 操作简单 从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例。 包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能做出各种统计图表(如正态分布图、直方图、散点图等)。 使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程。 SPSS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义。

6 统计功能 常规 集中和差异量数、方差分析、相关分析、回归分析、非参数检验、各种统计图表等 多元统计技术
多元回归分析、聚类分析、判别分析、主成分分析和因子分析等 包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能做出各种统计图表(如正态分布图、直方图、散点图等)。

7 主要内容 SPSS统计软件概述 1 SPSS统计数据的创建与编辑 2 SPSS数据分析 3 SPSS数据输出 4

8 2 SPSS统计数据的创建与编辑 2.1 SPSS数据的属性及其定义方法 2.2 SPSS数据文件的构成 应用案例:定义SPSS数据结构
2.5 数据文件的操作

9 2.1 SPSS数据的属性及其定义方法 一个完整的SPSS数据结构包括:
变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(变量长度、所占列宽、对齐方式)

10 SPSS中的变量除了定义变量名外还应该定义4个属性,变量类型,格式——变量宽度(width)、小数位数、缺失值定义(missing value),测度类型。另外为了输出查看方面还可以并以变量标签和值标签;变量在数据窗口中的 显示宽度(columns);SPSS的变量至少要定义变量名和变量类型,其他属性则可以采用默认值。

11 变量名 首字符必须是字母或汉字,后面可以是除(!、?*)之外的任意字符。 变量名的结尾不能是圆点、句点、下划线
变量名的长度不能超过64个字符 变量名必须唯一,并且不区分大小写 SPSS的保留字不能作为变量名(ALL、NE、EQ、GT AND、NOT、WITH) 如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字 为了便于记忆和理解变量名与其所代表的具体含义一致。

12 数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型)
变量类型 数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型) 字符型 日期型 系统默认为标准数值型 SPSS变量有三种基本类型:数值型、字符型、日期型(或日期时间型)。数值型变量又按不同要求分为五种。系统默认的变量类型为标准数值型变量(Numeric)。每种类型的变量由系统给定默认长度。小数点或其他分界符包括在总长度之内。变量的系统默认长度可以用Edit菜单中的Options命令重新设置。

13 点击进行设置 标准数值型变量用标准数值格式显示,不指定长度则使用默认长度,小数点要圆点。
带逗点的数值型变量,其值在显示整数部分自左向右每三位用一个逗点作分隔符,用圆点作小数点,不指定宽度则使用默认宽度。 圆点数值型变量(Dot),和带逗点的数值型变量正好相反,其值显示时,整数部分自右向左每三位用一个圆点做分隔符…… 对于数值很大或很小的变量可以使用科学计数法定义为带美元符号的数值型变量,其值在显示时有效数字前带有$,也可以不带。 日期型变量可以表示日期,也可以表示时间。 字符型变量的值是一串字符,字符串长度是任意的,使用时分为两种情况,值由8个(包括8个)以下字符组成的使用范围比较宽,8个以上使用时受限制。 字符型变量不能参与运算——建议使用短字符串变量 字符型是非数值型变量类型,其值是由字符串组成的,对其定义的对话框只有一个输入项

14 对数值型变量定义宽度和小数位数,而字符型变量只定义宽度。
宽度就是变量的长度 变量的总宽度 SPSS变量有三种基本类型:数值型、字符型、日期型(或日期时间型)。数值型变量又按不同要求分为五种。系统默认的变量类型为标准数值型变量(Numeric)。每种类型的变量由系统给定默认长度。小数点或其他分界符包括在总长度之内。变量的系统默认长度可以用Edit菜单中的Options命令重新设置。

15 对变量名含义的进一步补充说明

16 对变量可能取值附加的进一步说明,对分类变量往往要定义其取值的标签

17

18 系统默认无缺失值:如当前变量测试值、记录完全正确、无遗漏,则可用无缺失值。

19

20 ★离散缺失值:如性别0、3、4都是非法的,可分别填入
点击

21 列宽

22 指变量是如何测量的

23 点击 默认是等间隔测度,即连续变量。

24 度量标准(度量、序号、名义) 度量变量(scale)选项,定距型数据。对等间隔测度的变量或者表示比值的变量选择此项,如身高、体重、温度、成绩等。 序号变量 (ordinal)选项,定序型数据。对其值表示顺序的变量选择此项,如比赛名次、职称、职务、对某事物的赞同程度的变量,可以是数值型也可以字符型。 名义变量(nominal)选项,定类型数据,如姓名、性别、民族、宗教信仰等,是无序的分类变量,取值无法度量,只能作为分组变量使用,可以是数值型也可以字符型。 度量变量(scale),也即定距型变量,可以表示如温度、重量等含义的连续性数值变量,也可以表示年龄、次数等离散型变量,还可以表示时间的日期变量或者货币的货币型变量,但不能是字符型变量。 序号变量 (ordinal) ,也即定序型变量,如表示职称、职务、对某事物的赞同程度的变量,是分类变量中有顺序特性的一种,可以是数值型也可以字符型。 名义变量(nominal),也即定类型变量,如表示性别民族、宗教信仰、党派等的变量,是无序的分类变量,取值无法度量,只能作为分组变量使用,可以是数值型也可以字符型。 名义变量,如党派等

25 2.2 SPSS数据文件的构成 由数据结构和数据内容构成
结构规定了数据文件的基本构成属性(变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如变量长度、列宽和对齐方式等)。 如一个班考试成绩表包含姓名、考号、各科科目成绩(语文、数学、英语、物理、化学、生物、历史、政治、地理)等11个变量。对每一个变量定义其属性,如“姓名”变量定义为字符型、宽度定义为8个字符,度量尺度为定类型,由于变量含义清楚,无须定义变量标签和变量值标签,缺失值默认为0。

26 举例:创建SPSS数据文件 1.在变量视图区定义变量及其变量的属性 2.在数据视图区录入数据文件的内容 浏览数据文件变量名的三种方法
在变量视图区中浏览 在SPSS菜单中选择“数据”→“定义变量属性” 在SPSS主界面选择“视图” → “变量”

27 这个界面就是变量视图区

28 这个界面就是数据视图区

29 2.3 SPSS数据的录入 当变量的属性定义完成后就可以开始进行数据的输入
切换窗口从变量视图转至数据视图,出现了二维的空白表格(类似于Excel) Enter 输入一列相同参数 Tab 输入一行同一案例的数据 Shift+Tab 光标左移

30 2.4 SPSS数据的编辑 保证录入的数据准确无误,对SPSS数据可进行修改、删除、插入、复制、定位等操作。

31 2.5 SPSS数据的操作 ★创建和读取SPSS数据文件 ◇直接通过SPSS数据编辑窗口定义变量输入数据(如前所述) ◇通过打开不同格式的数据文件,间接创建SPSS 数据文件。支持*.doc,*.xls,*.txt等 ★保存SPSS数据 ◇经读取、修改后把SPSS窗口的数据以数据文件 的形式保存到外部的储介质中。

32 主要内容 SPSS统计软件概述 1 SPSS统计数据的创建与编辑 2 SPSS数据分析 3 SPSS数据输出 4

33 教育统计学的初步概念 被试 变量 误差 抽样与样本 显著性差异 被试——被研究者
变量:在教育研究中在性质、数量上可以变化的量以及测量或者操作的因子或条件。自变量(实验因素又称实验因子,它是由实验者操纵的,因变量是一种假定的结果变量,是实验对象在实验因素和其他控制变量的作用下的反应。例如,若一项实验想考察甲、乙、丙三种教学方法的教学效果如何,教学方法就是实验的自变量,教学效果就是因变量。 随机即随机现象:第一,一次试验有多种可能结果,所有可能结果是已知的;第二,试验之前不能预料出现哪种结果;第三,在相同条件下可以重复试验。 测定的观察值与真值之差称为误差: 随机误差:由与研究目的无关的难以控制的偶然因素引起的误差 系统误差:指与研究目的无关的因素所引起的有规律性的误差 抽样误差:指由于抽样而产生的误差,抽样误差属于随机误差的范畴 抽样:在教育研究工作中,往往所研究的总体包含的数目很多,不宜全部进行研究。例如,我们要研究全国高中毕业生的物理程度,对这一总体各个学生的成绩都进行研究是很困难和麻烦的,因此我们只能抽取一部分学生的成绩来研究——这种从总体中取出一部分个体的方法,我们称之为取样或抽样,所抽的部分称之为样本。样本中所含的个体的数目叫做样本的容量,大样本,小样本 在教育科研中分析教育调查和教育实验所获得的样本数据统计结果是,经常遇到有差异。但这种差异是来自于真正的总体差异,还是来自于总体本身无差异而是抽样误差造成的差异呢?对这种问题,我们必须进行统计检验。统计检验的一个重要内容便是差异的显著性检验。也就是说,在某种标准下去衡量差异是否显著,如果检验的结果属于差异显著,那就意味着两个统计量来自两个有差异的总体;如果检验的结果属于差异不显著,那就意味着两个统计量来自于一个总体或者两个没有差异的总体,或者说这种差异是由于抽样误差造成的。 统计检验的核心思想是反证法。在检验时,我们先假设两个总体平均数没有差异(μ1=μ2),这种假设称为原假设,然后通过检验其是否成立,也就是说,如果差异过大,就否定原假设H0,如果差异小,就接受H0. 统计结果有无差异必须以一定的标准去衡量。一般来说,大家习惯于以概率<5%和P<1%这两个标准来衡量。

34 3.1 描述统计 统计表与统计图 简单表、复合表、直条图、圆形图、直方图等 教育统计的特征量 集中量:平均数、中位数、众数 差异量:标准差
相关量

35

36

37

38 N代表学生数

39

40

41

42

43 N代表学生数

44 类似的,我们来看一下高一年级第一次月考成绩的描述统计量

45 3.2 推断统计——均值的比较与检验 来自正态总体的两个样本进行均值比较常使用T检验的方法,包括单样本T检验、独立样本T检验、配对样本T检验。 对于多个平均数之间的差异进行检验则需进行方差分析。 正态分布又称常态分布,它是一种应用广泛,且相当重要的概率分布。在实际生活中,凡自然状态下的整体数据分布都几乎是正态分布。正态分布是一种“两头小,中间大”的分布形态。 检验是检验差异显著性的十分重要的统计工具,这种差异显著性的检验是样本均值间的比较。因此T 检验也可以称为一种均值比较分析。 两个样本方差相等与不等时使用的计算t值的公式不同。

46 3.2.1 描述均值 描述均值

47 点击

48

49 3.2.2 单样本T检验 ★检验单个变量的均值是否与给定的常数之间存在差异。 ★样本均数与总体均数之间的差异显著性检验属于单一样 本T检验。

50 示例1 牛一高一第一次月考中化学考试总平均分为79.23分,检验期中考试化学成绩与79.23是否有显著差异? 点击 输入比较参照值

51 P值小于0.05,说明两次考试的化学成绩有显著差异,结合描述统计的结果可知期中考试化学成绩显著低于第一次月考。

52 物理学科呢? P值大于0.05,说明两次考试的物理成绩没有显著差异。

53 示例2 牛一高一期中考试数学考试总平均分为85.32分,检验各个班级的数学成绩与85.32是否有显著差异?

54 需要先拆分文件

55 按班级分组 然后同样采用单样本T检验

56 P值均大于0.05,说明1班、2班的数学成绩与年级总平均分没有显著差异。

57 P值均大于0.05,说明3班、4班的数学成绩与年级总平均分没有显著差异。

58 P值小于0.05,结合描述统计的结果,说明5班的数学成绩显著高于年级数学均分。

59 3.2.3 独立样本T检验 进行独立样本T检验,要求被比较的两个样本彼此独立,即没有配对关系。要求样本均来自正态总体,而且均值对于检验是有意义的描述统计量。 作T检验时,应首先检验方差是否相等。

60 示例1 现以银行男女职员现工资为例,检验男女职员现工资是否有显著差异。

61

62 点击现工资进入检验变量 点击性别进入分组变量

63 点击定义组,定义分组 组m为男职员 组f为女职员 点击继续

64 点击确定

65 P值小于0.05,说明男女职员的现工资的方差并不相等,那么就要继续看方差不相等的结果。

66 3.2.4 配对样本T 检验 进行配对样本T检验要求被比较的两个样本有配对关系,要求两个样本均来自正态总体,要求均值是对于检验有意义的描述统计量。例如: (1)比较两种饮料对抗疲劳的作用。同一窝实验用小白鼠按性别、体重相同配对。再随机分到实验组和对照组,分别喂加入海藻的饮料和普通饮料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间比较两组白鼠游泳时间均值。

67 (2)分析体育疗法对降血压的疗效。同一组高血压病人,每个病人在体育疗法前后的血压测量值构成观测量对。 (3)在研究人体各部位体温是否有差别时,一个人的两个部位的温度构成一对数据。

68 示例1 比较顺义区2012年高三一模和二模理科数学成绩是否有显著差异。

69

70

71

72 P值小于0.05,说明一模二模的数学成绩有显著差异,结合描述统计的结果可知二模的成绩显著高于一模。

73 3.2.5 方差分析 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响,通常是比较不同实验条件下样本均值间差异。
例如不同教学方法对提高某科成绩的效果,体育科研中研究训练目标、方法和不同运动量等因素对提高某项运动的成绩的效果,医疗界研究几种药物对某种疾病的疗效等。 方差分析是检验多个样本均数间差异是否具有统计意义的一种方法。

74 简单的一维方差分析示例1 在某校的数学教学实验中,为比较三种方法有无优劣之分,分别在三个组进行实验,每组6人,各组分别接受一种教学方法来学习同一个内容,学完之后进行统一测试,测试结果见下表,问:这样的结果支持三种教学方法无优劣之分的假说吗? 方差分析是检验多个样本均数间差异是否具有统计意义的一种方法。

75 表1 三个实验组的测试得分表 甲教学法 18 14 17 10 15 9 乙教学法 12 11 丙教学法 13 8 7
表1 三个实验组的测试得分表 甲教学法 18 14 17 10 15 9 乙教学法 12 11 丙教学法 13 8 7 方差分析是检验多个样本均数间差异是否具有统计意义的一种方法。

76

77

78

79

80 点击继续

81 点击确定

82 说明方差齐性 说明各组间均值没有显著差异

83

84

85 简单的一维方差分析示例2 饲料 用四种饲料喂猪,共19头猪分为四组,每组用一种饲料,一段时间后称重,比较四种饲料对猪体重增加的作用有无不同。
A B C D 133.8 151.2 193.4 225.8 125.3 149.0 185.3 224.6 143.1 162.7 182.8 220.4 128.9 143.8 188.5 212.3 135.7 153.5 198.6

86

87

88

89 点击继续

90 点击确定

91 说明方差齐性 说明各组间均值有显著差异

92 因为方差具有齐性,只要看LSD的事后检验结果。
比较结果说明,A与B、A与C、A与D、B与C、B与D、C与D各组均值间均有显著性差异。表中*标示的组均值在0.05水平上有显著性差异。

93

94 还有 单因变量多因素方差分析:一个独立变量是否受多个因素或变量的影响而进行的方差分析。 多因变量方差分析
重复测量方差分析(当测量次数大于等于3时) 相关分析:研究变量间密切程度 回归分析:自变量与因变量之间呈线性关系时,我们可以构造线性回归方程。 非参数检验:总体分布不明时用来检验数据资料是否来自同一个总体假设的一类检验方法。如卡方检验、两个独立样本检验、两个相关样本检验等。 因子分析 …… 1、性别、是否少数民族、教育水平等对现有工资的影响 0不用 1用此药物 AB药物治疗缺铁性贫血的疗效,分为四组:一般疗法、一般疗法+A药物、一般疗法+B药物、一般+A+B,redcell 因变量 2、作为对心肌梗塞的初步治疗,有时在手术之前给溶解血栓的药物,帮助请你患者的动脉。三种药物,A和B新药较贵,C。如果新药有效,患者住院时间就会较短,的确的卫生保健系统希望,较短的住院时间将有助于补偿较大的新药的初始花费。 住院时间 治疗药物的花费 因变量 3、对同一因变量进行重复测量 4、如身高和体重的关系 5、如以初始工资 工作经验 受教育年数等作为自变量,当前工资为因变量 6、非参 7 、在各个领域的科学研究中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性,减少分析指标的同事尽量如主成分分析利用降维的思想把多个指标转换成较少的几个互不相关的综合指标,从而使进一步研究变得简单

95 主要内容 SPSS统计软件概述 1 SPSS统计数据的创建与编辑 2 SPSS数据分析 3 SPSS数据输出 4

96 4 SPSS数据输出 手抄 截图 导出

97

98 计分、用时一致。 计分、用时一致。 欢迎交流!


Download ppt "SPSS在教育统计中的应用 刘爱萍 liuaiping.psy@163.com 2012.12.05."

Similar presentations


Ads by Google