Download presentation
Presentation is loading. Please wait.
1
外语教学科研中的统计与SPSS实现
2
教育统计学简要介绍 1.概念 将数理统计学的理论和方法应用于教学实际、通过对所获得数据分析和处理,达到探索教学规律、制定方案、作出决策和预测。 2.性质 应用性:更重应用,不细究数理 方法性:只是工具,不负责研究何种现象、提出何种假设、结论是否正确等。
3
教育统计学简要介绍 3.分类 描述统计(descriptive statistics)
描述数据全貌。包括数据分组,使用统计图表描述数据的分组和分布,计算数据参数 。 推断统计(inferential statistics) 依据随机样本数据,从局部推断总体特征。包括参数检验和非参数检验、方差分析、回归分析、因子分析等。
4
教育统计学简要介绍 4.基本概念 4.1变量(variable)
研究活动中的关键因素。相对于常量而言(在研究过程中始终保持不变的特征或条件)。 自变量(independent variable):教学方法 因变量(dependent variable):学生成绩 中间变量(interdependent variable):学习风格 如:研究者经常在课题的研究对象(某一层次的学习者)中安排不同风格的学习者。当某个自变量(如教学方式)变化时,可以观测到因变量(学习成绩)的相应变化及其规律。然后针对不同学习风格的研究对象(中间变量),再观察上述教学现象规律有何变化 。
5
教育统计学简要介绍 4.基本概念 4.2总体(population)、个体(individual)、样本(sample)
研究对象的全体为总体,组成总体的基本单元为个体,按照一定规则从总体中抽取的一部分个体为样本。 4.3样本容量(sample size) 无严格的数量界限。一般把样本容量小于30(50、100)的样本称为小样本,大于等于30(50、100)的为大样本。
6
教育统计学简要介绍 样本容量的标准A Sudman(1976): 样本的大小取决于总体的分布区域。
地区性研究:平均样本数在500至1000之间; 全国性研究:平均样本数在1500至2500之间。 重复前人的研究或进行类似研究时,可参考他人的样本数。
7
教育统计学简要介绍 样本容量的标准B Gay(1992): 样本的大小取决于不同的统计分析方法。
描述性研究:样本数最少要占总体的10%,如果总体本身较小,则样本数最少要达到20%。 相关性研究:样本至少在30人以上。如因果比较研究:各组人数不能少于30人。 严密控制的实验研究:每组受试者至少在15人以上,30人以上最为合适。
8
教育统计学简要介绍 样本容量的标准C Borg等人(1983): 样本的大小取决于研究条件的优劣。 出现以下情况时,要采用较大的样本:
测量工具的信度较低; 研究中有较多的变量无法控制、总体的同质性(homogeneity)不强; 研究中须用分组比较的统计分析方法。
9
教育统计学简要介绍 4.基本概念 4.4统计量(statistics)和参数(parameter)
统计量是不依赖于任何未知参数的样本的函数,即它是直接从样本数据中计算出的各种量数,如样本平均数( )、样本方差(S2)、样本标准差( S )、样本相关系数(r)。统计量不是未知数,它随样本的不同而取不同的值。 反映总体数据特征的量数为总体参数,简称参数,如总体平均数(u)、总体方差(б2)、总体标准差( б )、总体相关系数(ß)。总体参数是常数,但大多数情况下是未知数。 (对具体各种统计量和参数在以后举例中解释)
10
教育统计学简要介绍 4.基本概念 4.5正态分布(normal distribution)
正态分布是连续型随机变量分布中最重要也是最常见的一种分布。例如,在人数较多的群体中,测量身高、体重、智力水平、学习成绩等得到的数值,其分布都近似于正态分布。如学生的测验分数都是中等分数人数多,高分、低分人数少,如果以分数为横坐标,次数〈获得某一分数的人数)为纵坐标,绘制成曲线图,就会发现曲线呈中间大、两头小、左右基本对称的特点。 一般说来,只要随机变量取值的结果是由多种因素决定的,而且这多种因素基本上相互独立,随机抽取的样本有一定的规模,我们得到的数据的分布就近似于正态分布。
11
教育统计学简要介绍 4.基本概念 4.6等距或等比变量、定序或称名变量 等距或等比变量 (interval-based data)
一定单位的实际测量值,可以加减计算,如学生的考试成绩(65,76) 定序或称名变量 (ranked or nominal data) 定序变量:能够把研究对象从高到低或由大到小排序,如受教育程度(1=小学,2=初中,3=高中,4=大学,5=研究生);又如态度(1=完全不适合,2=通常不适合,3=有时适合,4=通常适合,5=完全不适合) 称名变量:变量值没有大小之分,只有类别之分,如性别(1=男,2=女)
12
教育统计学简要介绍 4.基本概念 4.7参数检验和非参数检验
参数检验(parametric test):总体服从正态分布、数值为等距或等比变量、样本数为单一样本或双样本。如T检验、两个或两个以上为本方差分析等。 非参数假设检验(non-parametric test):总体不一定服从正态分布、数值为定序变量(有时为等距或等比变量)、样本数为单一样本、双样本或多样本 。如X2 检验、Wilcoxon 检验、Mann-Whitney U检验。
13
5.具体统计分析的SPSS实现 5.1描述性统计分析 举例1:期末考试英语成绩描述 目的:试卷分析
内容:制作成绩频数(分段:0-60;60-70;70-80; 80-90;90-100)分布表并作频数分布分析 【平均值(mean),众数(mode),中数(median),标准差(Std. deviation),方差(variance),倾斜度(skewness),峰度(kurtosis),全距(range),总和(sum) 】
14
5.具体统计分析的SPSS实现 5.2推断性统计:分析不同数据间的差异 5.2.1前提条件一
首先要明确是将来自正态总体的单个变量的平均值与给定的单一标准值进行显著性差异比较,还是进行组间数据的显著性差异比较。如果是前者,并且总体呈正态,就选择单一样本t 检验(one-sample t-test)。如果是后者(组间数据),还要确定数据是来自相同受试者(同一样本的测试前后数据),还是不同的受试者(不同样本的数据),才能选择合适的分析方法。
15
5.具体统计分析的SPSS实现 单一样本参数检验:单一样本t 检验(one-sample t-test)
举例2:一个班英语专业四级统考成绩与全国平均成绩( )之间是否有显著性差异?
16
5.具体统计分析的SPSS实现 单一样本非参数检验:卡方检验(X2 test)(适用于称名变量,并且变量可以为双值或多值),二项分布检验(Binominal test)(适用于称名变量,变量只能为双值) 举例3:为了解对住房改革政策的态度,学校随机调查了125名教师。其中有41人表示赞成(1),37人表示反对(2),47人不置可否(3)。试问不同态度之间是否存在显著性差异?
17
5.具体统计分析的SPSS实现 5.2.2前提条件二 如果数据是来自相同样本,比较的是两组数据之问的差异,那么: 参数检验:配对样本T 检验
(Matched t-test) 非参数检验: A: Wilcoxon符号秩次检验 (Wilcoxon signed ranks test) B: 符号检验 (Sign test) C: McNemar检验 (McNemar test)
18
5.具体统计分析的SPSS实现 (Matched t-test)
举例4:为了考察某种阅读训练的效能,从某班学生中随机抽取10名学生对他们进行阅读测验,然后让他们接受这种阅读训练。经过一段时间的训练后,又对这10名学生进行类似的阅读测验。问:阅读训练前后的测验成绩是否有显著性差异? 举例5:受多种因素的影响,学生在不同阶段的学习努力程度会有所变化。如入学时可能比较努力,但过了一段时间可能仍然努力,也可能不那么努力。问:学生入学初与经过一段时间学习后努力程度到底是否发生显著性变化?
19
5.具体统计分析的SPSS实现 非参数检验: Wilcoxon检验(适用于等距变量)
举例6:在一次英语口语演讲比赛中,聘请了10 位评委参加评判工作。这10位评委对其中2 名选手的打分情况(满分为20分)如下。问:其中的一名选手的成绩是否显著地高于另外一名选手? 举例7:为检验某项识记训练的效果,从参加识记训练的学生中随机抽取了17名学生,将他们在接受识记训练前后的识记测验成绩列在下表中。问∶ 该项识记训练对学生识记能力的提高有无显著性影响?
20
5.具体统计分析的SPSS实现 非参数检验: B: 符号检验(Sign test)(适用于定序/等距变量)
举例8:某校为了考察论文奖励制度对教师科研工作是否起促进作用,随机抽取了30名教师,对他们实行论文奖励制度前后的年发表论文数进行了统计,见下表:问:论文奖励制度对科研工作是否起到明显的促进作用? 非参数检验: C: McNemar检验 (McNemar test) (适用于称名变量) 举例9:某外语学院36名英语老师对某种教学理念的态度(1=支持,2=反对)在专家讲座前后分别如下。问:专家讲座对36位老师对这种教学理念的态度是否产生了显著性的影响?
21
5.具体统计分析的SPSS实现 5.2.3前提条件三 如果数据来自不同群体的受试者,而且比较的是两组数据之间的差异,那么:
参数检验:两个独立样本t 检验(independent samples t-test) 非参数检验:Mann-Whitney U检验(等距变量)Crosstabs 检验(称名变量或等级变量)
22
5.具体统计分析的SPSS实现 参数检验:两个独立样本t 检验(independent samples t-test)
举例10:英语教师也许有这样的体会,女生往往比男生更用功。已知72名男女学生的两个学期课外学习时间,问:男女学生在努力程度上是否存在显著性差异? 举例11:某校对英语课进行教学改革试验,选取甲、乙两个平行班作试点。甲班30人,采用传统的教师讲授的教学方法,乙班33人,采用教师只讲授重点,主要由学生自学和学生相互讨论的方法。一学年后,用同一份试题对两个班的学生进行测验,得到如下表中的成绩。试问:这两种教学方法的效果是否有显著性的差异?
23
5.具体统计分析的SPSS实现 非参数检验:Mann-Whitney U检验(等距变量)
举例12:某校学生94人,其中男生49人,女生45人,他们英语统考成绩如下。问:男、女生英语统考成绩有无显著性差异? Crosstabs 检验(称名或等级变量) 举例30:某项课题需要研究教育对提高工作能力的作用,为此做实证研究,抽样调查636名职工各自的文化程度和工作业绩情况,如表所示,问文化程度与工作业绩之间的关系是否有显著差异(原始数据记录格式) ? 举例31(频数记录格式) Crosstabs 分层检验 举例32:某高校计算机课试行多媒体教学A与正常上课B的两种授课方法,观察成绩提高效率。考虑到专业是一个可能的混杂因素,将其也纳入调查,请分析授课方法与成绩提高效率(减少不合格人数)有无关系。
24
5.具体统计分析的SPSS实现 理工专业 文科专业 方法A 方法B 有效 21 26 18 88 无效 17 59 7 95
25
5.具体统计分析的SPSS实现 5.2.3前提条件四 如果比较的是三组或多组数据之间的差异,那么: 来自多个独立样本的数据:
参数检验:单因素方差分析(One-way ANOVA) 非参数检验:Kruskal-Wallis检验 (等距变量,常用);中位数(Median)检验(等距变量) 来自多个相关样本的数据: 参数检验:单因素重复测量方差分析(repeated measures ANOVA) 多因素方差分析(Factorial ANOVA) 非参数检验:Friedman检验(等距变量);Kendall检验(等级变量);Cochran’s Q检验(称名变量)
26
5.具体统计分析的SPSS实现 非参数检验: 多个独立样本: 中位数检验(Median test)(适用于等距变量)
Kruskal-Wallis检验 (适用于等距变量,更常用) 举例13:某高校为研究家庭情况对大学生消费水平高低有无影响的问题,从该校学生中随机抽取了43名学生,调查他们的平均每月的消费情况,得到如下数据(单位:元/月)。问:来自不同类型家庭的大学生的消费水平是否存在显著性差异? 举例14:某校对大二学生进行了一次英语测验。现分别从经济系、政法系、中文系、教育系以及理科各系中随机抽取部分学生的测验成绩(见下表)。问:不同学科学生的英语成绩是否存在显著性差异?
27
5.具体统计分析的SPSS实现 非参数检验: 多个相关样本: Friedman检验(适用于等距、等级变量)
Kendall检验(适用于等级变量) Cochran’s Q检验(适用于称名变量) 举例15:下例数据分别于学生刚入学时(1996年)、入学一年后(1997 年)和入学两年后(1998年),三次使用相同的量表,调查了相同的受试者收集得来的。问:这些学生的“表层动机”在三年来是否有显著变化? 举例16:5位教师对甲、乙、丙3篇作文所作的评价如下,问5 位教师对评价3篇作文所作的评价是否一致。 举例17:出版社为决定从三种英语候选教材中挑选一种出版,他们聘请了46名专家对这三种教材进行评价。根据以下评价表(1表示同意,0 表示不同意),能否认为专家对这三种教材的认可程度是没有显著性差异的?
28
5.具体统计分析的SPSS实现 参数检验:方差分析(ANOVA)
在教改中,通过实验我们会得到大量的实验数据,这些数据大多以学生的考试成绩反映出来。而这些成绩通常是在教学方法、学生的学习基础、学生临场发挥水平、试卷的难度、教师村评分标准的掌握程度等许多因素的制约下获得的。如何通过对实验数据的计算分析,找出对实验结果具有显著性影响的因素,这正是方差分析所要解决的问题。 基本思想:通过分析不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
29
5.具体统计分析的SPSS实现 一项实验有多个影响因素,如果只有一个因素在发生变化,其他因素保持不变,称为单因素方差分析。(One-way ANOVA) 举例18:为了寻求较好的词汇习得方法,现选择3种不同方法,分别对3个平行组学生进行一学期的词汇习得训练,期末时成绩如下。问:3种不同方法下的学生词汇习得成绩是否有显著性差异?哪种更理想一点? 举例19:为了寻求较好的英语阅读教学方法,现选择4种不同的教学方法,分别对4个平行班的学生进行一学期的教学,期末时成绩如下。问:4种不同教学方法下的学生英语平均成绩是否有显著性差异?哪种更理想一点?
30
5.具体统计分析的SPSS实现 如果有两个或两个以上的因素发生变化,那么对应的方差分析称为多因素方差分析。
几个因素(变量)对实验结果的影响有两种情况: A 独立影响(between-subject design) ,如单因素方差分析和双因素方差分析。 B 交互影响(within-subject design),如单因素重复测量方差分析和双因素混合方差分析。
31
5.具体统计分析的SPSS实现 A 独立影响(between-subject design) ,单因素方差分析(例18/19)和双因素方差分析。 双因素方差分析 举例20:8名评委对5篇论文的评分如下,试分析5篇论文的水平差异是否显著?评委对评分标准所掌握的分寸是否一致? 论文得分的多少主要受到两个因素的影响:一个是论文本身的水平,另一个是评委对评分标准所掌握的分寸(但两者之间无交互作用)。 需要检验的假设如下: ①5篇论文的水平无显著性差异; ②评委对评分标准所掌握的分寸无显著性差异。
32
5.具体统计分析的SPSS实现 A B C D E F G H 1 83 84 86 91 92 87 89 90 2 93 95 88
举例20 评委 论文 A B C D E F G H 1 83 84 86 91 92 87 89 90 2 93 95 88 85 3 71 70 73 75 74 80 77 4 68 65 69 61 60 78 67 5 94 96
33
5.具体统计分析的SPSS实现 B 交互影响(within-subject design),如单因变量单因素重复测量方差分析和单因变量双因素混合方差分析。 单因素重复方差分析 举例21 下例数据分别于学生刚入学时(1996年)、入学一年后(1997 年)和入学两年后(1998年),三次使用相同的量表,调查了相同的受试者收集得来的。问:这些学生的“深层动机”在三年来是否有显著变化?
34
5.具体统计分析的SPSS实现 双因素混合方差分析1 举例22
英语生词密度和题材熟悉程度是阅读理解的两个重要影响因素,如果既要同时检验这两个因素对英语阅读理解的影响(主效应),还要检验它们对英语阅读理解的交互作用(交互效应),即检验这样的假设:当文章的主题熟悉程度不同时,生词密度对阅读理解的影响会发生变化。假定研究者选择了两种类型的文章:对于学生来说题材非常熟悉的文章和学生不熟悉的题材的文章;同时有三种生词密度5:1,10:1 和20:1。 受试者有24人,将他们随机分为6 个小组。问:三种作用对阅读成绩的影响如何?
35
5.具体统计分析的SPSS实现 举例22 本双因素方差分析要检验的虚无假设有: ①“主题熟悉程应”的处理效应为0;
②“生词密度”的处理效应为0; ③“主题熟悉程度”和“生词密度”的交互效应为0。 不熟悉题材+5:1的 生词密度 不熟悉题材+10:1的 不熟悉题材+20:1的 熟悉题材+5:1的 熟悉题材+10:1的 熟悉题材+20:1的 3 4 5 8 12 6 7 9 13 2 11
36
5.具体统计分析的SPSS实现 双因素(重复测量)混合方差分析2 举例23
下例数据分别于学生刚入学时(1996年)、入学一年后(1997 年)和入学两年后(1998年),三次使用相同的量表,调查了相同的受试者收集得来的。问:男女学生的“深层动机”在三年来是否有显著变化?
37
5.具体统计分析的SPSS实现 协方差分析 将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制变量进行评价。 无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著的影响。如果忽略这些因素的影响,则有可能得到不正确的结论。 举例24 研究一个班3组同学(分别接受了3种不同的教学方法)在英语成绩上是否有显著差异。已知这些同学的英语入学成绩,数据如下。
38
5.具体统计分析的SPSS实现 相关分析 A: 积差相关法 是指采用英国统计学家Pearson皮尔逊提出的一种计算相关系数的方法。 举例25
对 15名大二学生用专四水平测验试卷进行测试,;其测验得分如下。另外已知这些学生的期末考试成绩,问他们专四成绩和期末成绩是否相关? 举例26 某大学一年级12名学生参加了语音、听写和语法三项考试。问:三项考试之间的两两相关系数。 当我们研究的变量不是等距或等比数据,或者变量不是正态分布时,若要考察它们的相关程度就必须采用等级相关法。它是依据具有等级顺序的测量数据(定序数据)来研究变量间相互关系的方法。研究等级相关的相关量主要有Spearman斯皮尔曼等级相关系数和Kendll肯德尔和谐系数。
39
5.具体统计分析的SPSS实现 B: 等级相关法
当我们研究的变量是定序数据,或者变量不是正态分布时,若要考察它们的相关程度就必须采用等级相关法。它是依据具有等级顺序的测量数据(定序数据)来研究变量间相互关系的方法。主要有Spearman斯皮尔曼相关(适用于非参数两列相关)和Kendall W肯德尔和谐系数(较保守,不如Spearman )相关。 举例27 其教研室要为学生准备一批英语课外阅读材料,教研室首先让一批学生读八篇材料,要求他们根据自己的感受,为这些材料的难易程度评定等级(等级分为九级,一级为特别简单,九级为极端困难)。然后让一批老师也为这八篇材料评定难易度等级。这样得到下面数据。 学生: 老师: 现在,要检验这两组变量是否有显著相关。
40
5.具体统计分析的SPSS实现 举例28 C: 点二列(point-biserial)相关法
研究中,常常有只含两个类别的变量(称名变量),例如性别、是否达标、正确与否等等。这类只有两种变化结果的称名变量称为“二分”称名变量。将0、1 分别与两种变化结果相对应,则对“二分”称名变量的一系列观察,得到一个“二分”数列。一个连续变量的一系列观测值是一个点数列。如果一个点数列中的点与一个“二分”数列中的点存在一一对应的关系,则称这两个数列为点二列。点二列相关法就是考查连续变量(其观测值为点数列)与“二分”称名变量之间的相关程度 举例28 某小学五年级男女学生I5人的英语成绩如下表,问英语成绩与性别是否有关?
41
5.具体统计分析的SPSS实现 D: 偏相关(partial)
在教育领域中两种现象之间的关系,往往受到多种因素的影响,是这些因素共同作用的结果,因而简单相关系数可能由于其他因素的影响而反映的仅仅是表面非本质的联系,不能真正反映两个变量之间的相关程度。为了正确地显示出两个变量之间的本质联系,必须剔除其他变量的影响。我们把两个变量在剔除了其他变量的影响之后的相关系数叫做偏相关系数。 举例29 傣族的母语是傣语,儿童小学开始学习汉语,上中学时又学习英语。近来研究人员对30名受过高等教育的傣族成年人进行了傣语、汉语及英语三种语言的水平测试,得到下面数据。问三种语言水平考试的相关关系,特别是傣语与英语的关系。
42
愿我们共同进步!谢谢大家!
Similar presentations