Download presentation
Presentation is loading. Please wait.
1
第六章 干预性研究方法
2
实验出真知 教育是一首诗, 诗的名字叫创造, 在探索求知的丛林里, 有一面个性的旗;
教育是一首诗, 诗的名字叫智慧,在写满问题的试卷里, 有一双发现的眼。 实验出真知
3
教学内容 教学目标 理解实验的构成要素与特点 了解实验法的一般过程 掌握并理解实验的效度
掌握教育实验的设计类型,并能对实验结果进行解释和分析 教学目标 能够说出实验的内在效度与外在效度的因素 能够分析九组实验设计的特点,并能解释实验结果
4
第一节 实验研究 实验法的含义 实验法的特点 实验法的构成要素
5
一 实验法的含义 实验研究是根据一定的理论研究假设,在教育实践中运用必要的而又合乎情理的人为手段(自变量),主动干预或控制无关因素(无关变量),观察研究对象的发生、发展过程(因变量),经过一段时间之后,在统计分析基础上,探索、验证教育现象因果关系的研究方法。
6
二 实验法的特点 变革性 控制性 探求因果关系
7
(一)变革性 与调查、观察等其他经验实证方法相比,二者都是在不干预研究对象的前提下去认识研究对象,发现其中的问题。
实验却要求主动操纵实验条件,人为地改变对象的存在方式、变化过程,使它服从于科学认识的需要。
8
(二)控制性——精髓在于对实验条件的控制。主动操纵自变量,客观地测定因变量,严格地控制无关变量。
(引起,改变或终止) 自变量 如教材、教法、教师、学习方法等等 测量 (观察与记录) 因变量 如学生成绩、品德、健康等等 限制 (消除、固定或抵消) 无关变量 如学生特点、教师特点、学习环境等等。
9
(三)求因果 要找出:特定原因与特定结果之间的特定关系
10
要找出:特定原因与特定结果之间的特定关系
11
观察法、调查法都是对自然发生的现象进行描述、归纳与分析,不能主动操纵、干预研究对象,难以排除原因与结果之外第三变量的干扰,最终很难确认事物间的因果联系,只能对某种可能性的原因进行推测。
实验法是采用各种控制方法、技术来改变研究对象的存在状态,排除了无关因素的干扰,揭示变量间的因果联系。
12
教育实验 教育实践 变革性 科研活动 求善 非控制 控制性 求因果
13
新旧教育学的主要区别,在于它们积累经验的方式和研究的方法。旧教育学依靠知觉、内省观察和观察别人进行研究,可是这些方法本身是不完善的。因此,实验教育学通过全面地观察、统计和实验来补充和完善旧的研究方法。——拉伊 反思:教育实验法的局限性
14
三 实验的构成要素 自变量、因变量与无关变量 前测与后测 实验组与控制组
15
(一)变量 1.自变量 自变量是引起其他变量变化的变量,也称条件变量。是由研究者操纵对被试产生影响的条件(即采取的教育方法或措施等),是研究者呈现给被试的刺激变量。 教育实验的自变量一般是根据研究目的来设计的,如教学方法、教学组织形式、教材内容、课程结构、师生关系、德育方法、管理制度等等,都能作为一项实验的自变量。 例子:班级规模对教育质量的影响实验
16
在一个实验研究中,自变量不止一个,每一个自变量有多种水平。一般在2——5个之间,很少超过7——8个。
要区分自变量和自变量的水平。 上例中:班级规模是自变量,水平有多个,如30、40、50等。 例子:班级规模和教学方式对教育质量影响实验。自变量两个:班级规模、教学方式。自变量水平,如教学方式有三个水平:讲授式、小组合作式、计算机辅助教学式。
17
2.因变量 因变量也称结果变量,反应变量,是指由自变量的作用而导致的被试变化的结果,是对自变量的刺激作出的反应。 因变量的选择依据
一是它可以通过直接或间接的方式被观察,如学生的考试成绩及身心素质的变化。 二是观测指标可以被测量,并且可以转化为数据形式,用数字表示出来。例如,考分、智商。 三是在选择实验的因变量时,最好选择那些有量表或自己能够制造测量手段的工具来评价因变量,而且,要在实验计划中说清究竟怎样测出这些品质的变化。
18
因变量的选择标准 敏感性——自变量的变化能明显地反映在因变量指标的变化上。
客观性——所选指标具有可靠性和准确性,指标的解释不以研究者或被试的主观意志为转移。 稳定性——所选指标在重复测验中数值接近,能获得稳定一致的结果。 经济性——所选指标应观测方便,数据转换容易,能节省时间和精力。
19
3.无关变量 泛指除自变量以外一切可能影响研究结果,而对实验可能起干扰作用的因素。
无关变量对实验并不是真的“无关”,它只是研究者在实验中未作为自变量的、不打算研究的变量,也称非实验因子或无关因子。 教育实验的基本结构是由操纵自变量、控制无关变量、观测因变量三个相互联系的部分构成的。 进行几种不同教材的比较实验,教材之外的教师水平、学生原有基础、家庭辅导、学习时间等等一切可能影响教学效果的因素都是实验中的无关变量。
20
(二)测量 在一次实验中,需要对因变量进行前后两次相同的测量,教育实验的效果通过前测和后测的差异来作出解释。
在实验开始之前对被试进行的测试称为前测。 在实验开始之后对被试进行的测试称为后测。
21
(三)被试的分组 接受实验处理的一组称之为实验组,未接受实验处理的一组称之为控制组。 实验组(X _ experiment group)
控制组( C_ control group) 控制组由一组与实验组尽可能相似的学生组成,与实验组同时接受测量,但不接受实验处理。 控制组根据随机控制的程度分为两种,一是通过随机分配而形成的,称为等值组或真实控制组(radom group),一是非随机分配而形成的,称为不等值控制组(group)。
22
第二节 教育实验的一般程序 一个完整的实验一般经过三个阶段: 一、以理论设想为主的准备阶段 二、以实证验证为主的实施阶段
第二节 教育实验的一般程序 一个完整的实验一般经过三个阶段: 一、以理论设想为主的准备阶段 二、以实证验证为主的实施阶段 三、以理论概括为主的总结阶段
23
准备设 计阶段 实施 阶段 总结评 价阶段 推广 阶段 选 定 问 题 提 出 假 设 明 确 自 变 量 或 实 验 处 理 界 定 取
样 范 围 或 方 法 确 定 因 变 量 及 测 工 具 确 定 控 制 变 量 的 方 法 选 择 实 验 设 计 类 型 制 定 验 设 方 案 控 制 干 扰 变 量 调 节 实 验 进 程 记 录 实 验 情 况 分 析 整 理 资 料 形 成 研 究 结 论 撰 写 实 验 报 告
24
一 实验方案的理论部分 1、问题提出背景、明确实验研究的目的(意义) 2、形成实验假说,即搞这项实验要证明怎样的推断,探索一个什么规律
3、变量的定义 4、实验的指导思想与原理阐述
25
二 实验方案的设计部分 实验设计是进行实验前所做的具体计划。它主要包括控制实验条件和安排实验程序。
实验设计的目的旨在通过对影响因变量的因素进行合理的控制以提高实验结果的内外在效度,便于对实验得到的数据作出合理的解释。 一个好的实验设计是内外在效度较高的设计。
26
1.内在效度与外在效度 效度,指实验设计能够回答要研究的问题的程度。实验效度一般有两种:内在效度和外在效度。
内在效度:自变量和因变量之间存在关系的明确与真实程度。即因变量的变化在多大的程度上是由自变量引起的,是对自变量进行实验操作的结果,而不是由于其他因素的影响。 为了得到这样的解释,就必须对无关变量进行控制。如果我们能够控制所有的无关变量,能够证明因变量的变化仅仅是由于对自变量的实验操作,那么我们就得到了最好的内在效度。
27
实验者 干扰因素 实验对象 自变量 反应变量 X Y O 操纵 测量 排除
28
外在效度是指在与实验条件相类似的情况下实验结果可以推广的范围。
一般地说,一项实验的内在效度越充分,实验结果推广的范围越大,实验的价值就越高。 内在效度和外在效度并不总是一致的,内在效度和外在效度之间是会有冲突的,要保证一种效度,可能会削弱另一种效度。
29
2.影响内在效度的无关变量 (1)偶然因素(History)——在实验过程中没有遇到的影响因变量的事件的发生。
如在一项听力材料的训练中,突遇噪音影响 (2)成熟程度(Maturation)——时间在被试身上起的作用。 人无论是否参与实验,都在不断地成长和变化,而此类变化将影响实验结果。如在一项长期实验中,被试可能因年龄增长而出现智力发展变得聪明,即使参与短时的实验,被试也可能因疲倦、无聊、饥饿等原因而改变他们在实验中的行为。
30
(3)测验(Testing) ——前测对后测的影响
如果实验中一测再测,也会影响人的行为,进而混淆实验的结果。如第二次给被试发同样的问卷,他们可能会意识到实验研究的意图,竭力得出研究者期待的答案。 心理学测验招被试一般不招测过的人。 (4)被试的选择差异(Selection Biases)——未能随机分组 所选的两组或者几组被试之间在未进行实验之前,本来就可能有各方面能力的偏差,这种由于不同组别受试者之间的特征产生的差异,经过一段施测后,所得的实验结果而显示的变化不能完全由实验操作来解释。所以,选取被试的一个重要原则是实验组与对照组具有可比性,否则比较起来毫无意义。
31
(5)统计回归(Statistical regression) ——指被试选择有极端取样并且有两次测量时,因变量观测可能受到的一种影响,即向平均数回归。
统计学家指出,统计回归是一种事实上存在的现象。在重复进行的测验中,每个被试测量的分数,出现向平均分数回归的现象,高分组的分数可能降低,低分组的分数可能上升,这些都不是由于实验操作引起的,而是由于统计回归现象,所以,如果以高分组或者低分组这样极端分数学生为被试,或者选择的被试高分或低分偏多,对因变量的观测就可能受到统计回归的影响,观测到的因变量变化并不完全是实验操作的结果。
32
(6)测量手段(Instrumentation)不统一带来的影响
在实验的测量中,因为测量工具(如试卷、仪器)的不同,测试人的变化,测量评价标准不一致,影响对实验结论的解释,影响实验的内在效度。就不能完全解释为实验处理达到的效果。 (7)流失——被试的偶然减员或者中途退出,如被试转学、或因家长原因等退出实验 (8)取样和成熟程度的交互作用——由于取样不一带来的成熟程度的不一致 如在一项合作学习实验中,尽管实验对象在成绩的前测分数相等,但是,实验组学生偏好合作学习,那么,这种偏好程度或动机水平就与成绩一起对实验结果产生作用。
33
3.影响外在效度的无关因素 (1)测验的交互作用——测验与实验处理发生作用,并导致结果不能推广到未经前测的群体中
这是指接受了前测的被试,可能对实验操作和实验后的测验有所觉察,产生敏感性的反应。在实验操作中,特别注意与前测有关的问题和内容,结果实验后测验成绩有很大的改进。这种改变不是实验操作自身的结果,也不是前面说的对测验本身的熟悉,提高测验成绩,而是前测和实验操作交互作用的结果。因为前测使他们产生了对测验内容的敏感。如果没有前测,可能不会得到这样好的成绩,所以,有前测的实验不能推广到没有前测的范围。
34
(2)抽样偏差和实验处理的交互作用——根据实验处理的需要而挑选现成的班级进行实验,其结果不能推广。
选择有偏差,而实验处理恰好在偏差上有特别的意义作用,就构成了这种交互作用。 在教学方法的实验中,选择低能力班进行实验,其结果不能推广到能力各异的班级。 比如选择具有高智力水平的学生进行发现式教学和传统教学的比较。实验的结果是发现式教学优于传统教学,这个结论就不能推广到全体学生,因为被试的选择是有偏差的,而智力高的学生可能在发现式教学中特别受益。如果把这个结果推论到智力一般或智力较低的学生就全造成推论的错误。
35
(3)实验安排的副效应——被试知道他们要参加实验而产生新鲜感,也称霍桑效应
由于实验情境的安排,被试知道自己正在参加实验,表现出与平时不同的行为。比如,教师和学生都可能因为被选择参加一项新的教学方法的实验而表现出比平时更多的兴趣和动机,更大的主动性积极性。这就会造成实验情境下所得到的结果和自然情境下大不相同。这种情况下得到的实验结果不能推广到日常生活情境。 这种情况最著名的例子就是“霍桑效应”,20年代末期美国芝加哥西方电力公司霍桑工厂曾经进行一系列实验,研究工作条件和工人生产率的关系,其中一项是照明。他们发现照明强度增加,工人的产量也增加,但是,当他们开始逐渐分阶段减弱灯光的强度时,却发现工人的产量仍然在继续增加,这使他们意识到、工人的产量在增加并不是由于灯光的变化,而是由于他们知道在参加实验而增强了动机和积极性。
36
(4)多重处理效应——一个被试接受两项获两项以上的处理,导致不能推广到单独处理中
当被试重复接受两种或者多种实验处理时,由于前面的实验处理的作用没有完全消失,于是同后面的处理发生重叠作用。 比如让被试重复运用三种学习方法学习,当实验结果表明第三种方法效果最好时,并不能把这个结论推广到仅仅使用第三种方法,因为第三种方法效果好,可能是和其它的两种方法共同交互作用的结果,所以重复实验的结论不能推广到做重复处理的情境中去。
37
3.无关变量的控制 (1)消除法 控制无关变量最有效的方法,就是简单地把它们从实验环境中消除,根本不让它在实验过程中出现。
比如,像噪音之类的物理因素的干扰,如果在教育实验中成为无关变量,比较容易用消除法来控制。 如果认为智力因素会影响结果,可以只选择高智力的学生为被试(或只选中等智力、低智力学生为被试),这样智力因素对实验的影响就被排除了。 同样,如果认为性别因素对实验有影响,可以只选单一性别的被试,这样也可以排除性别因素对实验结果的影响。 消除法可以很有效地控制无关变量,但是在教育实验中,很多无关变量是不能用消除法来控制的。有些可以用消除法来控制但是又破坏了外在效度,使研究结果缺乏普遍的推广意义。像前面说到的只选高智力学生为被试,只选男生或女生为被试,都降低了可以推广的程度。所以,在教育实验设计中,更多的无关变量的影响不能用消除法来控制。
38
(2)恒常法 在实验中不能消除的无关变量可以用在整个实验过程中使之保持恒常不变的方法来控制。这样虽然是一个变量,却可以作为常量来对待。在整个实验过程中,由于它没有改变,它对每个被试来说产生的影响也没有变化差异,所以它不会对因变量的差异产生显著影响。 比如,如果教师成为影响实验效果的重要因素,可以由同一位教师担任实验组和控制组的教学。 如果时间对实验结果有影响,可以每次实验都在相同的时间进行,使实验的时间保持恒常。 其他还可以选择同一地点、同样的设备,选择智力、性别、年龄、教育程度相同的被试等等,都是用恒常法来实现对无关变量的控制。
39
(3)抵消法 有些实验,需要使被试先后接受不同的实验操作,这样不同的实验处理出现的顺序可能会影响实验效果的解释,实验出现先后次序的不同可能引起被试的反应也不相同,抵消法就是把实验处理排列成出现的次序机会均等的组合,每一种处理虽然以不同次序出现,但是每一个处理处于某一次序的次数相同。 比如,两个实验处理AB可以第一次先做A后作B第二次先作B后作A,就是ABBA排列,这样就可以抵消出现的次序不同对实验结果的影响。
40
(4)均衡法 均衡法是指在实验组与控制组或者几个不同的实验组内使无关变量保持基本相同的状态,使它们在不同组内对实验因素的影响基本一致,这样可以不影响自变量和因变量关系的解释。 使用均衡法控制无关变量,无关变量的影响仍然存在,但是它们是均衡地作用于各个被试组。各个被试组除了实验处理不同之外,其它情况都相同,包括无关变量的影响也相同,最终使因变量的变化合乎逻辑地归结为实验控制的结果。
41
怎样达到均衡? 对环境条件来说,实验中为实验的各组学生安排同样的教室、上课时间、作业量等,使环境因素的影响均衡。 对实验者来说,各组主试若不是同一人选,则必须注意他们各方面条件的对等,如教育思想、业务水平、工作态度等必须相当,不应出现有的主试担任某一被试组的班主任,而其它主试却不担任班主任等差异现象。 对被试(机体变量)来说,主要是怎样把被试分到各个组,使各组被试情况基本相同,通常是用随机方法或者匹配的方法来分组。
42
(5)随机化方法 随机化方法是指被试的随机选取和随机分配。从实验研究的研究对象总体中随机选取被试,可以保证选取的样本代表总体,没有选择的偏差。随机分配是把随机选取的被试随机分配到各个实验组和控制组去,由于被试是随机分配的,可能对被试发生影响的各种无关变量在各组的分布也随机化了。 从理论上说,随机化是控制无关变量的最佳方法。因为在概率的原则下,无关变量在所有实验组和控制组中的分布和影响相同,并且对于控制可能存在的未知的无关变量的影响,随机化是唯一的方法。所以,随机化是所有控制方法中最基本的方法,是实验设计最重要的原则,各种控制方法都应尽可能采用随机化原则。 但是,随机化所达到的是一种统计上的相等,并不是绝对的相等,由于偶然性的存在,造成无关变量的在各组之间的分部不均等也是可能的,也就是说使用了随机化方法,仍然可能存在偏差,被试数量越少,这种危险发生的可能性就越大,因此,加大样本容量,可以使各种偶然因素的作用相对抵消,避免偶然性造成的误差。
43
(6)统计处理 如果无关变量的影响无法消除,但是可以测量,还可以运用统计方法,通过对数据的分析处理,来计算剔除无关变量影响之后实验操作和因变量之间的关系。 例如,进行教学方法的实验研究,被试的智力水平是一个影响实验结果的无关变量,在无法以智力等同的被试组进行实验时,可以在实验前先测试被试智力水平。实验之后,用协方差分析方法来推断剔除智力水平对因变量的影响后教学方法的不同水平对训练效果的影响,这样虽然实验中并没有排除无关变量的影响,但是通过数据处理,在对结果的解释中可以剔除无关变量影响,从而说明实验操作与因变量的关系,达到控制无效来源提高内部效度的目的。
44
三 实验设计的类型 1.实验设计所用的符号的意义 “R” 指随机安排 “----” 水平划线,把两组分开,指两组不是随机安排的。
“----” 水平划线,把两组分开,指两组不是随机安排的。 “0” 表示某种测量、观察。 “X” 表示实验组要接受的实验处理
45
时间 1 2 (前测)(后测) 实验组 控制组 两组随机 前测 实验组 后测 安排 (接受方案X) R 0 X O R 0 C O
(前测)(后测) 实验组 控制组 两组随机 前测 实验组 后测 安排 (接受方案X) (接受方案C) R X O R C O
46
2.按照对实验控制的程度不同,实验设计模式又可以分为真实验设计,准实验设计和前实验设计三种类型:
前实验设计——对无关变量不能控制,但是可以操作变化自变量,前实验设计不是严格意义上的实验,实际上只是变量关系的一种描述,所以也叫非实验设计,它能够为真实验设计提供资料,所以叫前实验设计。 准实验设计——也叫类似实验设计,它与真实验设计有些相似,能够在一定程度上控制一部分无效的变量,但是不能像真实验设计那样随机选择和分配被试。 真实验设计——按照随机原则选择和分配被试,有控制组对照比较,能够较好地控制内部、外部无效度来源(前面所讲的影响内在、外在效度的因素)使实验得到比较严格的控制的设计。
47
3.九种常见的实验设计模式图 (1)前实验设计——没有控制组或没有相等的控制组,有三种形式 ①单组后测设计 G X O ②单组前后测设计 G O1 X O2 ③固定组比较设计 G X O1 G _ O2
48
①单组后测设计(单一性个案研究) G X O 特征:只有一组被试且不是随机选择,无控制对照组;实验中只给予一次实验处理;有一个后测。将后测的结果作为实验处理的效应。 例1.在某幼儿园大班(实验组G)按小学准备状态教育大纲进行了为期9个月的训练(操作X),训练活动结束后,对全班学生进行观测审定(相当于后测O),观测审定的结果认为达到了大纲的要求,因此研究者初步认为,按照这个大纲进行的教育取得了使学龄前儿童完成入学准备状态训练的效果。
49
第一,这个实验组不是随机抽取的,同时也没有随机等组作对照比较,不能控制选择偏差,也就是说不知道在实验前被试与没有参加实验的儿童有没有区别,也无法说明这个实验班儿童入学准备状态比没有受过这个大纲训练的同龄儿童是否有显著差别。 第二,由于没有对照组比较和控制,不能排除家庭教育、环境影响的作用,也就是不能控制历史、经历等无关因素的作用,不能证明儿童的准备状态只是由于按大纲进行了训练的结果。 第三,训练长达九个月,在这期间,儿童自身会发生很多内部的变化,很难说儿童准备状态的变化没有成熟因素的作用。
50
第四,由于选择偏差存在,这种设计不能排除极端分布的可能,但是没有前后测的比较,也就不会因为测验成绩的回归效应影响对实验结果的解释。
总之,这种实验设计,由于没有前测,不能说明实验措施是否带来变化,由于没有控制组,也不能说明实验结果是否是由实验措施带来的。因此内外在效度就不高。
51
②单组前后测实验 O1 X 02 特征:只有一个被试组且不是随机选择,无控制对照组;仅一次实验处理;有前测和后测,用前后测的平均分做差异检验来说明实验处理效应。 举例:我们准备在一个自然班上用一种新的方法进行教学,即探讨一种新的教学方法对儿童数学成绩是否有影响,研究者以儿童解决应用问题为测量指标,先对儿童在教学前测定其解决问题的成绩,然后施行新的教学方法,一个学期结束后,再用同样的程序测定儿童的应用题成绩。检验两次测验平均成绩是否有显著差异。如果02 > O1 ,并且经过检验差异显著,可以说这种教学方法对学生的数学成绩有影响。
52
优点: 因为有前测,可以在处理前提供有关选择被试的某些信息。 通过前后测,可以提供每一被试在实验处理前后两次观测条件下行为变化的直接数据,能明显验明实验处理的效果。 对同一组被试进行前后测比较,相当于以实验组本身作为控制组,这在一定意义上控制了选择偏差的影响,因为是同一组被试,不会产生选择的不等,在这个意义上对选择偏差因素有控制作用。 局限: 它不能说明在前测和后测之间有没有其他事件引起因变量的变化。如我们在前面说过的,也许这期间其他课程教学恰好有助于提高学生的学习成绩,这说明它没有控制历史(同时事件)这个无关变量的影响。 没有控制成熟因素,学生生活经验的增长、智力的发展等都可能使02>O1。这也影响到成熟与选择的交互作用,影响内部效度。
53
由于有前测, 02>O1也可能是因为熟悉了测验的方式和内容,有前后测而没有比较组,测验工具可能成为无效度来源。
流失的影响它同样不能控制。 总之,内外在效度较低。由于单组前后测设计在内部效度方面存在这些问题,所以它也很难做出因果关系的结论。这种设计被认为和单组后测设计基本一样,一般都不能说明问题。
54
③固定组比较设计 G1 X O1 G 特征:在这种设计中,有一个组为控制组,一个组为实验组;在实验中对实验组施以自变量,控制组则做为比较组存在,但两个组不是随机选择,也未加任何控制选择偏向;两组均无前测;实验结束后对各组进行后测,根据实验组与控制组因变量的差异,得出实验的结论。 例:研究者在两个班上进行教学实验,实验班引入新的教学方法(X),称之为实验组,控制组沿用传统的教学方法,一学期后进行测验,并对两组物理测验成绩进行比较,看哪种教学方法更有效。 G1:1班 X 新的教学方法 O1 后期测验 G2:2班 传统方法 O2 后期测验
55
固定组比较设计,在教育研究中应用比较广泛,通常在学校教学实验效果研究中应用。
主要优点:影响内部效度的某些因素得到一定的控制 由于使用了控制对照组,历史因素会受到一定的控制。 这种设计没有前测,不会发生前测对后测的影响,所以测验工具和回归的影响在这种模式中没有影响到实验结果的解释。 成熟因素会受到一定的控制。如果是同年级的班,年龄相仿,成绩因素的变化也可以认为是相当的。 主要缺点:没有控制选择因素 由于被试不是随机分组,又没有一个前测数据,因此判断被试组是否为等组是困难的。实验结果可能是由于被试选择偏差带来的。相应地,选择与成熟的交互作用也无法控制好。
56
因此,这种设计仍然不是一种严格意义上的实验设计,还是属于前实验设计,不过它在前实验设计中是一种比较好的设计。在现实的教育研究中,由于随机选择条件得不到满足,这种设计是常常被采用的。
57
(2)准实验设计 准实验设计是在现实的教育情境中,由于不能用真实验设计来控制无关变量,不能采用随机化方法选择分配被试的情况下进行的实验设计,准实验设计又叫类似实验设计,它在很多方面都与真实验设计相类似。 突出的区别在于,准实验设计是使用原有的群体(教学中原有的班、组等群体)。由于缺少随机组合,准实验的内在效度和外在效度都受到潜在的威胁。 在教育研究中,准实验设计是最有可能实现的,甚至有人认为教育实验只能是准实验,准实验在教育研究中的价值是十分重要的,但是需要特别注意:对实验结果的解释和推广,应该特别慎重。
58
准实验设计三种模式 ①不对等两组前后测实验设计 G1 O1 X O2 G2 O3 _ O4 ②时间系列设计 G O1 O2 O3 O4 X O5 O6 O7 O8 ③平衡实验设计 G1 X1O1 X2O2 X3O3 G2 X2O2 X3O3 X1O1 G3 X3O3 X1O1 X2O2
59
①不等控制组设计 G1 O1 X O2 G2 O3 - O4 特征:通过非随机安排形成两个不完全等值组;前测的目的是为了弥补不能对被试随机选择和分配的缺陷,前测获得两组差异程度的具体数据,为两组后测提供一个进行比较的基础;实验组接受实验方案X,控制组不接受方案X,同时,控制组可以完全不接受任何方案,或接受另一种方案C;用两组前后测结果的差异来说明实验处理的效应。
60
评价: 由于有控制组,历史、成熟因素的影响可以通过控制组与实验组的比较得到控制。 前测对后侧的影响、测量工具的影响是可能存在的,但是由于有控制组,又可以认为这些影响在实验组与控制组中影响是一致的,不影响对因变量变化的解释。 对于选择偏差,这种设计因为不是等组,对两组的选择和分配不是随机的,有可能出现选择偏差。前测是反映两组的差异,不能控制两组的差异。如果前测能够说明两组是等质的,这种选择偏差可能不存在。 前后测的交互作用。因此,实验结果不能直接推论到无前测的情境中,对实验结果的解释要慎重。
61
②时间系列设计 G O1 O2 O3 O4 × O5 O6 O7 O8 特征:时间系列设计基本上是一种单组前后测设计,是对一组被试或一个被试进行周期性的测量,并且在测量过程中引进实验处理,通过实验处理后的变化,推断实验处理是否产生效果。 例:一位理疗师对一组病人实施一项为期8星期的康复计划。前4周小组成员每天都接受传统治疗方法,每周末根据一份身体能力测试表进行测试。从第5周开始施行了一种实验治疗法,同样每周末进行身体能力测试。
62
评价: 它可以避免只根据一次观测做出草率的结论; 对于成熟、测验、工具、回归、流失等因素有控制作用; 由于是自身与自身相比较,也可以对选择偏差,选择成熟交互影响有所控制。 主要缺点是历史(经历、同时事件)因素不能得到控制。实验过程中同时事件的影响可能造成观测结果改变。 时间系列设计时间比较长,发生同时事件的机会也就增加。这同时也增加了成熟、测量工具不稳定、被试疲劳、流失机会。所以,控制的作用是相对的,有一定的控制作用,但是存在着发生无关变量影响的机会。
63
③平衡设计 也叫拉丁方设计,所谓拉丁方是指由几个拉丁字母排成的行列相等的方阵。在这种排列中,每个字母在每行每列中只能出现一次,并且必须出现一次。 如果是3×3方阵,就是 A B C B C A C A B 平衡设计就是用拉丁方阵来安排各种实验条件,方阵的大小由研究中实验处理的数目决定,有几种处理,就设几个实验组。以G1、G2、G3三组被试进行X1、X2、X3三种实验处理,做仅施后测的平衡设计为例,平衡设计的基本结构模式是: G1 X1O1 X2O2 X3O3 G2 X2O2 X3O3 X1O1 G3 X3O3 X1O1 X2O2
64
例:进行朗读法和默读法的实验效果的比较 操作时要使每一个组接受实验组合的影响,即让每组被试同时接受不同的实验处理,第一轮实验以后,测量两组的教学效果,再将两种处理轮换对调,进行第二轮实验(两组实验的时间相等),再次测量两组的教学效果,然后将测量结果进行比较。其基本模式为(可加控制组): G1:O X1 O2 X2 O3 G2:O X2 O5 X1 O6
65
评价: 平衡设计可以抵消顺序误差产生的影响,就会控制了选择、历史、成熟、测验、工具、回归、流失等无效度来源。 可以避免时机与情境对实验处理所产生的影响,是一种具有较好的内部效度的实验设计。 但是由于被试分配、实验处理交互作用复杂,选择与成熟及其他因素的交互作用情况也很复杂,使用时要谨慎。 平衡设计的缺点是同一组接受一个以上处理,有可能产生多重处理干扰,实验处理交互作用复杂。
66
(3)真实验设计 真实验设计,有两个最重要的特点:第一是被试随机选取分配;第二是有控制组。 被试随机选取,避免选择偏差,随机分配到实验组和控制组,保持各种无关变量分布的随机化。由于随机化和与控制组的对照比较,使实验中能够充分控制无关变量影响,获得比较准确的实验结果。凡是能够达到这两个要求的,就是真实验设计。
67
真实验设计的三种模式 ①随机等组后测设计 RG X O1 RG _ O2 ②随机等组前后测设计 RG1 O1 X O2 RG2 O3 _ O4 ③所罗门四组设计 RG1 O1 X O2 RG2 O3 _ O4 RG X O5 RG _ O6
68
①随机等组后测设计 RG1: X O1 RG2: — O2 G1、G2代表两个组,R表示随机选取和分配被试,RG1、RG2是按随机化原则而产生的两个组,由于被试的选择和在两个组中的分配都是的随机的,这两个组是随机等组。 例:一位教师做一个不同类型的辅助教材对学生阅读成绩影响的实验,随机选取15名学生做实验组,15名学生做对照组。在每天的阅读教学中,实验组使用辅助教材进行阅读,控制组使用传统教材进行阅读,8周教学之后对学生进行阅读测试,测验的成绩是因变量。如果O1>O2,且经过统计检验证明差异显著,那么实验组的成绩显著高于控制组,证明使用辅助教材有助于提高学生学习成绩。
69
优点:随机等组后测设计是一种比较理想的实验设计,它几乎对所有的无关变量都有控制作用。
随机选取和分配被试,控制了选择因素的影响,控制了选择偏差和选择与成熟交互作用两个内在效度影响。 控制了历史、成熟因素。由于有随机等组做控制组,对实验结果的分析是以两组后测成绩的对照比较为依据。在两个随机等组中,历史经历(同时事件)和成熟的影响是随机化的。如果有历史、成熟因素与影响,那么,对两个组的作用是均衡的,不影响对实验结果的解释,这样历史、成熟因素得到了控制。 由于没有前测,可以避免前测经验对后测的影响,控制了测验因素的影响和前后测工具不一致的影响这两个与测验工具有关的内在无效度来源。 由于随机选择分配,控制了选择偏差,避免被试的极端分布(不会出现高分低分极端分布的情况),又可以避免统计回归因素的影响。
70
局限:它只运用于一个实验处理的实验研究。在教育实验中要操作的自变量往往不只是一个水平。比如两种教学方法、两种教材的比较等,都需要操作两个以上的水平,这种设计模式就不能满足需要。
随机等组后测设计可以扩展到多组的情况,来实现多种实验处理,成为这种设计的变式。例如: RG1: X O1 RG2: X O2 这种设计,还是一种单因素实验设计,只有一个自变量,但自变量有两个不同的水平,有两组实验处理。 前面说到真实验都有控制组,在这种变式中,两个组是随机等组,每个组都可以看作是另一个组的控制组。他们之间的区别仅仅是实验操作不同,那么要不要设一个不加实验操作的控制组,这取决于实验的需要。如果需要和不加实验操作的情况对比,可以设一个不加实验处理的控制组。
71
②随机等组前后测设计 RG1: O1 X1 O2 RG2: O3 X2 O4 RG3: O5 — O6 这个基本模式与前面的等组后测设计模式相类似,不同之处,就在于对实验组和控制组除了进行后测,取得后测成绩O2和O4之外,在对实验组进行实验处理之前,对三组都进行前测,分别取得前测成绩O1和O3、05。 这种设计实验的结果,不能简单地用后测成绩O2和O4做比较,还需要以前测成绩O1和O3的比较作为基准,如果两组前测成绩基本相同,可以比较O2和O4之间的差异;如果两组是不等质的,不能直接对O2和O4进行比较,需要用前后测之间的增值(O2- O1)和(O4-O3)进行比较和T检验。
72
前测的优点 对于随机等组,如果认为作为等组的依据还不充分,通过前测可以检查随机分组是否存在偏差或者进一步证明两组的等值,如果对于随机分配的等值性把握不大,比如样本很小等情况,通过前测可以为证明等组提供依据。 当需要前测成绩进行统计分析和计算时,前测数据对研究是很有价值的。运用协方差分析和要计算因变量观测值的增量(O2-O1)和(O4-O3)了解实验前后因变量变化时,前测数据都是很有意义的。 前测缺点:它增加了无效度来源,前测对后测的影响是存在的。随机等组可以在一定程度上控制前测对后测的影响,但并不能消除。 随机选组控制了选择因素,有控制组控制了历史因素和成熟因素。
73
③所罗门四组设计 所罗门四组设计是所罗门1949年提出的一种随机化设计模式,它的基本模式是: RG1 O1 X O2 RG2 O O4 RG3 X O5 RG O6 这个设计,有4个随机等组,两个实验组,两个控制组,两个实验组所做的是同样的实验处理X,只是一个有前测一个没有前测。 这种设计模式,很明显,就是我们前面提到的两组模式,随机等组前后测和随机等组后测组合在一起构成的,随机等组前后测设计和随机等组后测设计都是比较严谨的控制设计。这两种设计模式组合在一起不仅保留了这两种设计的优点,而且还可以获得更丰富的实验信息和更严谨的控制。
74
O2-O1,如果O2>O1,说明实验处理X后,因变量发生了变化,这种变化是不是X引起的,仅有O2>O1还不能说明。
O2-O4,如果O2>O4,说明是实验处理X引起了因变量的变化,但是O2和O4都是经过了前测之后的观测值,与前测有关的交互作用有可能影响对实验结果的解释。 O5-O3,O5是没有经过前测的后测成绩,如果有O5>O3,可以说明在没有任何前测影响下,实验处理的作用仍然是有效的。但是O5与O3的比较又不能反映在没有前测的条件下,其他无关变量控制的情况。
75
O5-O6,如果O5>O6,那么又在随机等组后测条件下,确定了因变量的变化是X引起的。所以,如果有O2>O1, O2>O4,O5>O3,O5>O6这样的显著结果,我们就可以有充分的理由推断,我们得到的实验结果是由我们施加的实验处理X引起的。 除了具有等组前后测,等组后测两种设计的优点外这种设计的一个重要特点是控制、检测检测的影响。O5-O3可在没有任何前测影响下,检测实验效果。O4-O6可以反映前测经验单独的作用。O2-O5可以反映前测与实验处理的交互作用。O6-O3可以反映历史、成熟的影响效果。
76
优点 综合前面两种真实验设计的优点,克服二者的缺点,可以获得更丰富的实验信息和更严谨的控制。 实验者等于重复作了四个试验,可以作出四种比较。 局限性 很难找到四组同质的被试,因为教育实验一般不能打乱正常的教学秩序,大多是在确定的班级、确定的学校中进行,随机取样很难做到,因此在教学实践中真实验的应用很受限制。所以,真实验的内在效度很高,但是在一般的教育研究中是很难做到的,使用并不广泛。另外,被试的数目多时,数据分析比较困难。
77
四 实验结果的解释 例1:一项4个随机等组前后测设计采用3种不同的实验处理,X1、X2、X3并且设置一个控制组,对所有的组都进行前后测,设计模式图如下: RG1 O X O2 RG2 O X O4 RG3 O X O6 RG4 O — O8
78
(1)如果实验结果O1≠O2,O3 ≠O4,O5 ≠O6, O2=O4 ≠O6,O1=O3=O5=O7=08,对这个实验结果怎样解释? 对这个问题的回答是:所有的实验处理都有影响,X1和X2影响相同,但与X3不同。 因为所有的前测都与未经实验处理的后测O8相同,这表明4个组是等组,并且如果没有实验处理,观测结果就不发生变化。所以,因变量的变化只是由于实验处理的不同造成的。O1≠O2,O3≠O4,O5≠O6,三种实验处理都有影响。O2=O4≠O6说明X1和X2相同,但X1和X2都与X3不同。
79
(2)如果O1=O3=O4=O5=O6=O7=O8但O1≠O2怎样解释?
这个结果中,实验处理X2的X3的后测O4和O5与所有的前测以及未加实验处理的后测都相同,所以X2和X3没发生影响,只有X1的后测与前测发生变化,所以只有X1产生影响。 (3)如果O1=O3=O5=O7,O2=O3=O6=O8但是O1,O3,O5,O7≠O2,O4,O6,O8,这个结果怎样解释? 解释:没有实验处理影响,因为所有经过实验处理的后测都与未经实验处理的控制组后测相同,所以后测与前测的变化不是实验操作造成的。
80
(4)怎样确定未经实验处理的被试是否有变化?
比较O7和O8,如果O7≠O8,说明被试未经实验处理也有变化,如果O7=O8,说明被试未经实验处理无变化。由于是随机分组,可以认为O1,O3,O5和O7是相等的,比较也可以用O1,O3,O5和O8进行比较。
81
五 实验报告的写作 1.摘要部分 概述整个研究,虽然这部分不定最早动笔写,但必须作为第一部分呈现,有助于读者了解本研究的重要性、研究目的、方法与研究发现等。 2.引言/导言 介绍研究缘起、研究目的、实验假设、研究价值、预期目标等。 3.实验方法 实验设计模式,取样方法,实验步骤、预防及控制误差(控制无关变量)的技术等。
82
4.研究结果 数据结果(包括统计学分析)——将研究数据组成易于理解的呈现方式,一般以表格呈现。 图形分析——表示数据之间的关系,根据实验的原始数据资料绘制。切记直接呈现原始数据。 说明——报告中出现的图和表要标明顺序,如表1或图1,并用文字说明。 5.讨论 讨论研究的假设、误差、与预期发现相比较的结果、测量工具的限制、改进建议、与已有的同类研究成果相比较等。 6.结论 以摘要的形式简单地呈现研究结论。包括发现了什么、验证了什么、达到了什么样的结果、未来可进一步研究的方向及限制的内容。 报告的语言陈述尽量简洁易懂,让没有太多相关知识背景的人也能够了解。不要使用研究者本身都可能误解的文字。
Similar presentations