第一章 从哥特曼量表谱到Rasch模型 赵守盈 贵州师范大学
Rasch模型 在心理测量学领域,很多学者认为Rasch模型是最简单的项目反应理论模型,该模型只有一个项目参数,即项目的难度,将所有项目的区分度限定为相同。所有也有人将Rasch模型看作单参数项目反应理论模型。本章以Rasch模型与哥特曼量表谱的关系为背景,介绍与Rasch模型相关的基础知识。
从Guttman量表说起 心理学家库尔特•勒温将心理学定义为:一种分析因果关系和进行科学建构的方法。勒温认为一个人的行为取决于个人与他所处的环境的相互作用。这种关系可以用下列公式来表示:
从Guttman量表说起 下列函数中,如果被试的能力Tp高于项目的难度Di,被试将给出正确的反应,如果被试的能力低于难度,那么被试将给出错误的反应:
从Guttman量表说起
从Guttman量表说起 假设有一组数据,有6名被试参加测试,测试包括5个项目。函数可以用一条线段来表示。依据被试能力Tp的大小,从左到右将他们定位在线段上方。同样将项目难度Di定位在线的下方。如图1-1、图1-2所示。图中的Tp和Di的关系为: a.如果Tp 在Di的右边即Tp>Di,也就是被试的能力高于试题目的难度,那么被试将做出正确的回答;如果Tp在Di左边,即Tp<Di,那么被试将做出错误的回答。根据方程正确回答得1分,错误回答得0分。结果呈现在表1-1中:
表1-1 对应于图2中被试和项目位置的数据矩阵 从Guttman量表说起 项目 被试 I1 I2 I3 I4 I5 1 2 3 4 5 6
从Guttman量表说起 为了更好地理解数据结构,将表1-1中行和列的顺序进行重新排列:被试按能力从小到大、由上到下排列,项目按难度从低到高、从左致右排列。重新排列后得到表1-2。表中包含了一个“三角形模式”。
表1-2:重新排序后的数据矩阵 从Guttman量表说起 项目 被试 I4 I2 I5 I1 I3 2 4 1 3 5 6
从Guttman量表说起 表1-2中每名被试的反应可以看做一个向量,如被试4的反应向量为(1,0,0,0,0),被试6的反应向量为(1,1,1,1,1)。每一个向量称为一种反应形式。一组数据中某种反应形式可能多次出现,有些反应形式也可能不会出现。如被试5的反应形式出现两次,被试1的反应形式没有出现。此时的数据矩阵如表1-3所示。这种情况下数据也会出现“三角型模式”。
表1-3 另一种三角形模式 从Guttman量表说起 项目 被试 I4 I2 I5 I1 I3 2 4 1 3 5 6
从Guttman量表说起 对于哥特曼量表谱,数据结构的特点是,在对被试能力和项目难度进行重新排序后,这些数据可以呈现一个三角形模式。根据难度对I个项目进行重新排序,哥特曼量表谱只允许出现I+1个不同的反应模式。表1-2例子中,有5个项目,共有6中可能的反应模式。
从Guttman量表说起 被试和项目的表征
从Guttman量表说起 单维性 哥特曼量表谱对于心理学有什么价值呢?如果给定数据矩阵的行和列可以重新呈现三角形模式,研究者可以得到哪些信息呢?研究者可以确定:被试正确作答需要一定的潜在特质。被试只有具备了这种潜在特质才能正确作答项目。并且在作答过程中只有一种潜在特质在起作用。如果一组项目仅考察一种潜在特质,心理学中称这组测验为单维性测验。心理测量学中对这种能力的类型并没有严格的限定。例如能力量表中决定被试作答的潜在特质可以是阅读、计算等,心理测验中这种潜在特质可以是对某事件的态度。也就是说:量表的单维性要求被试正确回答项目完全取决于其具有的某一种特质的高低。至于这种特质是什么则取决于测验编制的目的。
从Guttman量表说起 单维性的问题可以通过检验两个都符合哥特曼量表谱标准的项目是否可以融合来说明。 应用题 被试 I3 I1 I2 3 被试和项目位置的数据矩阵 从Guttman量表说起 单维性的问题可以通过检验两个都符合哥特曼量表谱标准的项目是否可以融合来说明。 应用题 被试 I3 I1 I2 3 5 6 1 4 7 2 8
从Guttman量表说起
表1-6:将应用题和算术题数据矩阵合并,并根据总分 将行和列重新排序后的结果 表1-6:将应用题和算术题数据矩阵合并,并根据总分将行和列重新排序后的结果 项目 被试 I5 I3 I6 I1 I2 I4 3 5 1 6 4 7 2 8
从Guttman量表说起 从心理测量学的角度来看,哥特曼量表谱的重要特性在于:如果数据矩阵符合哥特曼量表谱,就表示这组项目测试的是单一潜在特质。换言之,这组项目或量表是单维的。
从Guttman量表说起 哥特曼量表谱的限定性 哥特曼量表谱对数据的要求非常严格:如果有I个项目,那么只 允许出现(I+1)个不同的反应模式。事实上,如果没有这一限 定,就可能出现2I个反应模式。表1-7中,对于I的一些值,给出 了在哥特曼量表谱限定条件下和无限定条件下可能出现的反应 模式的数量。 项目数量 可能出现的反应模式数量 可能出现的反应模式总数量 2 3 4 5 6 32 10 11 1024 20 21 1048576
从Guttman量表说起 当被试的数量很大时,经常会出现一些违背哥特曼量表谱的情况。也就是某些反应模式使得数据无法出现三角形模式。 这就与的方程相矛盾。哥特曼模型是一种决然模型,若被试能力大于项目难度,则被试肯定答对,Ypi=1。但在心理与教育实践中的数据并不一定完全符合这种理想的模式。由于粗心、猜测等原因,被试往往会答错简单题目或答对困难题目。针对这一矛盾,研究者提出了另外一种研究思路,发展出了哥特曼模型的概然模型。决然可以理解为某种条件下事件必然发生,概然可以理解为某种条件下事情有一定的可能发生,并且这种可能性是有规律可循的。哥特曼模型的概率式中,对于给定的被试能力Tp和项目难度Di,可以预测出被试正确反应的概率。哥特曼量表模型的概率衍生模型有很多种,Rasch模型就是其中一个。
二、Rasch模型 Rasch模型是哥特曼模型的概率衍生模型。它是由丹麦统计学家Georg Rasch于1960年提出来的。在前面提到过如下公式:
二、Rasch模型 哥特曼模型是决然模型,因为一旦确定了被试能力Tp和项目难度Di,反应模式就确定了。哥特曼模型的概率衍生模型,即使确定了被试能力Tp和项目难度Di,也只能决定被试给出正确反应的概率。所以哥特曼量表谱分析中以Ypi作为结果,而作为其概率衍生模型的Rasch模型则以Ypi发生的概率作为结果。这个概率可以用P(Ypi=1)来表示。
二、Rasch模型
哥特曼模型与基本Rasch模型都是用于分析0-1计分项目的。被试作答只有两种情况:正确(Ypi=1)、错误(Ypi=0)。两种情况为互斥事件,不可能同时发生。所以P(Ypi=1)+P(Ypi=0)=1。 将Rasch模型公式代入式子中: P(Ypi=0)
对正确和错误反应的概率的计算 假设某被试能力Tp等于2。该被试回答三个项目, 第一个项目的难度D1等于1。那么,使用Rasch模型 公式,正确反应的概率可以通过以下过程计算:
Rasch模型和哥特曼量表谱之间的关系 数据分析过程中出现少量违背哥特曼模型的数据时,可以使用Rasch模型来解决。假设测验有四个项目,难度分别为D1=-2、D2=0、D3=1、D4=3。在哥特曼量表谱中,能力TP=2的被试回答这组题目,只允许一种反应模式出现,即(1,1,1,0)。这种反应模式可以称为标准反应模式。但是对于Rasch模型,所有的反应模式都是可能的,共有2×2×2×2=16种。只是各种反应模式出现的概率不同。 一种反应模式出现的概率由各个项目反应概率的成绩决定。以这组题目为例,某被试正确回答的概率分别为:P(Yp1=1)= 0.98、P(Yp2=1)= 0.88、P(Yp3=1)= 0.73、P(Yp4=1)= 0.27。以反应模式(1,0,1,0)出现的概率为例:
Rasch模型和哥特曼量表谱之间的关系 第一个项目正确回答的概率为P(Yp1=1)= 0.98,第二个项目回答错误的概率P(Yp2=0)= 1-P(Yp2=1)= 0.12,第三个项目回答正确的概率P(Yp3=1)= 0.73,第四个项目回答错误的概率P(Yp4=0)= 1-P(Yp4=1)= 0.73。所以:
Rasch模型和哥特曼量表谱之间的关系 同理,还可计算出其他15种反应模式出现的概率,计算结果如表1-11所示。由于哥特曼模型中只有一种合理的反应模式(1,1,1,0)。表格中除列出每种反应概率出现的概率,也列出了其它各种反应模式与哥特曼量表谱反应模式(1,1,1,0)之间的偏离数量。
Rasch模型和哥特曼量表谱之间的关系 表1-11:其它反应模式在Rasch模型下的概率及其偏离哥特曼量表的情况 反应模式 偏离哥特曼量表谱反应模式的数量 Rasch模型下出现的概率 1,1,1,0 0.4623 1,1,1,1 1 0.1701 1,1,0,0 1,0,1,0 0.0627 0,1,1,0 0.0085 1,1,0,1 2 1,0,1,1 0.023 1,0,0,0 0,1,1,1 0.0031 0,1,0,0 0,0,1,0 0.0011 1,0,0,1 3 0,1,0,1 0,0,1,1 0.0004 0,0,0,0 0,0,0,1 4 0.0002
Rasch模型和哥特曼量表谱之间的关系 偏离哥特曼量表谱反应模式的数量是通过计算偏离标准反应模式的项目数得到的。例子中标准反应模式为(1,1,1,0),与标准模式相比,(1,1,1,1)模式最后一个项目与标准模式不同,所以偏离数量是1。由于共有四个项目,所以偏离数量在0到4之间。
Rasch模型的拟合指标 哥特曼模型作为一种决然模型,可以通过对行和列重新排序然后看是否出现三角形模式来确定数据是否符合要求。对于Rasch模型这样的概然模型,每一个数据都以特定的概率出现。一些数据出现的概率比另外一些要大。所以,数据是否符合模型要求(拟合)不是绝对的,而是渐进的:随着概率的增加,模型与数据越来越拟合,反之亦然。
Rasch模型的拟合指标 确定数据与模型是否拟合,并不是考虑数据整体特征,而是从考察数据的某个方面入手。Rasch模型中,通常要计算这样一个指标:总分相同的各组被试中每一个项目正确回答的实际人数。将这一实际人数跟Rasch模型预测的正答人数进行对比,对比的差异就是拟合值。随后,计算该拟合值的置信水平,如果置信小于0.05或0.01,那么拒绝模型假设,说明数据不符合Rasch模型。整个过程有点类似于T检验、卡方分析等假设检验的统计分析过程。