第二章 心理测验的编制 一、 测验目的的确定 二、 拟定编制计划 三、 设计测试项目 四、 项目的预测和分析 五、 合成测验 第二章 心理测验的编制 一、 测验目的的确定 二、 拟定编制计划 三、 设计测试项目 四、 项目的预测和分析 五、 合成测验 六、 测验使用的标准化 七、 搜集信度和效度资料 八、 编写测验手册 go
(一)明确测验目标 (二)明确测验对象 年龄 教育水平 文化背景 (三)明确测验用途 back
电视对于显微镜就象电话对于—— a 放大器 b 微加工器 c 电报符号 d 麦克风 e 扩音器 back
一个测量推理能力的题目:数学是工具就如同计算机是—— a 机器 b 工具 c 科学 d 键盘 e 程序 back
例,请同学们看书P16。
表2-1 小学自然常识测验编制计划 应用原理原则 分析因果关系 综合成系统见解 建立评价标准 合计 6 2 1 20 10 4 12 8 表2-1 小学自然常识测验编制计划 获得基本知识 理解原理原则 应用原理原则 分析因果关系 综合成系统见解 建立评价标准 合计 生物世界 3 5 6 2 1 20 资源利用 10 动力和机械 4 12 物质、物性与能量 8 25 气象 13 宇宙 地球 18 28 30 100
编制计划有两个用途: 1.在测验的编制阶段,可以知道每个项目应该编多少题目,编哪些种类的题目 2.题目编好后,可以用来核对,测题是否全面,是否真正代表了所要测量的领域,核对重要的方面有没有遗漏 3.根据表中百分比确定每类项目的分数 back
(一)搜集有关资料 (二)选择项目形式 (三)编写和修订项目 back
(一)搜集有关资料 1.资料要丰富 2.资料要有普遍性 有关所要测量的心理特质的理论 同行已经编制的有关测量这种心理特质的国内外量表 访问专家、教师、在一线工作的有关人员,征求他们的意见,收集与测题有关的资料 了解受测群体的实际情况 2.资料要有普遍性 所选择的材料应该具有文化公平性。如,对于智力测验来讲,所收集的资料对于不同文化背景、不同经济地位、不同地区的个人和团体应该是公平的。 back
(二)选择项目形式 鲍勃海姆(Popham)曾将语言(文字)测验的项目形式分成两种类型:要求被试选择的和要求被试回答的,也有人称之为选择型和供应型。在成就测验中,也分成客观性试题和非客观性试题。这两种项目形式的最大区别是,前者提供被选答案,后者让被试自己写出答案。前者的常用形式有,选择题和判断题,匹配题也属于这一种。后者的常用形式有简答题和论述题,作文题也是属于这一种。
几种常用的项目形式介绍 判断题 选择题 简答题 论述题 back
判断题 等级评定项目 喜欢在大庭广众之下发表自己的见解。 是 否 学习是一种苦差事。 同意 介于两者之间 不同意 喜欢在大庭广众之下发表自己的见解。 是 否 学习是一种苦差事。 同意 介于两者之间 不同意 非常同意 比较同意 一般 比较不同意 非常不同意 等级评定项目 优点:出题容易;回答方便。 缺点:对于教育测验来讲,只适合考察学生对简单知识的理解;易受猜测因素的影响。
编制判断题应注意以下几点: (1)内容应以有意义的事实、概念或原理为基础,避免无关紧要的问题或琐碎的细节。 (2)每题只应包含一个观念,避免两个以上的观念在同一题中出现,从而造成似是而非或半对半错。 如,我怕见生人,但有时也参加聚会。 (3)论点要简明扼要,意义明确,不要有艰深难懂的词句或含糊不确定的文字描述。 (4)避免使用具有暗示性的特殊词句。 (5)尽量采用正面肯定的叙述。 (6)肯定和否定的题数应大致相等,且随机排列。 (7)题数不能太少。 back
七点量表,就是将行为程度分成七个等级。 如,给小朋友讲了一个故事: 有个小朋友叫小林。校长到小林的班上点名要小林和其他三名同学代表班级参加学校的一个唱歌比赛。凡是参加唱歌比赛的同学都可以得到一份精美的纪念品。但是小林的歌唱得并不好。小林想: 如果我去参加唱歌比赛,我们班肯定会输。如果我说我病了,就不必参加比赛了,这样就会有唱得更好的同学顶替我,班级就能得到好名次。但是如果我不参加,就得不到那份精美的纪念品。 于是,当校长要小林准备参加唱歌比赛时,小林决定为班级考虑。虽然小林没有生病,但他告诉校长:“我今天病了,不能参加唱歌比赛。” 问题:小林这样说好不好? ××× ×× × O ★ ★★ ★★★ back
请你选择一种喜欢的颜色? 绿色 茶色 紫色 蓝色 红色 橘色 白色 黄色 智力测验(主要是测量推理能力)编制中使用的选择题 (1)猫头鹰是鸟正如白鲨是—— a 动物 b 鱼类 c 鸟类 d 爬行动物 (2)平地与土丘的关系就如同峡谷与——的关系。 a 沟壑 b 山谷 c 丛林 d 河流 e 高山
优点:适用范围广,既可以适用于文字和数字的材料,也可以适用于图形的材料;评分简单、省时、客观;相比于判断题更少受猜测因素的影响。 缺点:编拟迷惑答案比较困难;无法测量出被试的言语表达能力和概括、组织能力,这与简答题、论述题相比是不足的;尽管选择题减少了机遇的影响,但猜测的影响仍然不能完全排除。
编制选择题时要注意以下几点: (1)题干的陈述要简单明确,避免出现不切题的内容 (2)题干后面的选项或答案的数目愈多,被试愈不易猜对,普遍采用四个或五个答案 (3) 一个测验中每个题干后面,答案的数目要一律,如,每题都是四个或五个答案 (4) 错的答案不要错得太明显,要有一定的似真性 (5)一个题干后面的答案,不管是正确的还是迷惑的,要么都是简单的,要么都是详细的,务求长度大致相等,不要在简单的答案中参杂一两个详细的答案。 (6)答案以简短为宜,相同的字词宜置于题干中,这样不但可以使题意清楚,而且可以减少被试的阅读时间 (7) 少用“以上皆非”和“以上皆是”的答案 (8) 各题之间不能提供正确或错误的线索 (9)对的答案和错的答案要随机排列,使被试无法猜测,减少系统误差 back
简答题: 简答题要求被试用一段文字来完成测题。 优点:编制简单;不易受猜测因素的影响;在教育测验中能测量多种认知目标,如对知识的记忆、理解、应用。 缺点:评分没有客观题方便,不够客观;不能测量对知识的组织能力、综合应用知识的能力、评介能力和创造能力等。 back
论述题:简答题若对其范围不加限定就变成了论述题。这两者的区别不仅在于长度,还在于它们所起的作用。简答题最适合测量对实际知识的记忆和理解,而论述题最适合测量组织能力、综合能力和文字表达能力、评介能力和创造能力,对于论述题来讲,光凭记忆是不能完成的。 优点:编制容易;不允许猜测和简单背诵,能测量复杂的能力。 缺点:评分难度大,不够客观;题目少,取样缺乏代表性。 back
测验编制经验丰富者在编制测题时,往往会考虑以下几个测题的来源:直接选自国内外优秀的相关的测验;修改前人的测验中的有关的测题;自己编写
1.编写测验项目时应注意以下几点 (1)测验项目的取样应当具有代表性 (2)测验项目的取材范围要同编题计划所列项目范围一致。 (3)测验项目的难度应该有一定的分布范围 (4)编写测验项目的用语要力求精练简短,浅显明了。 (5)初编题目的数量要多于最终所需要的数量,以便筛选和编制复本
2.智力测验的简单介绍 (1)智力测验项目编写 A 类比推理项目 优点 难度水平易控制,在实际关系上,这类项目既可以和显而易见的事物构成简单关系,又可以和不明显的事物,甚至初看起来没有关系,然而却反映着某一规律的抽象对象构成复杂关系。 由于客观事物存在着普遍联系,所有能够用来编制类比推理项目的材料几乎是无穷的。 go
例1, 和 的关系就如同 和 ——的关系 a b c d e 例2 英语字母G和J的关系就象M和——的关系 a P b O c N d L e K 例3 D相对于W就像L相对于—— a O b N c T d R e H 例4 25对于10相当于53对于—— a 2 b 8 c 31 d 15 e 24 back
B 排除性项目 排除性项目是指在项目编写过程中,将很多同类事物,如词汇、形状、数字、物体等排列在一起 ,让被试挑出不符合同类的那一个干扰项目。 例1 麻雀 乌鸦 鹅 蝙蝠 燕子 例2 24 63 10 48 35 例3
C 顺序项目 顺序项目是以事物的前后顺序、复杂程度、递增或递减关系为标准而设计的项目,要求被试根据关系填上相应的项目。 例1 12, 15, 17, 20, 22, _____ back
(一)预测 测题初步确定以后,在小样本范围内试测,以得到有关测题优劣的质的信息和量的指标,为增删项目提供依据。 预测时应注意以下几点: (1)预测对象应取自将来准备应用的群体,要有代表性。 在教育测验上,通常以370人为宜,智力测验至少要30人。如果测题的项目过多,在保证样本代表性的前提下,可以考虑对不同样组的被试实施不同的分测验。 (2)预测力求按正规的要求进行,使其与将来正式的情况相近似。 (3)预测的时限可适当放宽,最好使每个实验者都能将项目做完。 (4)在预测过程中,应随时记录被试的反应情况
(二)项目分析 项目分析包括质的分析和量的分析两个方面。质的分析是主要是看内容取样是否适当,具有代表性;是否有题意不清之处等。量的分析是对预测结果进行统计分析,确定项目的难度和区分度以及被选答案的适宜性。 复核。 back
(一)项目的选择 项目的选择的标准首先是鉴别力要高。埃贝尔(I.Ebel)提出的标准 在根据鉴别力所选出的一系列的项目的基础上,再依据难度指数选择合适的项目。因为中等难度的项目能产生最大的变差,故最好应选择难度介于0.35-0.65之间的测题,而后还需要选出少数较难和较易的测题,这样使整个难度分布近似常态分布。 如果是人格测验、态度测验和心理健康测验等,所需的不是难度,则对难度的要求不高,一般为0.1-0.3 根据鉴别力和难度选出合适的项目后,应该再次对照编制计划,看看比例有无失调 考虑测验的长度问题,一个测验应该包括多少测题才比较合适,要考虑测验的时限、受测者的年龄、测验的性质等 go
表2-1 测题的鉴别指数与优劣评鉴 鉴别力 D 测题评鉴 0.40以上 优良 0.30-0.39 良好,如能修改则更好 0.20-0.29 表2-1 测题的鉴别指数与优劣评鉴 鉴别力 D 测题评鉴 0.40以上 优良 0.30-0.39 良好,如能修改则更好 0.20-0.29 尚可,仍需修改 0.19以下 劣,必须淘汰
(二)项目的编排 测验一般有二种编排方式: 并列直进式:这种方式按照测验的性质将测题组成若干分测验,同一分测验中的测题按其难度由易到难排列 混合螺旋式:将各类测题依照难度或年龄分成若干层次,再将不同性质的测题加以组合,作交叉式排列,难度则渐次上升。
(三)编造复本 编造复本就是编制几个等值的测验。复本等值必须符合以下几个条件: (1) 各份测验测量的是同一种心理特质。 (1) 各份测验测量的是同一种心理特质。 (2) 各份测验包含相同的内容范围,但题目不应有重复。 (3) 各份测验题型相同,题目数量相等,并且有大体相同的难度分布。 只要有足够数量的题目,编造复本的手续是很简单的。先将所有选出的项目按难度由大到小或从小到大排列,次序为1、2、3、4、5、6、7、8、9……,如果要分成两个等值的复本,则 A本:1、4、5、8、9…… B本:2、3、6、7、10…… 如果要分成三个等值的复本,则 A本:1、6、7、12、13…… B本:2、5、8、11、14…… C本:3、4、9、10、15…… back
测验内容的标准化 施测条件的标准化 评分标准的标准化 分数的转换和解释的标准化,要制定测验常模 back
测验编好后,要对其测验的可靠性和有效性加以评估,这就是测验的信度和效度问题。 信度是指测验的可靠性 效度是指测验的有效性,即有没有测量到所要测量的心理特质。 back
测验编制完成后,测验的编制者必须编制一本完整的测验手册,对下列问题进行详细的说明 (1) 本测验的目的和功用 (2) 测验的理论背景以及选择项目的根据 (3) 测验的实施方法、时限以及注意事项 (4) 测验的标准答案和记分方法 (5) 常模表或其他有助于分数转化和解释的资料 (6) 测验的信度、效度资料 back