教育测验的编制
主要内容 第一节 教育测验编制的基本步骤 第二节 测验题目的编制 2
学习目标 了解教育测验编制的步骤、方法与要求; 初步掌握命题双向细目表和题目的编制; 能独立编制测验; 3
第一节 教育测验编制的基本步骤 明确测验目的 设计测验蓝图 校对、付印 命题设计 组织审卷 试题编制 制定评分标准 测验的质量分析
二、设计测验蓝图——双向细目表的编制 测验内容 测验目标 (一)命题双向细目表的结构 测验目标与测验内容的比例
反映测验内容与测验目标关系的双向细目表 测验目标 知识 理解 应用 分析与综合 创造 合 计 100 测验内容 合计 6
7
反映测验内容与测验目标、题型之间关系的双向细目表 (内容块) 选择题 简答题 证明题 应用题 分析题 合计 知识 理解 分析综合 应用 分析 综合 创造 平面 空间两条直线 空间直线和平面 空间两个平面 2 3 8 4 13 15 9 5 35 18 7 28 10 100 8
3.填写双向细目表(排列各部分所占的比例) (二)命题双向细目表的编制程序 1.列出教学内容要点 2.列出教学目标清单(ABCD模式) 3.填写双向细目表(排列各部分所占的比例) 9
1 .列出教学内容要点 A.气压 1.测量和报告气压;2.影响气压的因素;3.气压与天气改变的关系 B.气温 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系 C.湿度和降水量 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报告降水量 D.风 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风向的符号 E.云 …… F.锋面 10
2 .列出测验目标的清单 测验目标是测验编制者所编制的测验所要达到的某种具体的目的,它明确规定测验所要达到的预期结果或标准。它是编制测验的出发点和依据。 11
测验目标的确定是以教育目标分类理论为基础的。 布卢姆等人的教育目标分类法 加涅的教育目标分类法 梶田叡一的教育目标分类法 我国认知目标的分类 (1)测验目标与教育目标分类 测验目标的确定是以教育目标分类理论为基础的。 布卢姆等人的教育目标分类法 加涅的教育目标分类法 梶田叡一的教育目标分类法 我国认知目标的分类 12
13
我国认知目标的分类 14
(2)列出测验目标的方法 例1:天气单元的教学目标 1)了解基本术语 写出每一个术语的定义、识别代表每种天气的术语、确定最适合描述给定天气的术语…… 2)了解天气符号 将每一种符号与它所代表的天气相对应、画出每种天气的符号…… 3)了解具体事实…… 4)理解天气形成的影响因素…… 5)解释气象图…… 6)测量相关的天气特性…… 15
3 .填写双向细目表(排列各部分所占的比例) 准备一个含有教学目标与教学内容两个维度的双向细目表 横向设计 各个知识在整个测验的知识范围内的相对地位和重要程度(确定各部分知识所占的比重)。这种相对重要性可由该内容项目的教学课时的多少来体现。 16
纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制者认为这个目标对受测学生的水平所具有的重要性相符。一般主要是参考专家或有经验教师的意见而定。 调整 分配每部分内容在每层次目标的比重 17
三、命题设计 确定测验形式 确定题目形式 命题设计 内容 编排测验题目 确定具体题型 确定测验时长 确定题目数量
四、试题的编制 (一)收集测验材料 1.途径 (1)把测验所涉及的内容逐步分解到课程标准或教学大纲所规定的知识点,然后选择适量的、重要的知识点作为测验的材料; (2)对测验可能涉及的原始知识点进行聚类分析,根据知识点间的相关系数,依次进行合并,再利用适当的阀值将测验目标分成恰当的类,以确定测验的材料。 19
2 .收集测验材料的注意事项 目的性 激励性 代表性 收集原则 鉴别性 普遍性 20
7 .评分标准应合理,命题应有利于制定清晰可辨、公平合理的评分标准 (二)编写测验试题(命题) 1 .试题的内容取样应有代表性 2 .试题的数量要恰当 3 .试题的难度要合适 4 .各个试题之间应保持互相独立 5 .试题的表述必须清楚明白 6 .题型应多样化 7 .评分标准应合理,命题应有利于制定清晰可辨、公平合理的评分标准 21
(三)合成测验(组卷) 1 .先易后难 2 .同类组合
五、测验的质量分析 (一)试测:鉴别测验性能优劣的基础 注意事项: 试测对象必须是正式测验施测对象全体的一个代表性样本。 试测的实施过程与情境应力求与将来正式测试时的情况相近似。 试测的时限可稍宽一些,最好使每个被试都能将题目答完,以便搜集充分地反应资料。 23
在试测过程中,应将被试反应情况随时加以记录,如一般被试完成试测所花费的时间、题意有何不清之处,被试态度等等。 (二)质量分析 根据试测结果,对测验的质量进行整体分析和项目分析 24
(三)编写复本 复本的关键是等值 1.各份测验具有相同的测验目标与测验内容,但题目不应有重复 2 .各分测验题型相同,题目数量相等,并且有大体相同的难度和区分度 25
(四)编写测验手册 1.本测验的目的和功能 2 .测验编制的理论背景和试题选择的依据 3 .测验的实施方法、时限与注意事项 4 .测验的标准答案和评分标准的规定 5 .测验分数解释的依据 6 .测验的信度、效度资料,包括信度、效度系数以及这些数据是什么情况下得到的 26
第二节 测验题目的编制 一、常见题型及其编制 二、试题编制的总体要求 27
一、常见题型及其编制 (一)选择题及其编制原则 1.选择题的结构 2.选择题的优缺点 优点: (1)选择题可以测量被试各种不同层次的学习结果。 (2)正确答案唯一。 28
(3)可以加大试题容量,扩大试题覆盖的知识面。 (4)有利于考察被试思维的敏捷性和准确的判断力。 (5)通过对学生对诱惑项的选择,教师可以分析诊断学生学习中存在的问题和不足。 29
缺点: 编制费时而且需要技巧; 较难测量以充分发散思维为思维特征的重要能力,如表达,创造等 ; 无法考察被试的思考过程; 被试可以猜测。 30
例题:某市中职学校茶艺技能比赛理论考试试题 1.初制工序为杀青、揉捻、干燥的是( ) A.绿茶 B.红茶 C.黄茶 D.白茶 3.选择题的编制原则 例题:某市中职学校茶艺技能比赛理论考试试题 1.初制工序为杀青、揉捻、干燥的是( ) A.绿茶 B.红茶 C.黄茶 D.白茶 (1)题干意义完整并能表达一个确定的问题,以至于学生无需阅读选项就能理解它。 31
2. ( )不是 Windows 窗口的组成部分。 A.标题栏; B.任务栏 C.菜单栏; D.工具栏 ——中职计算机等级考试试题 例题 2. ( )不是 Windows 窗口的组成部分。 A.标题栏; B.任务栏 C.菜单栏; D.工具栏 ——中职计算机等级考试试题 (2)题干中尽可能以正面的方式来叙述,不要滥用否定结构。 32
(3)尽量把各选项中共同的字句放在题干里。这样不仅使问题更清楚,而且节省了被试阅读的时间。 例:“两条异面直线”这一概念( ) ①是指在空间中不相交的两条直线 ②是指在空间中位于两个不同的平面上的两条直线 ③是指在空间中不在同一平面上的两条直线 ④是指在空间中某一平面和这一平面外的两条直线 (3)尽量把各选项中共同的字句放在题干里。这样不仅使问题更清楚,而且节省了被试阅读的时间。 33
(4)诱惑项与题干之间应有一定的逻辑性与似真性 例题: 英国的首都是: A.东京 B.伦敦 C.瑞士 D.俄罗斯 (4)诱惑项与题干之间应有一定的逻辑性与似真性 34
(5)避免因为用词方面的暗示而使学生选出正确答案或排除错误选项。 题干和正确答案用词相近相同 正确答案以课本语言进行表述 正确答案表述过于详尽 诱惑项中出现措辞绝对化会易于让学生做出排除 35
增加诱惑项迷惑度的方法一般有: 以学生常见的共同的错误或过失来作为诱答项。 以学生的语言习惯表述选项。 在正确选项和诱惑项中使用同样“精确的”、“重要性”等褒义用语来叙述。 诱答项的长度和措辞的复杂性与正确选项相似。 在诱答项中使用额外的线索。如固定的用词,具有科学味道的答案,以及和题干有语义上的联系等。 保持选项之间的同质性。 36
(6)题干的文字表达应简洁明了,避免使用过于复杂的表述。 (7)应尽量避免“以上皆是”或“以上皆非”的选项。 (8)正确答案应以随机方式安排在各个选项里,不要有明显的位置趋势,以避免猜测因素的影响。 (9)务必使每道试题自成一体,不可互相牵扯。 37
(二)是非题及其命题原则 是非题也叫两项选择题,通常是给被试一个句子,要被试作出判断。 1.是非题的优缺点 优点 (1)在一定的时间里,被试完成是非题的数量要多于其他题型。因此使用是非题可以增加试题数量。 (2)正确答案唯一。评分容易、客观、可靠。 (3)命题容易 38
(1)如果一道是非题的正确答案为“×”,而被试回答正确,但这并不表明被试知道什么是正确的。 是非题的不足: (1)如果一道是非题的正确答案为“×”,而被试回答正确,但这并不表明被试知道什么是正确的。 (2)被试凭猜测而正确作答的概率大。 (3)一般只能用来测量低层次的教育目标。 39
例题:福建漳州中职茶艺技能比赛理论考试试题 我省特有的茶类是乌龙茶和白茶。( ) 北京是我国最大的政治文化和经济中心。( ) 2.是非题的编制原则 例题:福建漳州中职茶艺技能比赛理论考试试题 我省特有的茶类是乌龙茶和白茶。( ) 北京是我国最大的政治文化和经济中心。( ) (1)每题只能包含一个中心思想。 40
是非题更加容易猜测答案。但在缺少似是而非的干扰项的时候,如果题目编写得好,就应使用是非题,而不使用选择题( ) 例题: 是非题更加容易猜测答案。但在缺少似是而非的干扰项的时候,如果题目编写得好,就应使用是非题,而不使用选择题( ) 在只有两中选择可能的情况下应使用是非题,而不使用选择题。( ) (2)题目的陈述应简洁明了,尽量使用简单词汇和句型。 41
数学学得好的人,一般来说物理也学得好。( ) (3)题目的表达要清晰、准确,以便能明确判断对错。 例题: 数学学得好的人,一般来说物理也学得好。( ) (3)题目的表达要清晰、准确,以便能明确判断对错。 42
审评任何茶类,最后一道步骤均为看叶底。( ) 例题: 审评任何茶类,最后一道步骤均为看叶底。( ) 避免使用具有暗示性的字词和特殊的限定性词句,如全部、绝不、都、可能、大概等。因为含有“全部”、“从不”、“只有”等词的表达,多半是错误的。而含有“通常”、“可能”等词的表达太过模糊。 43
正确答案为“是”与“非”的题目应大致相等,且应以随机方式排列,以免被试猜中的可能性增大。 44
(三)匹配题及其命题原则 1.优缺点 优点 (1)能在短时间内测量大量相关的知识 (2)评分容易、客观、可靠 45
(1)主要用来测量对知识的记忆情况,难以测量高层次的学习结果。 缺点 (1)主要用来测量对知识的记忆情况,难以测量高层次的学习结果。 (2)寻找符合某一学习结果的同质性材料比较难。 (3)容易为被试提供答题的额外线索。 46
(1)各题干或选项必须同质或相近,即都属于同一类或同一种性质的事物。否则可能会增加或降低题目难度。 2.匹配题的编制原则 (1)各题干或选项必须同质或相近,即都属于同一类或同一种性质的事物。否则可能会增加或降低题目难度。 47
例题:从右列姓名中为左列文学作品找出相应的作者 48
(2)一般情况下选项的数目应多于题干数,以降低被试作答时猜中的概率。 (3)配对的项目不可过多,一般不应超过10个。否则被试难于寻找选项。 (4)应在指导语中明确匹配的基本规则,比如,一个选项是否可以多次被选用。 (5)匹配题的所有部分应放在同一页上,以方便被试作答。 49
填空题可以用来考察被试对知识的记忆和理解能力,特别适用于诊断性测验; (四)填空题及其编制原则 1.特点 填空题可以用来考察被试对知识的记忆和理解能力,特别适用于诊断性测验; 评分比较客观,被试猜测的概率小; 偏重于考察记忆能力。 50
(1)尽量将空白放在句子的后面或中间,而不要放在句子开头。 2.编制原则 例题 ____和____是电脑最常用的输入设备。 (某中职学校办公自动化考试试题) 电脑最常用的输入设备是____和____ (1)尽量将空白放在句子的后面或中间,而不要放在句子开头。 51
(2)空白部分应是重要内容。否则,题目没有意义。 (3)题目中的空白地方不能太多,以免句子变得支离破碎。 (4)所有空白处的线段长度应当一致。 (5)若答案是数字,应指明单位和数字的精确程度。 (6)题意要明确、限定要严密,使空白处应填的答案是唯一的。 (7)题目的表述不能直接抄录教科书,而应重新表述。 52
适合对基本概念和原理的学习情况进行考查。 命题容易。 不易猜测。 不足: 评分有一定的主观性。 不能用来考查高层次的学习结果。 (五)简答题及其编制原则 1.简答题的优缺点 优点: 适合对基本概念和原理的学习情况进行考查。 命题容易。 不易猜测。 不足: 评分有一定的主观性。 不能用来考查高层次的学习结果。 53
例题:主轴头的好坏直接影响加工的工艺指标,因此对主轴头除结构不同外,还应该具备哪些条件? 2.简答题的命题原则 例题:主轴头的好坏直接影响加工的工艺指标,因此对主轴头除结构不同外,还应该具备哪些条件? ——某中职学校《电加工技术》期末试题 (1)问题的叙述要明确,使被试能用简单而明确的话来回答。 54
(2)避免出仅凭机械记忆就能正确作答的题目。 (3)在理科考试中,如果要考查被试对公式的使用,不应给太复杂的数字。 例题: 请给出千瓦的定义 一盏25瓦的电灯,亮多少小时消耗1千瓦? (2)避免出仅凭机械记忆就能正确作答的题目。 (3)在理科考试中,如果要考查被试对公式的使用,不应给太复杂的数字。 55
例题: 我国四大文学名著是哪些? (4)试题的答案应该是明确且唯一的。 56
论述题是向考生提出较为复杂的问题,要求作出分析、说明、解释、论证,或作出结论,或提出自己的观点和见解。 (六)论述题及其编制原则 1.论述题及其优缺点 论述题是向考生提出较为复杂的问题,要求作出分析、说明、解释、论证,或作出结论,或提出自己的观点和见解。 57
可以用来测量复杂的学习结果,对高层次的教育目标能进行有效的反馈; 优点: 可以用来测量复杂的学习结果,对高层次的教育目标能进行有效的反馈; 题目编写容易,不存在猜测和简单背诵; 可促进学生的思维发展与应用及解决问题的能力,也能增进学生的写作能力。 58
由于时间所限,一个测验中只能有少数几个论述题,因此对教育内容的涵盖面较窄,难以全面评价被试的学习成就; 缺点: 由于时间所限,一个测验中只能有少数几个论述题,因此对教育内容的涵盖面较窄,难以全面评价被试的学习成就; 作答和阅卷较花费时间; 评分既易受较多无关因素的影响,如被试的字迹、用词等,又易受评分者主观因素的影响,如个人偏见、好恶等。因此,评分较难客观公正。 59
2.论述题的编制原则 试题应尽量与所要测量的较高层次的教育目标有关,这样才能发挥其与客观题的比较优势。在题目陈述中最好采用“为什么”、“描述”、“解释”、“分析”、“比较”、“评价”等词语,从而使被试的反应冲破“知识”层次的界限。 例题:请比较心理学两大理论学派——行为主义和认知心理学——之间的异同 在校园内你认为礼仪的功能有哪些?(中职《护理礼仪》试题) 60
用短句来表述问题,而且意思明确 例题:试述经济全球化及其后果 竞争性的测验中避免选做题的使用 要把问题和实际情境相结合,强调知识的应用。试题应选用新材料,以免被试凭机械记忆作答。只有如此,才能真正考查出被试分解问题、解决问题和创新的能力。 61
二、试题编制的总体要求 (一)有效性 题目实际测量的心理品质与要测量的学习结果相一致 (二)便利性 题目的表达一定要便于考生作答 (三)合适性 题目的难度应与考生的年龄、成熟程度相一致 62