Presentation is loading. Please wait.

Presentation is loading. Please wait.

第六章 学绩测验 第一节 学绩测验概述 一、学绩测验的性质 最高作为测验可以分为:学绩测验、能力测验、能力倾向测验。

Similar presentations


Presentation on theme: "第六章 学绩测验 第一节 学绩测验概述 一、学绩测验的性质 最高作为测验可以分为:学绩测验、能力测验、能力倾向测验。"— Presentation transcript:

1 第六章 学绩测验 第一节 学绩测验概述 一、学绩测验的性质 最高作为测验可以分为:学绩测验、能力测验、能力倾向测验。
学绩,指经过一定的教学或训练后所学到的东西,是在一个比较明确的、相对限定的范围内的学习结果。 能力倾向指学习的能力,是在给予适当的机会时获得某种知识或技能的能力。 能力介于学绩和能力倾向之间,指的是当前的知识或技能的水平,既有正式学习的,也有非正式学习的结果,既包括学术技能,又包括非学术技能。 学绩测验用来描述现状,指明一个人已经学会了什么和能做什么。

2 二、学绩测验的基本假设 1 学绩测验所测量的知识和技术的范围能明确界定。 2 测验所测量的是研究者认为重要的东西,而不是与测量目的无关的东西。 3 被试有同样的机会学习测验所包含的材料。 三、学绩测验的分类 (一)按测验的编制方法分  教师自编课堂测验,标准化学绩测验 (二)按测验内容分 单科测验,多科测验 单元测验,总测验

3 (三)按测验的用途分  考察性测验,诊断性测验,准备性测验,选拔与安置测验,职业水平测验,用于研究的测验 (四)按测验评分的参照系分  常模参照性测验,目标参照性测验 (五)按测验的题型分 客观测验,论文式测验

4 四、学绩测验的应用 1 反馈功能 2 诊断功能 3 辅助教学管理 4 研究工具 5 人才选拔与安置

5 第二节 标准化学绩测验 一、标准化学绩测验的基本要求  1 命题组卷标准化 测验目标,试题的措辞、难度、区分度,题型比例、题量 2 施测标准化 环境、时间、指导语、主试 3 评分标准化 标准答案、评分细则、评分者人数 4 测验分数解释标准化 是常模参照还是目标参照

6 二、标准化学绩测验的编制 由学科专家与测验编制专家共同完成,其步骤与一般心理测验的编制程序相同。 (一)确定测验目的,选定测验编制的方法 考察还是诊断,常模参照还是目标参照 (二)分析测量目标,拟订测验编制计划 双向细目表,题型,题量 (三)编题征题与选题组卷 编题征题→试测→组卷 (四)调查测验质量参数,编制测验常模 难度、区分度、信度、效度、常模 (五)编写测验指导书,正式出版发行

7 三、国外常用标准化学绩测验简介 (一)斯坦福成就测验 综合性学绩测验 适用范围:1~9年级 内容:词汇、阅读理解、拼字、听理解、词汇学习技能、语言、数学概念、数学计算、数学应用、社会科学常识、自然科学常识 斯坦福早期学校成就测验(适用于幼儿园和小学一年级) 斯坦福学业技能测验(适用于8~12年级) 导出分数:百分等级、标准九、年级当量、量表分数、正态曲线当量 分测验信度均在0.80以上。

8 (二)关键数学算术诊断测验 适用范围:学前儿童~小学六年级 测验内容: 内容块:数学、分数、几何、符号 运算块:加法、减法、乘法、除法、心算、数字推理 应用块:文字题、补充、金钱、测量、时间 诊断: 总体水平诊断 分块水平诊断 分测验水平诊断 项目水平诊断

9 四、标准化学绩测验的题库建设   一个高质量的题库应具有的性质: 有一种科学的测量理论; 贮备一定数量的试题,所有试题品质优良,技术参数完备; 题库内部结构层次清楚、分类严谨,试题检索方便; 题库管理方便,可控性强,易于维护更新; 保密性强。 五、我国高考的标准化试验

10 第三节 教师自编课堂测验 一、教师自编课堂测验的特点 测验形式灵活多变,与测验目的完全一致 测验内容与教材内容完全一致 测验难度切合学生的实际水平 测验编制简易快速 二、教师自编课堂测验的步骤与方法 审查测验目的 制定测验编制计划 命题与组卷

11 三、教师自编课堂测验应注意的问题 教师要深入研究教材,深入研究学生 要维护准确稳定的合格标准 要客观评价自己的命题技术,合理使用各种题型 要注意总结命题经验,提高命题技术 要尽量控制评分误差,防止简单粗糙 要做一些定量分析研究

12 第十章 能力测验(上) 第一节 智力测验的理论基础 (一)什么是智力?
Spearman(1904,1923):智力是一种普遍的能力,它主要涉及联系的引出(eduction)和相关的引出。 Binet & Simon(1905):智力是正确进行理解、判断和推理的能力。 Terman(1916):智力是形成概念,并且抓住其重要性的能力。 Thorndike(1921):智力是从真理或事实角度产生良好反应的能力。

13 Thurstone(1921):智力是抑制本能反应,灵活地想象不同反应,并且把修改后的本能反应转换为外显行为的能力。
Wechsler(1939):智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。 Piaget(1972):智力是总括性的术语,指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。 Sternberg(1985):智力是指自动信息加工和产生适合于新情况的行为的心理能量,它包括元成分、操作成分和知识获得成分。 Eysenck(1986):智力是将信息无错地传递过皮层的能力。 Gardner(1986):智力是解决问题,制造在某些文化范围内有价值的产品的能力或技术。

14 共同点: w    智力是适应环境的能力 w    智力是通过经验进行学习的能力     智力是人们在获得知识和运用知识解决实际问题时所必须具备的心理条件或特征。 Boring(1923):智力就是智力测验所测量的东西。 Sternberg等(1981)的研究 专家认为:语词能力、问题解决能力和实际智能最重要 外行认为:实际问题解决能力、语词能力和社会能力最重要

15 (二)智力的理论 Galton和感觉敏锐度 1.二因素论 Spearman的一般因素(G)和特殊因素(S) 2.多因素论 Thurstone的群因素(语文理解、言语流畅性、推理、空间想象、数字、记忆、知觉速度)

16 3. Guilford的智力结构模型(内容×操作×结果=150)
产品 单元 类别 关系 体系 转换 蕴涵 内容 视觉 听觉 符号 语义 行为 评价 聚合思维 发散思维 记忆 认知 操作

17 4. 智力层次理论 Vernon G因素 言语和教育 操作和机械 数学 语文 … 空间知觉 机械能力 …

18 5.二维结构模型 希莱辛格和古特曼(1966) 第一维:言语能力、数学能力、图形和空间能力 第二维:规则应用能力、规则归类的能力、学术成就 6 Cattell的流体智力与晶体智力 7. Gardner的多元智力理论 言语、逻辑-数学、空间、音乐、身体运动、社交、自知

19 8 智力的生物学理论(反应时) 作出反应

20 9 智力的认知心理学理论 Sternberg 智力成分:元成分、操作成分、知识获得成分 智力情境:适应环境、塑造环境、选择新环境 智力经验:处理新任务、自动化加工 10 其他: 情绪智力(EQ)、成功智力、实践性智力(practical intelligence)

21 第二节 个体智力测验 一、比内量表 (一)比内-西蒙量表 1.1905年量表 世界上第一个智力量表; 内容:30道题(记忆、言语、理解、手工操作)。 题目排列方式:从易到难。 指标:通过项目数。如白痴最多只能通过6项,低能的成人可通过7~15项。

22 眼睛是否随动的物体移动。 用触觉刺激唤起抓握反应。 用视觉刺激唤起抓握反应。 辨认食物。 搜寻食物。 执行简单的命令和模仿简单的手势。 认识物体。 认识图片。 列举图片中的人物和物体。 比较两条线的长短。 复述两个数字。 比较两个重量。 暗示。 解说物体与人物的名称。 复述句子。

23 说出二物的不同点。 记忆图片中的物体。 靠记忆重画图片。 复述数字。 说出二物的相同点。 比较线的长短。 比较重量。 重量记忆。 说出同韵字。 填词。 用三个词造句。 对答问句。 交换长短针的位置。 剪纸。 抽象名词的定义。

24 2.1908年量表 内容:增至59道题。 方式:把测验项目按年龄分组。每一岁一组。每个年龄组项目数量不等,最多8项,最少3项。 年龄范围:3~13岁。 指标:智力年龄。

25 3.1911年量表 题目:删旧补新,但总数仍为59题。 增设一个成年组。 除4岁组仅有4个项目外,其他每个年龄组一律为5项,便于计算。

26 对比内-西蒙量表的评价 成就: (1)比西量表是第一个采用复杂任务来测量高级心理过程的测验。以前的测验主要测量感知觉、运动等低级心理过程。 (2)比西量表首次采用年龄作为智力的标准,这样可以对测验作出通俗易懂的解释。 (3)比西量表首次从整体上测量智力,也就是测量智力的普通因素,而以往心理学家把感觉辨别力、记忆力、注意力等割裂开来测量。 不足: (1)施测和记分没有标准化。 (2)常模团体的代表性不够,因而有些项目的安排位置不当。 (3)测验项目过少。

27 (二)斯坦福-比内量表 1.斯坦福-比内量表的发展 (1)1916年量表 在修改基础上增设39个新项目,达到90个项目。 最早对施测和记分提供了详细的指导语。 引入了智力商数的概念(比率智商)。 适用年龄:3~13岁。 样本:1000名儿童和400名成人。 (2)1937年量表 由 L 和 M 两个等值型量表构成 年龄范围扩大:1.5~18岁 样本:3184名1.5~18岁儿童,但仅限城市白人

28 (3)1960年量表 合并了L和M两型中最好的项目,改为单一量表。 年龄:2~成人 离差智商 4498名1.5~18岁儿童(1937年量表的施测对象)。 (4)1972年量表 测验内容未变; 取样范围扩大(地区、社会阶层、经济状况、民族)。  共2100名被试,其中2~5.5岁每半岁选100名,6~18岁每一岁选100名。

29 2.斯比量表的信度和效度 (1)信度 复本信度:L和M相关在0.83~0.95之间。 再测信度:高于0.90。 (2)效度 内容效度:测验内容属于公认的智力范畴。 效标关联效度:与学业成绩、受教育年限的相关在0.4~0.75之间。 结构效度:假设智力发展随年龄增长,先快后慢(证据:随年龄增长,再测稳定性逐步提高); 存在G因素(证据:各项目与测验总分的平均相关为0.66)

30 (三)中国比内测验 陆志伟和吴天敏1924年、1936年、1982年三次修订 内容:51题 指标:离差智商 年龄范围:2岁~18岁 生活常识 知觉速度及观察力 空间知觉力和想象力 记忆力 语言能力 判断推理能力

31 例:一个4岁儿童心理年龄的计算 年龄水平 通过的测验数目 每项测验得到的月数 全部得分 年 月 3岁 6(起始年龄) — 3 — 3岁半 5
年 月 3岁 6(起始年龄) 3 — 3岁半 5 1 — 5 4岁 3 — 3 4岁半 2 — 2 5岁 6岁 7岁 0(最高年龄) 总分 心理年龄(MA):4岁2个月

32 二、韦克斯勒(Wechsler)智力测验
生平: 1896年出生于罗马尼亚,6岁迁居美国。一战期间从事心理测验工作,用陆军甲、乙种测验、斯比量表来甄选新兵,积累了丰富的经验。 1919年去伦敦大学,师从Spearman和Pearson,接受G因素理论。1920~1922年在巴黎与西蒙有过接触。 1925年,在哥伦比亚大学获博士学位,论文《情绪反应的测量》。 1932~1967年,任纽约贝尔韦精神病院的主任心理学家。

33 二、韦克斯勒(Wechsler)智力测验
编制背景:寻找一种测量成人智力的有效方式 当时的智力测验存在下列问题: 测验项目引不起成人的兴趣; 过多的项目涉及语词的操作; 指导语过分强调速度,牺牲了准确性; 计算心理年龄,不适合成人测验要求。 测验者的实际测验分数 IQ= 这一年龄测验者的平均测验分数

34 韦氏智力测验家族: 1939年,韦克斯勒-贝利弗测验 1946年,韦克斯勒-贝利弗测验Ⅱ 1949年,韦克斯勒儿童智力量表(WISC) 1955年,韦克斯勒成人智力量表(WAIS) 1967年,韦克斯勒学前和小学儿童智力量表(WPPSI) 1974年,韦克斯勒儿童智力量表修订版(WISC-R) 1981年,韦克斯勒成人智力量表修订版(WAIS-R) 1989年,韦克斯勒学前和小学儿童智力量表(WPPSI-R) 1991年,韦克斯勒儿童智力量表第三版(WISC- Ⅲ )

35 韦氏测验的特点: (1)10~12个分测验:使用多个分测验,不仅可以得到总IQ,还可以分析个体在智力上的强项和弱点; (2)言语量表和操作量表各由5~6个分测验组成,可以单独评价言语或操作的各项智力成分,体现了左右脑功能的整合,而且可以显示个体的职业能力倾向。 (3)共同的IQ计分系统:对所有测验和所有年龄组,IQ平均为100,标准差为15。而且每个分测验的平均分为10,标准差接近3分。这样就可以比较被试的各项分测验分数,了解其相对强弱。 (4)不同年龄组有相同的分测验:例如,WAIS-R,WISC-R,WPPSI-R有相同的8个核心分测验。这不仅方便施测者,而且有助于测验之间的相互比较。

36 韦克斯勒测验的分测验 (1)常识(information) 33个一般知识性问题,如“谁发现了美洲?”“我国的首都在哪里?” “儿童节是哪一天?” 得分越高,说明兴趣越广泛,好奇心强,长时记忆好。 把该测验放在首位,容易与被试建立关系,不易引起被试的紧张和厌烦。

37 (2)数字广度(digit span) 分顺背和倒背两部分(2位到9位数)。 主要测查瞬时记忆能力。对智力低者,测其智力;对智力高者,测其注意力。 按0或1计分,总分为两部分之和。 智力高者在该项上得分未必高,有时倒背可能会高于顺背成绩。 脑功能障碍者一般得分较低。但对有些白痴学者,能轻易得高分。

38 (3)词汇(vocabulary) 要求被试定义和解释通过视觉或听觉呈现给他们的字词的一般意义。例如“什么是杯子?”“什么是美丽?” 该测验与抽象概括能力有关。年龄大的、智力高的、受教育程度高的、经历丰富的人,其得分高。 问题是计分困难。答案分四级: 一级:用同义词,且能说明二者的细微差别; 二级:具体运用词汇来造句; 三级:望文生义,作字面解释; 四级:做手势或指实物给主试看。 一级计2分,二级计1分,三四级计0分。

39 (4)算术(arithmetic) 简单项目主要是加减法运算。难一些的问题需要对问题进行分析,并运用两种以上的算术运算。 主要测量基本的数理知识和数学思维、推理能力。 (5)理解(comprehension) 容易的题目主要测常识,如“为什么人要穿衣服?” 难的项目需要了解社会、文化传统,如“为什么最高法院任命终身法官?” 该分测验能反映被试对于社会价值取向、风俗、伦理道德是否理解和适应,在临床上可以鉴别脑器质性障碍的病人。

40 (6)类同(similarities) 让被试区分物体、事实和观念的重要的相似性与不重要的相似性,如“衬衫和袜子有什么相似的地方?”测查个体的逻辑思维、抽象思维、分析和概括能力。 (7)填图(picture completion) 要求被试回答图中缺少了什么重要成分。主要测的是记忆、细节注意能力和视觉敏锐性。 具有病态观念的患者往往将自己的思想投射到测验中去。智力落后者的填图成绩很差。

41

42

43 (8)图片排列(picture arrangement)
有意打乱图片的顺序,要求被试重新排列图片,使之组成一个有意义的故事。 测量被试的分析综合能力、观察因果关系的能力、社会计划性、预测能力和幽默感等。

44 (9)积木图案(block design) 呈现10张红白相间的几何图案卡片,要求被试用4个或9个积木照样摆出来。 主要测量视知觉、分析能力、空间定向能力和视觉-运动综合协调能力。 该测验与操作量表总分相关很高,被认为是最好的操作测验。在临床上帮助诊断知觉障碍、分心、老年衰退等症状。 (10)拼图(object assembly) 要求被试把一套切割成几块的图形板,拼成一个熟悉物体的完整画面。测量概括思维能力与知觉组织能力、辨别部分与整体关系的能力。

45 拼图

46 (11)译码(coding)或数字符号(digit symbol)
主要测查注意力、简单感觉运动的持久力、建立新联系的能力和速度。 文书工作人员得分高,具有强迫观念和强迫行为者得分高。做事认真、一丝不苟者得分低;女性比男性得分高。

47 (12)迷津(maze) 测量的是知觉运动速度、知觉组织能力、抑制冲动反应的能力。

48 (13)句子(sentences) 要求被试逐字重复主试大声读出的句子。 测查注意和记忆能力。 (14)几何图形(geometric design) 10个图案,每个图形由一个圆、一个正方形和一个菱形组成,让儿童复写。 (15)动物房(animal pegs) 把某种颜色的圆锥(黑、白、黄、蓝)放到合适的动物(狗、小鸡、猫、鱼)的洞里。测查学习能力、手的灵活性、维持注意的能力。

49 (一)韦氏成人智力量表 共有11个分测验,其中6个言语量表(常识、数字广度、词汇、算术、理解和类同),5个操作量表(填图、图片排列、积木图案、物体拼凑、数字符号)  信度和效度 背数和数字符号分测验计算复本信度,其余部分计算分半信度,为0.88~0.98 结构效度:“从各个方面来测量智力,而不是测量不同类型的智力。”因素分析表明,有50%的变异来自智力一般因素;各分测验之间和分量表之间存在普遍的显著的正相关,表明智力G因素渗透于智力行为的各个方面。 内容效度:测验项目均取自或参照前人成功用过的量表(比内量表、陆军和)编制。 效标关联效度:与斯比量表的相关0.80;文职人员的言语智商高于操作智商,技术工人则相反。

50 2.韦氏成人智力量表中国修订本(WAIS-RC)
修订者:龚耀先(1982年) 年龄范围:16~65岁 共有11个分测验,其中6个言语量表(常识、数字广度、词汇、算术、理解和类同),5个操作量表(填图、图片排列、积木图案、物体拼凑、数字符号)  常模:农村(992人)和城市(2029人) 信度:分半信度为0.30~0.85,再测信度为0.82~0.89 效度:高考成绩差异显著者,其智商也差异显著。

51 (二)韦氏儿童智力量表 12个分测验:5个言语测验(常识、类同、算术、词汇、理解),5个操作测验(填图、图片排列、积木图案、拼图、译玛),2个备用测验(背数和迷津)。 适用年龄:6~16岁 分半信度:0.70~0.86 再测信度:0.65~0.88 效标关联效度:以年龄为效标,得分随年龄增长而提高。与学绩测验或其他学业行为的相关为0.50~0.60;与斯比量表的相关为0.60~0.71 结构效度:发现智力一般因素的存在

52 韦克斯勒儿童智力量表(WISC-R)中国修订本
修订者:林传鼎、张厚粲等(1983年) 常模:中等以上城市(3000人) 修订原则:测题要适合中国儿童的特点;改动的测题尽可能与原题性质类似、难度接近。主要改动有: (1)我国社会中不常见的或我国儿童不熟悉的测题内容,如“一个镍币等于几便士?”“美国成年男子平均身高是多少?” (2)不合我国国情的,如“为什么把钱交给慈善机关比施舍给街头乞丐好?” (3)由于语种不同,翻译后在难度上发生变化的,如“三月过后是几月?”“啤酒和黄酒的共同点是什么?” (4)凡外国人名、货币名称以及图片上的人物等尽量使之中国化。

53 言语量表:常识、背数、词汇、算术、理解、类同
操作量表:填图、图画排列、积木图案、拼图、译码、迷津

54 (三)韦氏幼儿智力量表(WPPSI) 年龄:4~6.5岁 11个分测验:5个言语测验(常识、理解、词汇、算术、类同),5个操作测验(填图、迷津、积木图案、句子复述),2个备用测验(动物房、几何图案)。 分半信度: 再测信度 结构效度:G 效标关联效度:与斯比量表的相关

55 对韦氏量表的评价 优点: (1)具有复杂的结构,能够较好地反映智力的整体和各个侧面; (2)各年龄组都接受相同的分测验,可以相互比较,并节省指导测验的时间; (3)用离差智商代替比率智商,克服了计算成人智商的困难。 (4)采用因素分析法研究结构效度更具有理论意义。 (5)各量表之间相互衔接,适用的年龄范围可以从幼儿直到老年。

56 缺点: (1)施测程序复杂费时; (2)对于测量智力极高或极低的被试不大适用; (3)缺乏充分的效度资料。

57 第三节 团体智力测验 一、陆军测验 一战时在Yerkes领导下编制。 陆军甲种(α)测验 8个分测验: 照令行事、算术、常识、异同(同反义词)、字句重组、填数、类比推理、理解 效度:与军官评定、斯比量表、教师评定、学业成绩的相关

58 陆军乙种(β)测验 7个分测验:迷津、立方体分析、补足数列、译码、数字校对、图画补缺、几何形分析 测试对象:母语非英语的被试和文盲被试 效度:与甲种测验的相关

59 二、瑞文推理测验 (一)瑞文推理测验的产生与发展 1.瑞文标准推理测验 6岁以上 5个系列,60个项目
A组 测知觉辨别力、图形比较、图形想象 B组 测类同、比较、图形组合 C组 测比较、推理、图形组合 D组 测系列关系、图套组合 E组 测套合、互换等抽象思维能力

60

61 2.瑞文彩图推理测验 5~11岁 3个系列,36个项目 3.瑞文高级推理测验 适合于高智力成人 第一套12个项目,第二套36个项目 

62 (二)瑞文标准推理测验中国修订本 修订者:张厚粲(1985年) 取样:大、中、小城市 年龄:5岁~成人 信度:分半信度、再测信度 效度:与WISC-RC、高考成绩的相关。

63 三、认知能力测验 桑代克 初级型:口头、词汇、关系概念、多重智力和数量概念 文字测验:词汇、句子填充、语词分类、语词类推 数量测验:数的大小比较、数列补充、建立关系 非文字测验:图形分类、图形推理、图形综合

64 团体测验与个体测验的差异: 团体测验 个体测验 题型 多项选择 开放式 计分 计算机计分 施测者计分 施测方式 团体 个体 用途 筛选 诊断 样本 极大 一般 施测时间

65 第四节 婴幼儿智力测验 一、盖塞尔发展顺序量表 适用年龄:出生~36个月 方式:自然情景下对儿童的观察
测试工具:响铃、三色环、拨浪鼓、积木、摇铃、蜡笔和纸、皮球、颜色板等 评定内容: 动作:分大动作和细动作。大动作指身体的姿态、头的平衡、坐、立、爬、走、跑、跳,细动作指手指的运用。 言语:听、理解和表达 环境适应:如对物体和环境的精细感觉、协调能力 社会应答:与人交往

66 2岁小孩的动作发育 逐页翻书、叠起7~8块积木、用积木接成火车、把盛满水的杯子给人、学画圈、能说出4样画片的名称、踢球、跑且不摔交

67 婴幼儿智能发育阶段初步检查表 关键年龄 成熟阶段 动作能 应物能 言语能 应人能 4周 仰卧 不能控制头部,仰卧姿势左右不对称
眼光能短暂跟随人、物,给玩具立即放弃 面部无表情,喉头作微声 凝视四周,“倾听声音” 16周 颈可竖直,头微摇动,仰卧姿势左右对称 开始接近有响声的玩具,注视手中有响声的玩具 发出咕咕声,出声笑 自动微笑迎人,玩弄己手 28周 扶起独坐,身体前倾 身手拿玩具,能将玩具自一手递交他手 呼号,哭时作“姆姆”声 将足置于口中 40周 可独坐,爬行,扶着物件站立 能将两样玩具放在一起,平指摘小丸 能呼爸爸妈妈,除爸妈外能说另一字 懂得成人逗玩,能自己吃饼干 52周 运动 搀一手行走,摇摆 能把方木置于杯中,试堆叠二方木 能说二字,对“给我”二字有反应 穿衣时能合作

68 关键年龄 成熟阶段 动作能 应物能 言语能 应人能 15月 运动 独自行走,微有摇摆;自坐于小椅子中 堆叠二块方木;能把6块方木置于杯内 能用4~6个字 能指出并说出所需之物,摸玩具 18月 独自行走,自坐于小椅子中 堆叠3~4块方木,模仿一划 能用10字言语(无任何意义) 白天能控制大小便;能携带及抱娃娃 2岁 幼儿园前期 能跑,自行上下楼梯 堆叠6~7块方木,模仿画圆圈。 能说2~3字短语,能说3~5张画片中物名 白天预示大小便,能照顾娃娃入睡 3岁 能骑三轮脚踏车,能一足短暂独立 模仿叠方木成品字形、房屋型,模仿画十字 能成句,能说出姓名、性别 能自己吃食物,能自己穿袜解扣。

69 二、丹佛发展筛选测验 (Denver Developmental Screening Test, DDST) 年龄:6岁以内 评定内容: 个人-社会行为、精细动作、语言、大运动 三、贝雷婴儿发展量表 (Bayley Scales of Infant Development) 心理量表:知觉、记忆、学习、问题解决、发音、初步的语言交流、初步的抽象思维 运动量表:大动作和精细动作 行为记录:情绪、社会行为、注意广度、目标定向等。

70

71 婴幼儿测验的预测效度 缺乏长期的预测效度:1岁内婴儿的测验分数对预测3~4岁的智商有一定的效度,但对长期预测几乎不起作用; 对缺陷儿童的诊断非常有效。 对儿童以后的智力发展,父母受教育的程度及社会经济地位要比婴儿测验的分数更有预测力。

72 第五节 传统智力测验中的几个问题 (一)传统智力测验的结构效度
第五节 传统智力测验中的几个问题 (一)传统智力测验的结构效度 不同智力测验有着不同的理论基础,其结构也不同,解释也不同,因此,应针对不同情况选择不同量表,也不能笼统地说一个人的智力如何。 (二)传统智力测验的功能 还不够精细,无法精确诊断。 不能贴标签,更主要的是要解决问题。

73 (三)传统智力测验的公平性 1.性别差异 传统智力测验中有利于男性和女性的项目的不平衡 2.职业差异 经历对智力的影响 3.文化和教育差异 城乡差别、种族差别 能否编制出绝对公平的测验? 4. 年龄(时代)差异:人是不是越来越聪明?

74  (四)传统智力测验的预测效度(智商的稳定性与不稳定性)
1.智力随年龄成熟而发展 不同年龄的智力成分是否相同? 智力是随年龄而增长的吗? 一个人的智商是否终身不变? 早期智力开发有无必要? 2.智力随环境而变化 智力中的遗传与环境的关系 同一家庭中成长的孩子,其所处的环境是否相同?

75 3.智力随个性特质的不同而产生不同变化 人格、动机、情绪对智力发展的影响,而传统智力测验没有考虑这些因素的影响。 学习困难儿童在自我批评和自我监控方面尤为不足。 高智商的人,其智力发展速率快。 积极的人格(进取心、面对挫折的态度)能促进智力的成长。

76 第十一章 能力测验(下) 第一节 能力倾向测验 一、能力倾向测验的产生原因 1 智力测验的局限
大部分智力测验只测量了言语能力和数目及抽象符号的关系能力,无法测得一些具体的能力。 2 个体能力倾向的差异 3 因素分析技术的发展 4 来自实际的需要

77 二、能力倾向测验的特点 1 能力倾向测验的预测目的性更强 能力倾向测验预测失败比预测成功更准确 2 测验的编制 每个分测验针对一种能力,应该是相互独立的。 重视特殊团体常模的建立 3 测验结果的解释 注意被试与常模性质之间的差异。

78 三、具体能力倾向测验介绍 (一)学术能力倾向测验(SAT) 美国的高考测验 语言:反义词、句子填充、类比推理、阅读理解 数学:算术、代数、几何

79 (二)分辨能力倾向测验(Differential Aptitude Test, DAT)
适用于初中和高中学生的教育咨询及就业指导 言语推理 数的能力 抽象思维 文书速度与准确性 机械推理 空间关系 语言运用:拼写 语言运用:文法

80 (三)一般能力倾向成套测验(GATB) 综合式职业性向测验(36个职业群常模)。 一般智力: 言语能力 数的能力 空间关系理解力 形状知觉能力 文书知觉能力 动作协调能力 手指灵巧性 手部灵巧性

81 第二节 特殊能力测验 一、音乐能力测验 (一)西肖尔音乐才能测验 音调、音量、时间音程、节奏、音色、音调 (二)音乐能力测验图 (1)T测验:音调形象(旋律、和声) (2)R测验:节奏形象(速度、节拍) (3)S测验:音乐感受(短句、平衡、风格等)

82 二、美术能力测验 (一)梅尔美术判断力测验  包括10对的绘画作品,一幅是公认的名画,另一幅稍作改动,要求被试判断哪一幅更好。 (二)格雷福斯图案判断测验 由90套二维或三维的空间抽象图案组成,每一套包括2~3个同一图案的变式,它们在整体性、平衡性、对称性等方面有所区别,要求被试判断哪一图案更好。  (三)霍恩美术能力问卷 包括两部分:(1)要求被试画出20种常见的物体或几何图形;(2)在长方框规定的基本线条内作图。

83 三、机械能力测验 (一)空间关系测验 1.明尼苏达机械拼合测验   要求被试拼排随机摆放的机械物体。 2.明尼苏达空间关系测验   要求被试尽快将木块放入相应的几何形状的槽中。 3.明尼苏达书面形式拼板测验   包括64道选择题,每题包括一个分解几何图形题和5个拼凑成整体的选择图案,要求被试选择正确的答案。

84 (二)Bennett机械理解能力测验 适用范围:9~12年级 限时:30分钟 测量对实际情况中对机械关系和物理定律的理解。

85 第三节 创造力测验 一、发散思维研究与创造力测验 二、吉尔福特发散思维测验 1 词语流畅:迅速写出包含一个指定字母的单词。 2 观念流畅:迅速列举属于某一种类的事物的名称,如“能燃烧的液体”有…… 3 联想流畅:列举近义词。 4 表达流畅:写出每个词都以指定字母开头的四词句。如“K—U—Y—I”,”Keep Up Your Interest” “Kill Useless Yellow Insects”

86 5 非常用途:报纸可以用于…… 6 解释比喻:“一个女人的美丽就像秋天,它……” 7 效用测验:尽可能列举一件东西的各种用途 8 故事命题: 9 推断结果:“假若人们不再需要睡眠,会出现什么情况?” 10 职业象征:蜡烛——老师 11 图形组合:类似七巧板,包括4种形状(圆、三角形、长方形、梯形),可以重复使用,可以改变大小。 12 绘图:把一简单图形复杂化,组成尽可能多的各种物体的图形。 13 火柴问题: 14 装饰:以尽可能多的不同设计修饰一般物体的轮廓图。

87 三、托伦斯创造性思维测验 (一)言语的创造性思维测验 包括7项活动: 1 发问: 呈现一张图画,要求列举为了了解图中之事而需要询问的所有问题。 2 猜测原因:列举图中之事发生的所有可能原因。 3 猜测结果:列举图中之事的所有可能结果。 4 产品改进:对给定玩具提出改进意见。 5 非凡用途:列举某物不同寻常的可能用途。 6 不平凡的疑问:对活动5中所示物体提出不同寻常的疑问。 7 推想结果:列举一种假想事件的所有可能结果。 从流畅性、变通性、独特性三个方面计分。

88 (二)图形的创造性思维测验 1 建构图画 要求被试把一张边缘为曲线的颜色鲜明的纸片贴在一张空白纸上,然后以此为出发点,画一个非同寻常的能说明一段有兴趣的振奋人心的故事的图画。 2 完成图画:利用少量不规则的线条画出物体的略图。

89 3 利用成对的短平行线(A本)或圆(B本)尽可能多地画出不同的图。
从流畅性、变通性、独特性、精确性4个方面来评分。

90 第十二章 人格测量 第一节 人格测量的一般问题 一、人格与人格测量
 人格是与社会行为有关的心理特质的总和,包括需要、动机、兴趣、爱好、感情、态度、性格、气质、价值观、人际关系等。人格有下面四个特征: 独特性 稳定性 统合性(整体性) 功能性

91 在心理测验领域中,人格测验尚处于摇篮时期,原因在于:
人格内涵复杂。对于人格的结构及分类问题,至今没有一致结论。 人格是动态的,常随环境而改变。 人格测验的先驱: 高尔顿(Galton): 克雷匹林(Kraepelin):用对词的自由联想来诊断精神病人。 第一个人格问卷——武德沃斯(Woodworth)1919年编制的“个性资料调查表”

92 人格测验的方法 自陈法、投射法、评定法、情境法

93 第二节 自陈量表 一、自陈量表(self-report inventory)的性质 让被试自己提供关于自己人格特征的报告。
基本假设:只有被试自己最了解自己。 (一)自陈量表的题目形式 是否式 是ɫ 否ɫ 二择一式 是否折中式 是ɫ 否ɫ 不一定ɫ 文字等级式 非常满意ɫ 比较满意ɫ 无所谓ɫ 不大满意ɫ 极不满意ɫ 数字等级式 (5—经常 —多次 —偶尔 —极少 —从不)

94 (二)自陈量表的特点 测量工具一般为调查表。 题量较大。 在同一测验中往往包含几个分量表,测多个特质。 通常采用纸笔测验,因而可以团体施测。 计分规则简单而客观。  自陈量表的问题: 社会称许性 自我防御:掩饰 默认 折中

95 二、自陈量表举例 明尼苏达多项人格调查表 (Minnesota Multiphasic Personality Inventory, MMPI) 编制者:美国明尼苏达大学Hathaway和Mckinley教授编制。  题量:566(其中有16道重复,实际题量为550) 项目内容:生理状况,精神状态,对家庭、婚姻、宗教、政治、法律、社会等问题的态度。 量表组成:10个临床量表和3个效度量表

96 10个临床量表: Hs:疑病(Hypochondriasis) D: 抑郁(Depression) Hy:癔病(Hysteria) Pd:精神病态(Psychopathic deviate) Mf:男性化-女性化(Masculinity-femininity) Pa:妄想狂(Paranoia) Pt:精神衰弱(Psychasthenia) Sc:精神分裂(Schizophrenia) Ma:轻躁狂(Mania) Si:社会内向(Social introversion)

97 Hs:疑病(Hypochondriasis): (30题)
异常担心自己身体有病 对身体极端关心 诉说症状笼统含混, 诉说有慢性的疲劳、疼痛、衰弱 自我中心 对他人严厉,间接地表现出敌意 悲观主义 愚钝,顽固,笨嘴拙舌 事事持怀疑观点,心理治疗不太有效

98 D: 抑郁(Depression):60题 忧郁、压抑、闷闷不乐、对未来悲观 对自己评价过低,缺乏自信,感到无能 抱有罪恶感 寡言、哭泣、动作缓慢 诉说衰弱、疲劳、精力丧失 焦虑不安,紧张 在学校和工作上的失败感 内向,害羞,与人保持距离 细心刻板 很难下决心

99 Hy:癔病(Hysteria):60题 以出现身体症状来对精神紧张进行反应,以逃避责任 有头痛、胸痛、衰弱、心跳不安等症状 有突然出现、突然消失的症状 缺乏对症状原因的觉察 缺乏对自己动机和感情的觉察 天真幼稚 自我中心 期待他人的爱抚和注意 与上司关系不好

100 Pd:精神病态(Psychopathic deviate):50题
难以接受社会的价值观和规范 沉溺于非社会或反社会的行为(说谎、盗窃、性异常、吸毒 ) 反抗上司 对家族使用暴力 冲动、鲁莽、无计划性,行动不考虑后果 缺乏判断力,冒险,不能吸取经验教训 夫妻生活有问题 自我中心,任性 追求虚荣,出风头 对所干的事几乎无知罪的意识

101 Mf:男性化-女性化(Masculinity-femininity):60题
男性: 男性角色含混不清 柔弱 对审美和艺术很感兴趣 忍耐力强 女性: 反感自己的女性角色 具有机械、数学的爱好 竞争性强,想支配人 粗野,无礼

102 Pa:妄想狂(Paranoia):40题 明显的精神病行为 思维混乱 有被害妄想和夸大妄想 过敏,对他人的行为作过分的反应 疑心重 易怒 对家族表示敌意和反感 使用投射作为防御机制

103 Pt:精神衰弱(Psychasthenia):48题
不安,紧张,爱担忧,操心 心思集中困难 内省,沉默 强迫思维 劣等感,缺乏自信,自我怀疑,自卑 完美主义 对自己,对他人要求都高 规规矩矩 情感脆弱,依赖性强 有关植物性神经系统方面的体诉

104 Sc:精神分裂(Schizophrenia):78题
明显的精神病行为和生活方式 思维错乱,妄想,幻觉 判断力低 缺乏对社会环境的归属感,感到被孤立、被疏远、被误解 沉思,闭门不出,不与人打交道 广泛的焦虑 不能表现情感 固执己见

105 Ma:轻躁狂(Mania):46题 无目的的活动过多 说大话,夸张自己的价值,缺乏自知之明 幻觉,夸大妄想 精力旺盛,爱说话 对于涉及细节的事情几乎不关心 难以抑制冲动,易怒 非现实的、无根据的乐观主义 给人的第一印象好 人际关系肤浅

106 Si:社会内向(Social introversion):70题
内向,腼腆,胆怯,害臊,拘谨 喜欢独处 在异性面前不自然 缺乏自信,优柔寡断 很在意别人的看法 感情很少外露,而对不与别人交往感到苦恼 顺从 值得信赖 慎重,刻板,欠创造性

107 3个效度量表 L:说谎量表(Lie) 我不喜欢我认识的每一个人。 F:诈病量表(Frequency) K:校正量表(Correction) 计分方法 原始分→T分数→剖面图

108

109 卡特尔16种人格因素量表 (The Sixteen Personality Factor Questionnaire, 16PF)
编制者:美国伊利诺州立大学Cattell 题量:187题 维度:16PF 计分:原始分→标准10分制→剖面图

110 因素 低分者特征 高分者特征 乐群(A) 缄默孤独 乐群外向 聪慧(B) 迟钝、学识浅薄 聪慧、富有才识 稳定(C) 情绪激动 情绪稳定 恃强(E) 谦逊顺从 好强固执 兴奋(F) 严肃审慎 轻松兴奋 有恒(G) 权宜敷衍 有恒负责 敢为(H) 畏怯退缩 冒险敢为 敏感(I) 理智、注重实际 敏感、感情用事

111 因素 低分者特征 高分者特征 怀疑(L) 依赖随和 怀疑、刚愎 幻想(M) 现实、合乎成规 幻想、狂妄不羁 世故(N) 坦白直率、天真 精明能干、世故 忧虑(O) 安详沉着、有自信心 忧虑抑郁、烦恼多端 实验(Q1) 保守、服从传统 自由、批评激进 独立(Q2) 依赖、随群附众 自立、当机立断 自律(Q3) 矛盾冲突、不明大体 知己知彼、自律谨严 紧张(Q4) 心平气和 紧张困扰

112 爱德华个性偏好量表 (Edwards Personal Preference Schedule, EPPS)
题量:225(15个重复题) 内容:15种需要(Murray提出的需要理论) 成就、顺从、秩序、表现、自主、亲和、省察、求助、支配、谦逊、慈善、变异、坚毅、性爱、攻击 特点:采用强迫选择法来控制社会称许性

113 艾森克人格问卷 (Eysenck Personality Questionnaire, EPQ) 编制者:英国心理学家Eysenck
题量:101 维度: E:内外倾性。高分表示人格外向,低分表示人格内向; N:情绪性。低分表示情绪稳定,高分表示神经过敏; P:精神质。高分表示孤独,难以适应环境,感觉迟钝。 L:说谎量表。

114

115 第三节 投射测验 一、投射测验(projective technique)及其理论基础   投射测验是向被试题提供一些未经组织的刺激情境,让他在不受限制的情境下,自由表现出他的反应,分析反应的结果,便可推断他的人格结构。 基本假设: 人们对于外界刺激的反应都是有其原因且可以预测的; 被试当时的心理状况及整个人格结构,对当时的知觉与反应的性质和方向,都起了很大的作用; 人格结构的大部分处于潜意识中,当被试面对一种不明确的刺激情境时,就可以使隐藏在潜意识中的欲望、需求、动机等“泄露”出来,即把一个反映他的人格特点的结构加到刺激上。

116 投射测验的特点 测验材料没有明确的结构和意义。 受测者对测验材料的反应不受限制。 测验目的具有隐蔽性。 对测验结果的解释重在对受测者的人格特征的整体了解。 不受语言文字的限制。 计分困难。

117 投射测验的分类   根据被试的反应方式,可分5类: 联想法——罗夏克墨迹测验 构造法——主题统觉测验 完成法——句子完成测验 选排法——要被试根据某一准则,选择照片,或对照片进行排列 表露法——画人测验

118 二、罗夏克墨迹测验 (Rorschach Inkblot Test, RIT) 编制者:瑞士精神病学家Rorschach 材料:10张墨迹图 反应方式:自由联想 计分和解释:

119 三、主题统觉测验 (Thematic Apperception Test, TAT) 编制者:美国哈佛大学Murray和Morgan编制。 材料:31张图片 方式:看图编故事

120 四、投射测验的评价 优点: 可以对人格作综合的、完整的探讨,对被试的内心生活作深层的探索,并作出动态解释; 测验目的隐蔽,防止被试作虚假反应。 缺点: 评分缺乏客观标准,难以量化; 缺少充分的常模资料,测验结果不易解释; 信度和效度不易建立; 原理复杂深奥,非经专门训练者不易使用; 被试的反应更容易受测验情境的影响。

121 第三节 评定量表 评定(rating)指由熟知被试行为的第三者依照长期观察的结果对被试行为进行评定。 评定量表的种类:
第三节 评定量表 评定(rating)指由熟知被试行为的第三者依照长期观察的结果对被试行为进行评定。 评定量表的种类: 数字评定量表:用数字表示不同程度 描述评定量表:用文字表示不同程度 标准评定量表:评判被试属于哪一类型的人 检选量表:给出一组形容词,把最能描述被试的形容词挑出来。 强迫选择评定量表:每组中有多个选项,评定者必须从中选出一个最能代表被试的项目。

122 常见的评定误差 严格误差:吹毛求疵 宽容误差: 趋中误差: 逻辑误差:把自认为相互联系的特质作同样的评价 “光环”效应:以偏概全

123 如何减少评定误差 明确界定所评定的行为特质 评定等级不应过细,5级为宜。 对评定者的训练 多人评定 采用相对评定法 注明评定依据。 分别评定各个特质

124 评定量表举例 莱氏品质评定量表 用于评定内外向 例如: 他的谈锋如何? 喋喋不休;善于辞令;倾向于听;只答复问题;沉默寡言。
倘若事情做错,他的态度如何? 对之悲伤;引以为虑;设法矫正;稍加考虑;坦然处之。

125 卜氏儿童社会行为量表 用于评定幼儿社会行为发展 孩子是否做过下列各项: 1 他与其他孩子玩耍吗? 2 他与其他孩子说话吗? 3 他偶然用摸或推的方式与其他儿童接触吗? …… 总分越高,社会行为发展越好

126 第四节 情境测验 把被试置于特定的情境中,由主试观察其在此情境下的行为反应,从而判断其人格。 一、品格教育测验
第四节 情境测验 把被试置于特定的情境中,由主试观察其在此情境下的行为反应,从而判断其人格。 一、品格教育测验 用于测量诚实、自我控制、利他主义等品格。 如:让学生给自己的卷子打分(事先把卷子复印了1份),看其是否诚实。 让被试闭上眼睛,在圆圈中画记号,看其是否偷看过。

127 二、情境压力测验 选拔间谍 选拔领导——无领导团体情境 三、情境测验的评价 优点:真实,自然 缺点: 施测困难,费时费钱; 主观评定,误差较大; 被试在不同情境中有不同表现。

128 第五节 人格测量存在的问题 一、测量对象 人格特质:复杂多样 二、信度和效度 影响测验分数稳定性的因素复杂
第五节 人格测量存在的问题 一、测量对象 人格特质:复杂多样 二、信度和效度 影响测验分数稳定性的因素复杂 缺乏可靠的效标(专家评定的可靠性不高) 人格测验的信度、效度比智力测验要低。

129 三、测验的题目 题目范围难以界定; 措辞的细微差别会导致反应的巨大差异; 题目含义笼统。(即使工作困难,你也会继续下去吗?) 在选项中,经常、有时、很少,每个人的理解也不一样。 四、分数解释 相同的得分能否给予相同的解释? 不同人之间是否有共同的人格结构? 多数人的行为是否就是正常的?

130 第十三章 其他心理测验 第一节 焦虑测验 一、焦虑概述 二、焦虑测验 (一)显性焦虑量表(MAS) (二)状态-特质焦虑量表(STAI)
二、焦虑测验 (一)显性焦虑量表(MAS) (二)状态-特质焦虑量表(STAI) (三)测验焦虑量表

131 (四)其他临床焦虑量表 1.贝克焦虑量表 2.汉密顿焦虑量表

132 第二节 兴趣测验 一、兴趣测验概述 二、常见的职业兴趣测验 (一)斯特朗职业兴趣问卷 (二)库德职业兴趣调查表 (三)自我指导问卷 现实型、研究型、艺术型、社会型、企业型、传统型

133 第三节 态度和品德测量 一、态度测量 (一)态度概述 (二)态度测量方法 1.等距量表法 2.利克特量表法 3.哥特曼量表法

134 二、品德测量 (一)品德概述 (二)情境测验法 1.活动情境测验 2.假设的问题情境 (三)问卷测量法

135 第十四章 测量的综合应用 第一节 测量在心理咨询中的应用 一、心理咨询概述 二、心理测量在心理咨询中的应用
二、心理测量在心理咨询中的应用 (一)在自我认识、人生规划咨询中的应用 (二)在神经症、人格障碍等咨询中的应用

136 第二节 测量在人事测评中的应用 一、人事测评概述 二、测量在人事测评中的应用 (一)在人的心理特点评估中的应用 智力测验 个性测验
专业知识技能测验 特殊能力测验 (二)人员培训后的心理特点评估 (三)工作人员的绩效评估

137 第三节 测量在教育评价中的应用 一、教育评价概述 二、测量在教育评价中的应用 (一)在测量学生的学习与发展状况中的应用
二、测量在教育评价中的应用 (一)在测量学生的学习与发展状况中的应用 (二)测量在教师与管理者评价中的应用

138 拜 拜


Download ppt "第六章 学绩测验 第一节 学绩测验概述 一、学绩测验的性质 最高作为测验可以分为:学绩测验、能力测验、能力倾向测验。"

Similar presentations


Ads by Google