Download presentation
Presentation is loading. Please wait.
1
心理测量学 心理测量学知识
2
教学纲要 第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序
第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用
3
第一节 概述 第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观
第一节 概述 第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观 第五单元 心理测验在心理咨询中的作用 第六单元 心理测验的发展史
4
第一单元 测量与测量量表 什么是测量 依据一定的法则用数字对事物加以确定。 测量要素 1)参照点 相对零点/绝对零点 2)单位
第一单元 测量与测量量表 什么是测量 依据一定的法则用数字对事物加以确定。 测量要素 1)参照点 相对零点/绝对零点 2)单位 确定的意义/相同的价值
6
如何衡量?
7
测量量表 第一单元 测量与测量量表 测量是在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。 命名量表 顺序量表
第一单元 测量与测量量表 测量量表 测量是在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。 命名量表 顺序量表 等距量表 等比量表
8
命名量表 代 号 类 别 身份证号 王晓晨 623857198505060146 图书在版编目
王晓晨 图书在版编目 心理咨询师 ISBN 商品条码 性别:1=男 2=女 班级:1班 2班 3班 4班 类 别
9
顺序量表 大 属性 年级(教育任务) 幼儿园→小学→初中→高中→大学…… 年龄(社会经验) 婴儿→幼儿→儿童→少年→青年→中年→老年 小
名次(100米跑) 第一名→第二名→第三名→第四名……
10
等距量表 相对零点 相等单位 温度 兰州 :温度15℃ - 32℃。白天:晴间多云,夜间:晴间多云。东南风转东北风2级 兰州 :温度-12℃ - 5℃。白天:阴到多云, 有雪,夜间:阴到多云, 有雪。北风2-3级转西风2级
11
等比量表 绝对零点 相同单位 长度 某人5岁时身高110cm,15岁时身高165cm,10年间他增长了多少? 重量
某人患病前体重68kg,患病后体重51kg,请问他减轻了多少? 时间 A完成作业的时间1小时,比B快1倍,请问B需要多长时间完成作业? 个数 小明有3个苹果,比小王多两个,小王有几个苹果? 等比量表 绝对零点 相同单位
12
思考:心理量表哪种类型? 我喜欢红色 -3 -2 -1 0 1 2 3 我认为我是一个有价值的人 1 2 3 4 5 6 7 8 9
最近一周我总觉得不开心
13
第二单元 心理测验的基本概念 心理测验的定义
第二单元 心理测验的基本概念 心理测验的定义 依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。 心理测验的性质 间接性 相对性 客观性
14
第三单元 心理测验的分类 按测验的功能分类 智力测验/特殊能力测验/人格测验 按测验材料的性质分类 文字测验/操作测验
按测验材料的严谨程度分类 客观测验/投射测验 按测验的方式分类 个别测验/团体测验 按测验的要求分类 最高作为测验/典型行为测验
15
学 龄 前 儿 童 50 项 智 能 筛 查 量 表 请小儿回答下列问题(按要求执行) 1指给我看,你的眼睛在哪儿?
2指给我看,你的耳朵在哪儿? 3指给我看,你的颈项在哪儿? 4告诉我,你叫什么名字? 5你的手指在哪? 6请把衣服上的扣子扣好。 7有一双鞋(鞋尖对着小儿)你穿穿看。 8请把裤子重新穿一下。 9指给我看,你的眉毛在哪儿? 10请你学我样,倒退走路(2米) 11你并住双 足,往前跳一下(20厘米)。 12你今年几岁(虚岁和实岁都可)? 13你自己会穿上衣服吗?穿给我看看。
16
举例 1.我喜欢看机械方面的杂志。 2.我的胃口很好。 3.我早上起来的时候,多半觉得睡眠充足,头脑清醒。 4.我想我会喜欢图书管理员的工作。 5.我很容易被吵醒。 6.我喜欢看报纸上的犯罪新闻。 7.我的手脚经常是很暖和的。 8.我的日常生活中,充满了使我感兴趣的事情。 9.我现在工作(学习)的能力,和从前差不多。
18
罗夏墨迹测验
20
主题统觉测验
21
表明讲故事者感觉到了外部的坏影响对一个人的行为产生的控制作用,它还显示出了好几种深层需要,其中有(对其母亲的)供养,获取金钱和自我贬低的需要。
案例分析 母亲和孩子幸福地生活着。她没有丈夫,她的儿子是她惟一的支持。可这个孩子交上了坏朋友,并参与了集体抢劫活动。他被发现并判了5年监禁,该图片表现他感到非常羞耻,自己因给母亲造成的伤害而担心,担心的程度超过了对自己要进监狱的担心。 这孩子(故事还在继续)因为表现好而出狱了,可他母亲已经去世,他堕入爱河,但又回到了犯罪行列,最后他又进了监狱。当他出狱的时候已成了一位老人,他的余生在忏悔和潦倒中度过。
22
图例:精神病患者画的树
23
图例:正常人画的树
26
第四单元 纠正错误的测验观 错误的测验观 测验万能论 测验无用论 正确的测验观 心理测验是重要的心理学研究方法之一,是决策的辅助工具
第四单元 纠正错误的测验观 错误的测验观 测验万能论 测验无用论 正确的测验观 心理测验是重要的心理学研究方法之一,是决策的辅助工具 心理测验作为研究方法和测量工具尚不完善
27
第五单元 心理测验在心理咨询中的应用 智力测验 WISC 瑞文智力测验 人格测验 EPQ MMPI 16PF 心理评定量表
第五单元 心理测验在心理咨询中的应用 智力测验 WISC 瑞文智力测验 人格测验 EPQ MMPI 16PF 心理评定量表 SCL SAS SDS
28
WAIS-RC各分测验的主要内容 言语部分:六个分测验 知识(I)/领悟(C)/算术(A)/相似性(S)/数字广度(D)/词汇(V)
操作部分:五个分测验 数字符号(DS)/填图(PC)/木块图(BD)/图片排列(PA)/图形拼凑(OA)
29
联合型瑞文测验 功能分类:
30
MMPI-2的10个分量表 分量表 患者基本症状 1.疑病量表 Hs 患者对自己的身体健康过度担忧 2.抑郁症量表 D
患者极度悲观,感觉自己没有价值、没有希望 3.癔症量表 Hy 患者出现身体不适,但找不出任何生理原因 4.心理病态偏离量表Pd 严重者情感淡漠,无视社会规范和道德准则 5.男性化—女性化量表 Mf 传统意义上的高男性化为攻击性强,高女性化为敏感性强 6.妄想症量表 Pa 患者疑心极强,有被害妄想 7.精神衰弱量表 Pt 患者有无法摆脱的忧虑、恐怖症和强迫行为 8.精神分裂症量表 Sc 患者情绪失控,想法及行为古怪、不正常 9.躁狂症量表 Ma 患者情绪亢奋,处于躁狂心境中,行为异常,活动过量 0.社会性内向量表 Si 患者有严重的社会性退缩倾向
31
包括567年自我报告形式的题目。为了精神病临床诊断可做前370个。
题数 明尼苏达多项个性调查表(MMPI) 包括567年自我报告形式的题目。为了精神病临床诊断可做前370个。 适用范围 适用于18-70岁,文化程度在小学毕业以上。 内容 分基础量表、内容量表和附加量表三大类。其中基础量表包括10个临床量表和7个效度量表。
32
32. 假使我手持一支装有子弹的手枪,我必须取出子弹后才能心安: A. 是的. B. 介乎A与C之间. C. 不是的. 33
32.假使我手持一支装有子弹的手枪,我必须取出子弹后才能心安: A.是的. B.介乎A与C之间. C.不是的. 33.朋友们大都认为我是一个说话有风趣的人: A.是的. B.不一定. C.不是的. 34.如果人们知道我的内心世界,他们都会感到惊讶: A.是的. B.不一定. C.不是的. 35.在社交场合中,如果我突然成为众所注意的中心,我会感到局促不安: A.是的. B.介乎A与C之间. C.不是的. 36.我总喜欢参加规模庞大的聚会,舞会或公共集会: A.是的. B.介乎A与C之间. C.不是的. 卡氏16种人格因素测验
33
艾森克人格问卷 EPQ 请先写下您的姓名( )、性别( )、出生日期( )、职业( )、文化程度( )。请您回答下列问题,回答问题时不必过多思考,符合您时在( )内答“是”,不符时答“否”。 22. 你会服用奇异或危险作用的药物吗? 你常有“厌倦”之感吗? 你曾拿过别人的东西吗(那怕一针一线)? 你是否常爱外出? 你是否从伤害你所宠爱的人而感到乐趣? 你常为有罪恶之感所苦恼吗? 你在谈论中是否有时不懂装懂? 你是否宁愿去看书而不愿去多见人? 你有要伤害你的仇人吗? 你觉得自己是一个神经过敏的人吗? 对人有所失礼时你是否经常要表示歉意?
34
90项症状清单 SCL-90 注意:以下列出了有些人可能会有的问题,请仔细阅读每一条,然后根据最近一星期以内下述情况影响你的实际感觉,在测试题的五个选项中选择适合你的选项。 1. 头痛 2. 神经过敏,心中不踏实 3. 头脑中有不必要的想法或字句盘旋 4. 头昏或昏倒 5. 对异性的兴趣减退 6. 对旁人责备求全 7. 感到别人能控制你的思想 8. 责怪别人制造麻烦 9. 忘记性大 10. 担心自己的衣饰整齐及仪态的端正 1 2 3 4 5
35
抑郁自评量表 S D S 1.我觉得闷闷不乐, 情绪低沉 2.我觉得一天之中早晨最好 3.我一阵阵哭出来或觉得想哭 4.我晚上睡眠不好
2.我觉得一天之中早晨最好 3.我一阵阵哭出来或觉得想哭 4.我晚上睡眠不好 5.我吃得跟平常一样多 6.我与异性密切接触时和以往一样感到愉快 7.我发觉我的体重在下降 8.我有便秘的苦恼 9.我心跳比平时快 10.我无缘无故地感到疲乏 11.我的头脑跟平常一样清楚 12.我觉得经常做的事情并没有困难 13.我觉得不安而平静不下来 14.我对将来抱有希望 15.我比平常容易生气激动 16.我觉得作出决定是容易的 17.我觉得自己是个有用的人,有人需要我 18.我的生活过得很有意思 19.我认为我死了别人会生活得好些 20.平常感兴趣的事我仍然照样感兴趣 抑郁自评量表 S D S
36
焦虑自评量表 S A S 1.我感到比往常更加神经过敏和焦虑 2.我无缘无故感到担心 3.我容易心烦意乱或感到恐慌
2.我无缘无故感到担心 3.我容易心烦意乱或感到恐慌 4.我感到我的身体好象被分成几块,支离破碎 5.我感到事事都很顺利,不会有倒霉的事情发生 6.我的四肢抖动和震颤 7.我因头痛、颈痛和背痛而烦恼 8.我感到无力且容易疲劳 9.我感到很平静,能安静坐下来 10.我感到我的心跳较快 11.我因阵阵的眩晕而不舒服 12.我有阵阵要昏倒的感觉 13.我呼吸时进气和出气都不费力 14.我的手指和胸趾感到麻木和刺痛 15.我因胃痛和消化不良而苦恼 16.我必须时常排尿 17.我的手总是温暖而干燥 18.我觉得脸发烧发红 19.我容易入睡,晚上休息很好 20.我做恶梦 焦虑自评量表 S A S
37
第六单元 心理测验的发展史 高尔顿: 测量差异的方法 卡特尔: 论证测验的科学性 比内: 智力量表 发展
第六单元 心理测验的发展史 高尔顿: 测量差异的方法 卡特尔: 论证测验的科学性 比内: 智力量表 发展 操作测验/团体智力测验/能力倾向测验/人格测验
38
第二节 测验的常模 第一单元 常模团体 第二单元 常模的类型 第三单元 常模分数的表示方法
39
思考: 如何评价A的考试成绩? 学生 语文 数学 外语 A 60 75 85 学生 语文 数学 外语 A 60 75 85 平均分 50
90
40
比较的标准? 我的个体很高。 我的成绩很差。 我更喜欢鲜艳的颜色。 我不喜欢他。 我很快乐。 我的反应速度很快。
41
第一单元 常模团体 常模团体的性质 常模团体的条件
常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以提供比较的基础。 第一单元 常模团体 常模团体的性质 常模团体的条件 群体的构成必须明确界定 常模团体必须是所测群体的代表性样本 样本的大小要适当 标准化样组是一定时空的产物
42
第一单元 常模团体 取样的方法 简单随机抽样 系统抽样 分组抽样 分层抽样 系统抽样 某单位200人,拟抽取50人作为样本,200/50=4,在(1,200)中获得随机数字8,则:8、12、16… …共计50人。 分组抽样 先分组,再各组内随机抽样 简单随机抽样 1.抽签法; 2.随机数字表 分层抽样:按照团体特性分层,再随机抽样
43
随 机 数 字 表
44
思考:将以下概念转化数字化 “学习困难”的学生 “品德优秀奖” “良好的班级氛围” 初一新生“适应困难” 对食堂饭菜的“满意度”
“物美价廉”的商品 “疗效好”的药物
45
原始分数 导出分数 常模分数与常模 在心理测验中,解释分数的参照体系就是常模。 即标准化样本中被试的测验分数,具体而言是测验 分数的分布,平均数和标准差是最为重要的指标。
46
平均分60分(常模),小明50分(原始分数),小张70分(原始分数)
小明-10分(导出分数),小张10分(导出分数) 常模 小明 小张
47
标准差 标准差表示个体距离平均水平的差异程度。 小明比平均分高5分。 说明他高于平均分,但是高出多少? 若标准差S=5,高于84%的人。
48
知识测验例题 (information) 维克斯勒儿童智力量表 谁发现了美洲? 我国的首都在哪里? 儿童节是哪一天?
得分越高,说明兴趣越广泛,好奇心强,长时记忆好。 把该测验放在首位,容易与被试建立关系,不易引起被试的紧张和厌烦。 维克斯勒儿童智力量表
49
1.知识测验 [内容]由29个常识问题构成,包括历史、天文、地理、文学和自然等内容。
[目标]韦克斯勒认为,智商越高的人,兴趣越广泛,好奇心越强,所以获得的知识就越多。故此测验主要测量人的知识广度、一般的学习及接受能力、对材料的记忆及对日常事物的认识能力。 [实施]所有受试均从第5项开始,逐一提问。若第5项或第6项失败,便回答头作第1—4项,连续5项失败(得0分)终止。 [计分]每正确回答一项记1分,个别项目可记0.5分,1—4项免作者补记4分。最高29分。
50
智力等级分布表 智 商 等 级 占人群百分比 130以上 极超常 2.2 120~129 超常 6.7 110~119 高于平常 16.1
智 商 等 级 占人群百分比 130以上 极超常 120~ 超常 110~ 高于平常 90~ 平常 80~ 低于平常 70~ 边界 69以下 智力低下
51
发展常模 发展顺序常模/智力年龄/年级当量 百分位常模 百分等级/百分点/四分位数和十分位数 标准分常模
第二单元 常模的类型 发展常模 发展顺序常模/智力年龄/年级当量 百分位常模 百分等级/百分点/四分位数和十分位数 标准分常模
52
标准无处不在 提问:我儿子快满28个月了,平常不太爱吃饭,零食吃的也不多。目前各项指标为:头围47cm,身高85cm,体重10.5kg,比一些书刊杂志上所列的最低标准还要低。请问这些指标在正常范围之内吗?正常范围是多少?怎样才能赶上同龄儿童?另外,几个月前检查发现他缺钙、肋骨外翻。请问现在还能补钙吗?晚不晚? 回答:海军总医院儿科刘华主治医师认为,正常2岁儿童(或28个月)的各项指标为:头围48cm,身高90.8cm,体重13.3kg。您的儿子比正常范围稍低一点,但也没有太大问题,后天调整好也是可以的。每日三餐饮食一定要注意保证充足的营养。另外,现在还可以补钙。一般新生儿童6个月就应该开始补钙,您儿子2岁补钙还不算太晚。建议您最好带孩子去医院全面检查一下。
53
年龄 体重(千克) 身高(厘米) 心智发育 初生 2. 7~3. 6 47. 7~52. 0 伏卧抬头,对声音有反应 1月 3. 4~4
年龄 体重(千克) 身高(厘米) 心智发育 初生 2.7~3.6 47.7~52.0 伏卧抬头,对声音有反应 1月 3.4~4.5 51.2~55.8 伏卧抬头45°,能注意父母面部 6月 6.3~8.1 63.3~68.6 坐不需支持,听声转头,自喂饼干,握住玩具不被拿走,怕羞,认出陌生人,能递交积木 12月 8.5~10.6 71.5~77.1 独立行走,有意识叫爸爸、妈妈,用杯喝水,能辨别家人的称谓和家庭环境中熟悉的物体 2岁 10.6~13.2 83.3~89.8 两脚并跳,穿不系带的鞋,区别大小,能识2种颜色,能识简单形状 3岁 12.6~16.1 90.2~98.1 能从高处往下跳,能双脚交替上楼,会扣纽扣,会折纸,会涂糨糊粘贴,懂饥、累、冷,会用筷,能一页页翻书
54
智商及其意义 发展顺序常模/智力年龄/年级当量 百分位常模 百分等级/百分点/四分位数和十分位数 标准分常模
第二单元 常模的类型 智商及其意义 发展顺序常模/智力年龄/年级当量 百分位常模 百分等级/百分点/四分位数和十分位数 标准分常模
55
假如某心理测验分数的=50,S=5,甲、乙两人该心理测验分数分别为45、55则
56
假如语文成绩平均分为140分,标准差为14分;数学成绩的平均分为170分,标准差为20分,若某生语文成绩为160,数学成绩为180,则
计算结果表明,语文成绩高于平均数1.43个标准差,而语文成绩只高于平均成绩0.50个标准差。因此,尽管从原始分数数值上看数学分数更高,但实际上,该生的语文成绩更好。
57
智商及其意义 比率智商 斯坦福—比纳量表首次采用智商来表示被试智力的相对差异,称为比率智商,其计算公式为:
其中,MA表示年龄或心理年龄,CA表示实际年龄。 比率智商可以比较不同年龄被试智力水平的高低。但是也存在明显的缺点:首先,它不适用于年龄较大的被试,因为心理年龄不会随着实际年龄的增大而无限增大。其次,智力的发展就不同的人、在不同时期来说,其发展速度并不相同。一般来说,智力随着年龄的增长呈型曲线发展,其增长速度是先快后慢的。
58
离差智商 韦克斯勒采用的是一个被试的智力测验成绩与同他年龄组被试的平均成绩相比较,并以该组被试成绩的标准差为单位时的离均差,即一个在该年龄组中的相对位置分数。具体说就是: 这里,平均数是100,标准差是15。 实质上就是Z分数
59
人类智商的理论分配
60
第三单元 常模分数的表示方法 转换表法 剖面图法 (见参考书第五章/第一节/第三单元)
61
第三节 测验的信度 第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素
第三节 测验的信度 第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素
62
若某人间隔一周两次回答下列问题,哪类题型的结果更一致?
选择题 精神分析的代表人物是( ) A.弗洛伊德 B.斯金纳 C.艾利斯D.马斯洛 判断题 精神分析的代表人物是弗洛伊德( ) 填空题 精神分析的代表人物是──────────────。
63
真分数 测量工具在测量没有误差时,所得到的纯正值。 反映被试心理特质真正水平的数值。 操作性定义: 经过无数次测量所得到的平均值。
心理测量的误差 真分数 测量工具在测量没有误差时,所得到的纯正值。 反映被试心理特质真正水平的数值。 操作性定义: 经过无数次测量所得到的平均值。 观测分数 实际测量所得到的分数。
64
CTT 数学模型 X=T+E X =观测分数; T=真分数 E=测量误差
真分数与观测分数的关系 CTT 数学模型 X=T+E X =观测分数; T=真分数 E=测量误差
65
平行测验 → 被试团体 S2X = S2T + S2E
66
误差的性质 测量误差是由与测量目的无关的变量导致的。 测量误差表现为(测验结果)不准确和不稳定。
误差 ——任何测量结果都有误差! 误差的性质 测量误差是由与测量目的无关的变量导致的。 测量误差表现为(测验结果)不准确和不稳定。
67
A B C
68
误差的种类 随机误差:偶然性→不一致(稳定性)→不准确 系统误差:稳定性 → 不准确
69
SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2
70
量表:信度和效度 受测者:能否真实地表达自己 测量过程
误差的来源 量表:信度和效度 受测者:能否真实地表达自己 测量过程
71
第一单元 信度的概念 信度 稳定性 \ 可靠性 \ 一致性
72
第二单元 信度评估的方法 重测信度 复本信度 分半信度 同质性信度 评分者信度
73
一、重测信度 (Test-Retest Reliability)
定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。 实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability)
74
形式:施测—适当时间—再施测 适用条件: 所测量的心理特质必须是稳定的 遗忘与练习的效果相同 在两次施测期间,被试的学习效果没有差别
75
时间间隔的把握 间隔时间越长,稳定性系数越低。 适宜时间间隔依照测验目的、性质及被试特点而定。 年幼儿童,间隔要小;年长群体,间隔可大。
智力测验的间隔不能太短,成就测验的间隔不能太长。
76
一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)
时间间隔的把握 一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)
77
重测信度的适用范围 推理测验,创造力测验,被试一旦掌握解决问题的原则,重测时会发生学习效应。 知识测验,情绪测验等也不适合。
感觉运动测验、人格测验、智力测验、兴趣测验等适合重测信度。
78
备注:报告时间间隔,被试经历(教 育培训、心理治疗、其他学习)
重测信度的优缺点 及报告备注 备注:报告时间间隔,被试经历(教 育培训、心理治疗、其他学习) 优点:能够提供被有关测验结果是否随时间而变异的资料,可作为将来行为的预测依据。 缺点:容易受到练习和记忆的影响。时间间隔必须适度。
79
定义:两个复本施测同一被试群体,求其相关。因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。
二、复本信度 (Alternate-form raliability) 定义:两个复本施测同一被试群体,求其相关。因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。
80
等值性系数 (Coefficient of Equivalence) 同时连续施测,反映测验题目变异 形式:复本A—最短时间—复本B
复本信度的施测形式一 等值性系数 (Coefficient of Equivalence) 同时连续施测,反映测验题目变异 形式:复本A—最短时间—复本B
81
复本信度的施测形式二 稳定性与等值性系数(再测复本信度)(Coefficient of Stability and Equivalence): 时间间隔施测,题目变异+重测信度误差 形式:复本A—适当时间—复本B
82
平行测验:测验同一特质,其形式、数量、难度、区分度以及分数分布(平均数和标准差)均一致。
复本信度的适用条件 平行测验:测验同一特质,其形式、数量、难度、区分度以及分数分布(平均数和标准差)均一致。
83
特性分析 优点:原则上讲,任何测验都可以采用复本信度,适用范围较广。 成就测验、特殊能力测验容易制作复本,人格、动机测验不容易制作复本。
采用不同形式的问卷可以减少但不能避免练习与记忆效应,存在迁移效应。
84
缺点:疲劳、失去积极性(等值性系数) 抵消顺序效应:AB,BA
特性分析 缺点:疲劳、失去积极性(等值性系数) 抵消顺序效应:AB,BA
85
定义:在测验没有复本且只能实施一次的 情况下,可将测验项目分成对等的两半, 根据被试在这两半测验中所得的分数计算 相关系数,即得分半信度。
三、分半信度 (Split-Half Reliability) 定义:在测验没有复本且只能实施一次的 情况下,可将测验项目分成对等的两半, 根据被试在这两半测验中所得的分数计算 相关系数,即得分半信度。
86
计算方法 计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。通常情况下采用三种方法:一是完全随机分半;二是采用奇偶题分半法,即将奇数题分成一组,将偶数题分成另外一组(即奇数题的复本),这样可以保证分开的两组测验的基本等值。三是先将测验分成若干内容块,再在每块内容里按奇、偶数分组,再将所有的奇数题和偶数题分别组成两个测验。这是应用最广泛的一种分半方法。
87
计算方法 为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。 由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用斯皮尔曼-布朗(Spearman-Brown)公式对其信度值加以校正,但必须满足两半测验变异数相等的条件,否则可采用弗朗那根公式和卢仑公式。 rxx=2rhh/(1+rhh)
88
适用条件 若只能实测一次或无复本时,可采用分半信度,但分半必须等值,若测验无法分半,或无法保证基本等值时,不宜采用。当试卷中有任选题时不易分半,速度测验不宜分半。
89
四、同质性信度 (Homogeneity Reliability)
同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。 当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。
90
分半信度和同质性信度统称为内部一致性系数。指测验内部所有题目间的一致性程度。
人格、智力测验大多是多维度的,不可求同质性,但可以分为分测验的同质性。
91
五、评分者信度 Scorer Reliability
涉及主观性题目的测验中,评分者的不同会造成测验评分的差异而导致评分误差。评分者信度适合主观评测的题目,在投射测验中,评分者信度是重要的信度指标。
92
评分者信度是指不同评分者之间在测验结果计分上的一致性。当测验结果是由评分者主观评定时,评分者信度尤为重要。例如在体操比赛中,裁判评分的一致性直接影响着运动员的名次,因此一般都要取消两极各一个分数后再求平均成绩。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。
93
第三单元 信度与测验分数的解释 思考 信度的作用——信度系数的应用 当一份人格两表的信度系数,r=0.94时,意味着什么?
第三单元 信度与测验分数的解释 信度的作用——信度系数的应用 思考 当一份人格两表的信度系数,r=0.94时,意味着什么? 当一份智力量表的信度系数,r=0.52时,意味着什么?
94
信度的作用之一 ——信度系数的应用 信度可接受的一般原则:
信度的作用之一 ——信度系数的应用 信度可接受的一般原则: 当rxx<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70 ≤rxx < 0.85时,可用于团体比较;当≥0.85时,才能用于鉴别或预测个人成绩或作为。
95
测验类型 信度 低 中 高 成套成就测验 0.66 0.92 0.98 学术能力测验 0.56 0.90 0.97 成套倾向性测验 0.26 0.88 0.96 客观人格测验 0.46 0.85 兴趣测验 0.42 0.84 0.93 态度量表 0.47 0.79
96
信度是测量过程中所存在的随机误差大小的反映。
信度的作用之二 ——衡量量表的价值 信度是测量过程中所存在的随机误差大小的反映。
97
SE=标准误,SX=标准差,rxx=信度
信度的作用之三 ——了解个人分数的变异程度 信度可以用来解释个人测验分数的意义 SE=标准误,SX=标准差,rxx=信度
98
根据统计学的原理,个体的测验分数有95%的可能性落入如下区域:
(X-1.96SE)≤ T ≤ (X+1.96SE) 由此,可以推知个体分数的变异情况。
99
从一群体中随机取样n个样本,每一个样本都有一个平均数,从这许多样本的均数求得的标准差,称为样本均数标准差,又名标准误。
标准误:平均数的标准差 从一群体中随机取样n个样本,每一个样本都有一个平均数,从这许多样本的均数求得的标准差,称为样本均数标准差,又名标准误。
100
信度的作用之三 ——测验间的比较 信度可以进行不同测验分数的比较 S=相同尺度的标准分数的标准差,rxx、ryy分别为两个测验的信度系数。
101
举例分析 某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商?
102
计算步骤 首先计算出差异分数的标准误; 然后7.5×1.96(0.05显著性水平)=14.7,说明个体两份测验的差异为14.7分以上才能说明差异显著,上述被试的差异为 =8,差异不显著。
103
第四单元 影响信度的因素 一、样本特征 (一)样本团体异质性的影响 (二)样本团体平均能力水平的影响 二、测验长度
第四单元 影响信度的因素 一、样本特征 (一)样本团体异质性的影响 (二)样本团体平均能力水平的影响 二、测验长度 (一)测验越长,测验的内容约有代表性 (二)测验越长,被市的猜测因素影响越小。 (三)测验长度应遵循报酬递减原则。 三、测验难度:难度适中 四、 时间间隔
104
第四节 测验的效度 第一单元 效度的概念 第二单元 效度评估的方法 第三单元 效度的功能 第四单元 影响效度的因素
105
第一单元 效度的概念 效度指测量的正确性。即一个测验能够测量所要测量的东西的程度。
第一单元 效度的概念 效度指测量的正确性。即一个测验能够测量所要测量的东西的程度。 效度所要回答的基本问题是:一个测验测量什么特性?它对所要测量的特性测得有多准? 一个测验虽然能反映出受测者在某个方面的稳定性水平,但不一定反映出所要测量的那个方面的水平。
106
效度的性质 效度具有相对性 效度具有连续性
107
信度高,效度如何? 信度低,效度如何? 效度高,信度如何? 效度低,信度如何?
思考:信度与效度的关系 信度高,效度如何? 信度低,效度如何? 效度高,信度如何? 效度低,信度如何?
108
信度高不一定效度高, 效度高,信度必然高。
1、信度是效度的必要而非充分条件 信度高不一定效度高, 效度高,信度必然高。
110
rXX=r2XT 2、测量效度受信度制约 信度系数=rXX=ST2/SX2 信度指数=rXT=ST/SX 效度系数=rXY=SV 2/SX2
决定系数 =r2XY
111
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。例如,当信度系数=0
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。例如,当信度系数=0.8表示观测分数中有80%的变异是由真分数造成的。 效度决定性系数表示测验正确预测或解释的效标的方差占总方差的比例。例如:测验的效度是0.80,则测验的总差中有64%的方差是测验分数的方差,即测验分数正确预测的比例是64%,其余36%无法做出正确的预测.
112
rXX=0.8 rXY=0.8 信度和效度系数的含义 含义:测验的稳定性程度是80%。 指标:信度系数 含义:测验的有效性程度是64%
指标:决定性系数 (效度系数的平方)
113
第二单元 效度评估的方法 测验效度的证据有三方面的来源: 与内容有关的证据:内容效度 与构念有关的证据:构念效度
第二单元 效度评估的方法 测验效度的证据有三方面的来源: 与内容有关的证据:内容效度 与构念有关的证据:构念效度 与效标有关的证据:效标关联效度 ——美国心理学会标准 (1985)
114
测验题目对所要测量的内容范围的代表性程度。
内容效度 Content Validity 测验题目对所要测量的内容范围的代表性程度。
115
测验的最早的一种用途,就是评定个体在指定的内容领域己经学会了什么东西。各级学校里各门课程的期终考试,以及驾驶执照等各种职业考试,都体现出测验的这种用途。这类测验我们一般也称之为成就测验,而评价成就测验,通常是将测验实际测量的内容与测验所要评定的整个内容领域相加比较,这即为内容效度。
116
内容效度的评估方法 确定测量内容 划分测验目标 确定目标比重 编制双向细目表 随机抽取题目 专家评定 专家判断法
117
内容效度的评估方法 统计分析法 经验推测法 两测验之间相关法(复本法) 处理后的重测法(如再学习) 内容效度比(专家评测)
CVR=2(Ne-N/2)/N (Ne为评价者中满意者人数,n为评价者人数) 统计分析法 经验推测法
118
思考: 什么是表面效度? 表面效度应该高还是低?
表面效度过高,测验目的与隐蔽性; 表面效度过低,被试与测验动机。
119
构 想 效 度 Construct Validity
构想效度就是测验结果能够反映所要测量的某个心理学构念的程度。
120
一、测验内方法 通过研究测验内部构造(测验的内容、对题目的反应、题目间或分测验间的关系)来界定所测量的构想的范围。 1、确定测验的内容效度
2、分析被试对题目的反应 3、考察测验的同质性
121
通过研究几个测验间的相互关系,找出它们的共同点,进而推断出所测的共同特质是什么,便可确定这些测验是否有构想效度。
二、测验间方法 通过研究几个测验间的相互关系,找出它们的共同点,进而推断出所测的共同特质是什么,便可确定这些测验是否有构想效度。
122
测验间方法的相关指标 1、相容效度:同类测验分数之间有较高的相关 2、区分效度:不同类的测验分数间有较低的相关
3、因素效度:用因素分析的方法,找出影响测验分数的共同因素,每个测验在共同因素上的负荷量即每个测验与共同因素的相关,称作测验的因素效度。
123
实证效度 效标关联效度
124
实证效标关联效度的含义 实证效度是以评价结果与效标之间的相关程度表示的效度。它所关注的是评价的结果与特定标准之间关系密切的程度,强调的是效标行为,以及对这些行为预测得如何。对实证效度的评价是以某些事实为依据的,其有效性是通过经验性的取证加以印证的,而且常常借助实验和统计的方法。
125
同时效度 预测效度 实证效度的分类 同时效度和预测效度的逻辑差异不是来源于时间,而是来自测验的目的。同时效度与用来诊断现状的测验有关,预测效度与预测将来结果的测验有关。
126
同时效度 某个学生学习好吗? 某人精神抑郁吗? 预测效度 某个学生会学好吗? 某人会患抑郁症吗? 无论同时效度还是预测效度,基本上都是考虑测验分数与效标间的经验关系,所以统称实证效度或经验效度。但也有人把二者都称作预测效度,并把测验称作预测源。
127
思考:既然同时效度的效标在测验时就可以得到,测验还有什么作用?
同时效度测验的主要作用是用测验分数取代效标资料的搜集。确定同时效度的目的就是看这种取代是否可行。
128
相关法 效度系数本身是一个相关系数,相关系数的平方表示一个变量的变异由另一个变量的变异数决定的百分比。假如效标中有一半的变异数能由预测源分数的变异解释,效度系数必须为0.71。
129
以被试在效标上的表现分组,然后再对两组被试在测验中的成绩用t值进行显著性差异的检验.
区分度 以被试在效标上的表现分组,然后再对两组被试在测验中的成绩用t值进行显著性差异的检验.
130
区分度 缺点:两组间的差异显著性取决于团体规模。团体人数较大时,平均数差异较小也能达到显著,但实际价值很小。
解决方法:两组分布的重叠量,重叠越大,说明组间差异越小。 指标一:每一组内得分超过(或低于)另一组平均数的人次百分比。 指标二:两组分数分布的共同区的百分比。
131
举例 指标一: 以称职组的平均数为指标,看两组中超过这一平均数的人次百分比,比例越低说明差异越大。如称职组的平均数为6.05,不称职组超过此分数的有7人,称职组超过这一分数的有38人,人次比为7/38,重叠的部分为18%,差异很大。
132
举例 指标二: 统计称职组中分数低于不称职组平均数的人数,和不称职组中分数高于称职组平均数的人数.然后两数相加,再除以总人数.如:称职组20人,不称职组20人,不称职组中分数超过称职组平均数的有7人,称职组中分数低于不称职组平均数的有3人,那么有25%的重叠部分。
133
命中率 总命 正命 中率 中率 当测验用来作为取舍的根据时,其有效性的指标就是正确决定的比例。 预测成功且实际成功者 预测成功且实际不成功者
预测不成功且实际成功者 预测不成功且实际不成功者 总命 中率 正命 中率
134
效标成绩 测验预测 失败 成功 ( A ) 失误 ( B ) 命中 ( C ) 命中 ( D ) 失误
135
第三单元 效度的功能 一、预测误差
136
二、预测效标分数
137
三、预测效率指数
138
第四单元 影响效度的因素 一、测验本身的因素 测验材料有代表性 二、测验实施中的干扰因素 题目避免引发误差 三、样本团体的性质
第四单元 影响效度的因素 一、测验本身的因素 二、测验实施中的干扰因素 三、样本团体的性质 四、效标的性质 测验材料有代表性 题目避免引发误差 难度适中 长度适中 题目排列先易后难 主试的影响因素 被试的影响因素 样本团体的异质性 干涉变量
139
第五节 项目分析 第一单元 项目的难度 第二单元 项目的区分度
140
难度(difficulty)指测验题目的难易程度。测题的难度被定义为被试在这个题目上的通过率或得分率。
什么是测验的难度? 难度(difficulty)指测验题目的难易程度。测题的难度被定义为被试在这个题目上的通过率或得分率。
141
难度的计算——通过率 (适用于二分法记分的项目)
P=项目难度 N=全部被试人数 R=答对/通过该项目的人数
142
难度的计算——极端分组法 (适用于二分法记分的项目)
P=项目难度 PH=高分组通过率 PL=低分组通过率
143
难度的计算——极端分组法 (适用于二分法记分的项目)
P=项目难度 RH=高分组通过人数 RL=低分组通过人数 N=各组人数
144
举 例 人数 通过人数 通过率 高分组 30 21 0.7 低分组 6 0.2
145
难度的计算 (适用于非二分法记分的项目)
146
CP=校正后的难度 P=原难度值 K=选项数目
难度的计算——校正公式 CP=校正后的难度 P=原难度值 K=选项数目
147
测验难度影响测验分数的分布形态 正偏态:难度偏大,得分偏低 负偏态:难度偏小,得分偏高 正态:难度适中,得分适中
难度对测验的影响 测验难度影响测验分数的分布形态 正偏态:难度偏大,得分偏低 负偏态:难度偏小,得分偏高 正态:难度适中,得分适中
149
测验难度影响测验分数的离散程度 正态:方差较大,信度较高 偏态:方差较小,信度较低
难度对测验的影响 测验难度影响测验分数的离散程度 正态:方差较大,信度较高 偏态:方差较小,信度较低
150
什么是测验的区分度? 区分度(Item Discrimination),又称项目的鉴别力,是指测验项目对被试的区分程度或鉴别能力。即,项目得分的高低与被试实际能力或特质水平高低的一致性程度。
151
区分度:取值范围在-1到1之间 积极区分:0<D≦ 1 消极区分:-1 ≦ D<0 零区分:D=0
区分度的取值范围 区分度:取值范围在-1到1之间 积极区分:0<D≦ 1 消极区分:-1 ≦ D<0 零区分:D=0
152
项目特征曲线 下图四条曲线描述了效标分数不同的被试在四个项目上的通过率。 思考:各条曲线的区分度如何?
154
项目A效度最低,因为各种能力水平的受测者在这个项目上都有几乎相同比例的人通过;项目B的通过率随着效标分数缓慢增长,说明该题目具有一定的区分能力;项目C的通过率在效标分数的低端很低,高端很高,说明该项目能将不同水平的被试有效区分。 项目D的通过率与效标分数成负相关,这是特殊情况,说明题目出得有问题或定错了答案。
155
第六节 测验编制的一般程序 第一单元 测验的目标分析 第二单元 测题的编写 第三单元 测验的编排和组织
156
测验的对象 即测验所要测的人或者说测验编成后要施用于何种群体。 测验的用途 显示性测验(样本测验/标记测验) 预测性测验
第一单元 测验的目标分析 测验的对象 即测验所要测的人或者说测验编成后要施用于何种群体。 测验的用途 显示性测验(样本测验/标记测验) 预测性测验
157
第一单元 测验的目标分析 测验的目标 即所编测验用来测量的是人们的什么心理特质。 1)工作分析 确定预测行为 / 确定衡量标准
第一单元 测验的目标分析 测验的目标 即所编测验用来测量的是人们的什么心理特质。 1)工作分析 确定预测行为 / 确定衡量标准 2)对特定概念下定义 3)确定测验的具体内容
158
验证测验内容效度的程序 确定测量内容 划分测验目标 确定目标比重 编制双向细目表 随机抽取题目 专家评定
159
比如考查某一门学科测验是否有效度,就要根据教材和教学大纲列出这门课程的全部知识点。包括每一章、每一节的知识点数。
1、确定所要测量的全部内容范围。 比如考查某一门学科测验是否有效度,就要根据教材和教学大纲列出这门课程的全部知识点。包括每一章、每一节的知识点数。
160
2、根据教育目标的要求,将测验目的具体划分为不同层次的测验目标。
教育测验目标一般采用美国教育心理学家布鲁姆提出的学习水平分类系统,包括从简单到复杂、从具体到抽象的六个类别:识记,指对知识的简单回忆;了解,指理解的最低阶段;应用,指在特殊情况下使用概念和原则;分析,指区别和了解事物的内部联系;综合,指把思想重新整合为一种产生新的结构的思想;评价,指根据内容的证据或外部的标准作出判断。
161
3、依据教育者对学生的不同要求,确定每一层次测验目标在整个测验中所占的比重。
162
4、根据每一章节内容的多少和每一层次测验目标在测验中的比重,及预定的测验长度,编制测验双向细目表。双向细目表的每一小格中的数字即为属于某一测验目标和教学内容的测题数量。
163
3 4 6 2 20 5 8 30 1 10 15 17 28 18 12 100 知识 理解 应用 分析 综合 评价 合计 第一章 第二章
第三章 5 8 30 第四章 第五章 1 10 15 17 28 18 12 100
164
5、确定了每一小格中的测题数量后,再从相应部分内容中按比例随机抽取测验题目。在选择测题时还要参考难度,测验时间等方面的信息。对题目作适当调配。
165
6、请本专业的专家作测题的代表性,测题对测验目的的适合性进行分析。并作必要的修改,直到多数专家对测验的内容效度感到满意为止。
166
第二单元 测题的编写 搜集资料 已出版的标准测验 理论和专家的经验 临床观察和记录 命题的一般原则 内容 / 文字 / 理解 / 社会敏感性
167
(表述不清)下列倾向于精神分析的心理学家是( ?)
第二单元 测题的编写 测题的编制要领——选择题 (表述不清)下列倾向于精神分析的心理学家是( ?) A.荣格 B.马斯洛 C.华生 D.佛洛伊德 下列提出集体无意识概念的是( A ) 下列首先提出潜意识概念的是( D )
168
(表述无根据)心理问题的根源是人们的不合理信念( ?) 根据理性情绪疗法的观点,心理问题的根源是人们的不合理信念
第二单元 测题的编写 测题的编制要领——是非题 (表述无根据)心理问题的根源是人们的不合理信念( ?) 根据理性情绪疗法的观点,心理问题的根源是人们的不合理信念
169
(表述繁琐 )精神分析开创者弗洛伊德认为人格是由三部分构成,即本我、自我和_______ 弗洛伊德认为人格由本我、自我和_______构成。
第二单元 测题的编写 测题的编制要领——填充题 (范围过大 )华生是_______ 华生是_______学派的代表人物。 (表述繁琐 )精神分析开创者弗洛伊德认为人格是由三部分构成,即本我、自我和_______ 弗洛伊德认为人格由本我、自我和_______构成。
170
抑郁症是情绪持续低落、人际交往减少的现象。 持续是多久?低落到什么程度?人际交往减少如何衡量?
第二单元 测题的编写 测题的编制要领——操作题 (标准不明确 )学习好的学生 考试成绩在90分以上的学生 抑郁症是情绪持续低落、人际交往减少的现象。 持续是多久?低落到什么程度?人际交往减少如何衡量?
171
儿童智力筛查测验 本测验适用于7—15岁儿童 说出下列图形
172
图片填充 小拇指 指甲 缺齿 时刻 嘴 胡须
173
分辨能力 你认识这几种颜色吗?(出示不同颜色的纸) 一年四季叫什么? 你家里有几个人? 你有几个手指? 一星期有几天?
174
学讲主试者言语 我们在晚上睡觉。 我有两个洋娃娃,一个是红的,一个是绿的。 爸爸早上七点钟到厂里上班。 那个正在唱歌的孩子是小强的弟弟。
妹妹有两个洋娃娃,弟弟只有一个玩具汽车。
175
学 龄 前 儿 童 50 项 智 能 筛 查 量 表 请小儿回答下列问题(按要求执行) 1指给我看,你的眼睛在哪儿?
2指给我看,你的耳朵在哪儿? 3指给我看,你的颈项在哪儿? 4告诉我,你叫什么名字? 5你的手指在哪? 6请把衣服上的扣子扣好。 7有一双鞋(鞋尖对着小儿)你穿穿看。 8请把裤子重新穿一下。 9指给我看,你的眉毛在哪儿? 10请你学我样,倒退走路(2米) 11你并住双 足,往前跳一下(20厘米)。 12你今年几岁(虚岁和实岁都可)? 13你自己会穿上衣服吗?穿给我看看。
176
第三单元 测验的编排和组织 合成测验 选择试题形式 考虑因素:测验目的和材料性质 / 施测对象特点 / 其他实际因素 审定题目
第三单元 测验的编排和组织 合成测验 选择试题形式 考虑因素:测验目的和材料性质 / 施测对象特点 / 其他实际因素 审定题目 考虑因素:符合编制计划 / 备选题目数量 / 难度 / 指导说明 测题编排 考虑因素:从易到难 / 同类组合 / 题目类型 排列方式:并列直进式 / 混合螺旋式
177
第三单元 测验的编排和组织 预测与项目分析 1. 预测
第三单元 测验的编排和组织 预测与项目分析 1. 预测 预测的目的在于获得被试对项目如何反应的资料。预测时要注意:被试对象应取自将来正式测验准备要测察的群体;样本应充分具有代表性,一般用分层随机抽样办法来选取。预测实施的情境与过程,应力求跟正式测验相同;预测的时限可以适当延长,让被试都能将题目做完,从而能获得较充分的反应资料。在预测过程中,要随时记录被试的反应状况。 2. 项目分析 包括质的分析和量的分析两方面:一是要从内容上检查取样的适当性,二是要对预测的数据结果进行统计分析。
178
第三单元 测验的编排和组织 信度和效度考察 1. 信度 2. 效度 常模制订 1. 确定有关的测试团体,并从中抽取有代表性的被试样组。
第三单元 测验的编排和组织 信度和效度考察 1. 信度 2. 效度 常模制订 1. 确定有关的测试团体,并从中抽取有代表性的被试样组。 2. 把原始分数转化为某种形式的导出分数,从而得到常模样组在该测验上的普遍水平或水平分数状况。
179
第三单元 测验的编排和组织 编写指导手册 1. 测验的目的和功能 2. 测验编制的理论依据 3.实施测验的说明 4.计分规则 5.常模
第三单元 测验的编排和组织 编写指导手册 1. 测验的目的和功能 2. 测验编制的理论依据 3.实施测验的说明 4.计分规则 5.常模 6.测验的质量报告
180
第七节 心理测验的使用 第一单元 主试的资格 第二单元 测验的选择 第三单元 测验前的准备及注意事项 第四单元 测验实施的程序及要素
第七节 心理测验的使用 第一单元 主试的资格 第二单元 测验的选择 第三单元 测验前的准备及注意事项 第四单元 测验实施的程序及要素 第五单元 被试误差及控制方法 第六单元 测验的评分 第七单元 测验结果的报告
181
第一单元 主试的资格 主试的资格 测验的主持和实施者在心理测量中被称为主试。 (一)心理测验的理论知识 (二)心理测验的专业技能
第一单元 主试的资格 主试的资格 测验的主持和实施者在心理测量中被称为主试。 (一)心理测验的理论知识 (二)心理测验的专业技能 (三)测验工作者的职业道德 心理测验工作者职业道德表现之一是对测验的保密,包括对测验材料和测验的结果和分数的保密。
182
第二单元 测验的选择 测验的选择 (一)根据测验目的来选择测验 (二)根据被试的情况来选择测验 (三)根据测验的质量来选择测验
183
第三单元 测验前的准备及注意事项 测验的准备 (一)预告测验 (二)准备好测验材料 (三)熟悉测验的具体程序 (四)确保满意合适的测验情境
第三单元 测验前的准备及注意事项 测验的准备 (一)预告测验 (二)准备好测验材料 (三)熟悉测验的具体程序 (四)确保满意合适的测验情境 (五)协助被试做好准备:包括时间选择、生理准备和心理准备。
184
第三单元 测验前的准备及注意事项 测验中主试的职责
第三单元 测验前的准备及注意事项 测验中主试的职责 在心理测验实施过程中,主试应明了自己的职责:遵从指导语;测验前不要讲无关的话;主试在测验时应集中注意,认真观察被试的所有反应行为;在任何情况下主试都不能对被试的回答有所暗示;在测验中也可适当强化被试的行为,以此鼓励被试继续集中注意力在测验上;鼓励被试回答;对特殊问题有所准备;与被试建立良好的协调合作关系。
185
第三单元 测验前的准备及注意事项 测验中主试的职责
第三单元 测验前的准备及注意事项 测验中主试的职责 在心理测验实施过程中,主试应明了自己的职责:遵从指导语;测验前不要讲无关的话;主试在测验时应集中注意,认真观察被试的所有反应行为;在任何情况下主试都不能对被试的回答有所暗示;在测验中也可适当强化被试的行为,以此鼓励被试继续集中注意力在测验上;鼓励被试回答;对特殊问题有所准备;与被试建立良好的协调合作关系。
186
第四单元 测验实施的程序及要素 (一)指导语和时限 (二)作记录:要注意一是记录要隐蔽,二是记录要忠实。 (三)如何对待被试的要求
第四单元 测验实施的程序及要素 (一)指导语和时限 指导语包括针对被试和主试的两部分。针对主试的指导语通常单独印在另一个纸上,对被试的指导语一般印在测验的开头部分,由被试自己阅读或主试统一宣读。时间限制也是测验规范化的一项重要内容。 (二)作记录:要注意一是记录要隐蔽,二是记录要忠实。 (三)如何对待被试的要求 1. 如果被试没有听清或听懂项目而要求重复时,一般予以同意;但对测记忆力的项目则不允许重复,这应该在测验前就向被试交代清楚。 2. 被试要求修改答案一般也允许;应该在保留第一次回答的旁边记下第二次的答案。如果手册中规定只记第一次时间的反应,则不允许改正。
187
第五单元 被试误差及控制方法 测验技巧 练习效应 应试动机 测验焦虑
第五单元 被试误差及控制方法 测验技巧 练习效应 应试动机 测验焦虑 反应定势:又称为反应的方式或反应风格,是指独立于测验内容的反应倾向;即由于每个人回答问题习惯的不同而使有相同能力的被试获得不同的分数。定势的产生既有心理原因,也有生理原因。 “速度—准确”反映定势 肯定(否定)定势 偏好特殊位置的反映定势 猜测的反映定势 偏好较长选项的反映定势
188
第六单元 测验的评分 (一)原始分数的计算 (二)原始分数的转换
第六单元 测验的评分 (一)原始分数的计算 所谓原始分数就是根据被试的实际作答,按测验的评分程序与标准,对每个测验项目及整个测验上所作反应评出的分数;在学业成绩测验中常称为“卷面分”,在心理测量中常称“粗分”。 (二)原始分数的转换 在心理测量中,原始分数本身没有多大意义,因为它的单位可能不等,参照点也可能不明确。测验编制者通常会提供一个常模,它的主要功能是把原始分数转换成量表分数。
189
第七单元 测验结果的报告 如何看待测验分数的意义 1. 主试应充分了解测验的性质与功能。
第七单元 测验结果的报告 如何看待测验分数的意义 1. 主试应充分了解测验的性质与功能。 2. 对导致测验结果的原因,解释应慎重,谨防片面极端。 3. 必须充分考察测验的效度和局限。 4. 解释分数应参考其他相关资料。 5. 对测验分数应以“一个区间分数”来对待,不应以“特定的数值”来解释。 6. 对来自不同测验的分数不能直接比较。
190
第七单元 测验结果的报告 如何看待测验分数的意义 1. 主试应充分了解测验的性质与功能。
第七单元 测验结果的报告 如何看待测验分数的意义 1. 主试应充分了解测验的性质与功能。 2. 对导致测验结果的原因,解释应慎重,谨防片面极端。 3. 必须充分考察测验的效度和局限。 4. 解释分数应参考其他相关资料。 5. 对测验分数应以“一个区间分数”来对待,不应以“特定的数值”来解释。 6. 对来自不同测验的分数不能直接比较。
191
第七单元 测验结果的报告 如何向被试和有关人员报告测验分数 1.使用当事人所理解的语言。 2.保证当事人知道这个测验测量或预测了什么。
第七单元 测验结果的报告 如何向被试和有关人员报告测验分数 1.使用当事人所理解的语言。 2.保证当事人知道这个测验测量或预测了什么。 3.如果分数以常模为参照,要使被试知道和什么团体进行比较。 4.要使当事人认识到分数只是一个估计。 5.要使被试知道分数将被如何运用。 6.要考虑测验分数将给被试带来什么心理影响。 7.测验结果应向无关人员保密。 8.对低分者的解释应小心谨慎。 9.报告分数时,应了解被试的心理感受,并采取适当的措施加以引导
Similar presentations