第三章 测量信度 第一节 信度概述 一、什么是信度? 信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。 操作定义:

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

质数和合数 富县北教场小学 潘小娟 1 、什么叫因数? 2 、自然数分几类? 奇数和偶数. 3 、自然数还有一种新的分类方法, 就是按一个数的因数个数来分. 4 、写出 1—20 的因数。 前置性作业.
质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.
因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
专 业:心理学、教育学 主 讲:章 永 单 位:教科院 一、客观性测验题目的编制 1. 客观性测验题目的常见类型 1. 客观性测验题目的常见类型 选择题 是非题 匹配题 填空题 简答题 选择题 是非题 匹配题 填空题 简答题 2. 客观性测验题目的特点 2. 客观性测验题目的特点.
2 、 5 的倍数的特征. 目标 重点 难点 关键词 2 、 5 的倍数的特征 1 、发现 2 和 5 的倍数的特征。 2 、知道什么是奇数和偶数。 能判断一个数是不是 2 或 5 的倍数。 能判断一个数是奇数还是偶数。 奇数、偶数。 返回返回 目录目录 前进前进.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
问卷调查的规范与技术 问卷调查的规范与技术.
心理测量学 心理测量学知识.
第四章 测量效度 第一节 效度概述 一、什么是效度 效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
证券投资技术分析.
第二章 研究设计与评价.
第八章 信度与效度分析 2017/3/16.
第七章 研究工具性能的测定 泰山医学院护理学院 李 蕾 2017/3/16.
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
《高等数学》(理学) 常数项级数的概念 袁安锋
四种命题 2 垂直.
色 弱 與 色 盲.
第六章 测量的效度 第一节 效度概述 第二节 内容效度 第三节 构想效度 第四节 效标关联效度 第五节 影响测验效度的因素.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
Online job scheduling in Distributed Machine Learning Clusters
第十章 方差分析.
动态规划(Dynamic Programming)
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
人教版五年级数学上册第四单元 解方程(一) 马郎小学 陈伟.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
§2-1现实生活中的问题与函数的概念 例2.钟表问题
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
北师大版五年级数学下册 分数乘法(一).
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
人教版小学数学三年级上册 认识几分之几 gjq.
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
概率论与数理统计B.
焦作市中等职业学校学生素质能力大赛 数学基础素养比赛(二) 竞技作答.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第八章 服務部門成本分攤.
相关关系 主讲人:孟迎芳.
平行四边形的面积.
异分母分数加、减法.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
找 因 数.
一元一次方程的解法(-).
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

第三章 测量信度 第一节 信度概述 一、什么是信度? 信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。 操作定义: rxx=ST2 / SE2  rXX=ρTX2  rXX=ρXX’ 注意:(1)信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性; (2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。

二、信度系数与信度指数 信度指数:相关系数 信度系数:相关系数的平方 注意: (1)信度系数有多种。 (2)同一种信度系数也会因样本、测查时间不同而有多个。 (3)信度系数只是对测量分数一致性的估计,但并没有指出不一致的原因。 (4)获得较高的信度只是测验有效的必要条件。

三、信度的作用 1.信度是测量过程中所存在的随机误差大小的反映   2.信度可以用来解释个人测验分数的意义 SE=SX√1 - rXX 真分数的置信区间(95%)=X±1.96SE 3.信度可以帮助进行不同测验分数的比较

第二节 信度的估计方法 一、重测信度 1.含义和计算 重测信度(test-retest reliability)是指用同一量表对同一组被试施测两次所得结果的一致性程度。 重测法的模式是:测验A1--适当的时距--测验A2 皮尔逊积差相关系数rA1A2= 2.使用的前提条件 l 所测量的心理特质必须是稳定的; 练习和遗忘的效果基本上相互抵消; 在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。

例:用某量表测验10个学生,得分记为X;为了考察测量结果的可靠性,于15天后用原量表对这10个学生重测一次,得分记为Y(X和Y见下表)。问测量结果是否可靠?

学生 A1 A2 X2 Y2 XY X Y 1 2 3 4 5 6 7 8 9 10 64 100 81 36 49 25 16 72 90 56 20 ΣX=75 ΣY=78 ΣX2=601 ΣY2=658 ΣXY=627

使用重测法计算稳定性系数,要注意下列问题。 1、两个测验之间的时间间隔要适宜。 2、重测法适用于速度测验而不适用于难度测验。 3、应注意提高被试者的积极性、兴趣。

二、复本信度 1.含义和计算 复本信度(Alternate-form reliability)是指两个平行的测验测量同一批被试所得结果的一致性程度。 皮尔逊积差相关系数 等值性系数:两个复本测验是同时连续施测的 稳定等值系数(重测复本信度):两个复本测验是相距一段时间分两次施测的。  复本信度模式是:测验A1-最短的时距-测验B1(备份) 2.使用的前提条件 l  两测验真正平行; l  被试要有条件接受两个测验。

例:已对应试者10人施行过测验A1,接着对这10名应试者施行测验B1,求该测验的信度(分数见表)。

被试 A1 B1 X2 Y2 XY X Y 1 2 3 4 5 6 7 8 9 10 64 100 81 36 49 25 16 32 90 63 54 40 21 18 ΣX=75 ΣY=50 ΣX2=601 ΣY2=306 ΣXY=380

使用复份法计算等值性系数要注意下列几点: 1、复份法的关键在于两个量表必须等值。难度区分度,题型长度。 2、两次测验的时距宜尽可能短促,以避免知识积累,练习效应等因素的影响。 3、由于量表的两个复份在许多方面近似,所以信度系数有稍微偏高的倾向。 4、标准测验一般均有复份,使用复本持慎重的态度。

三、分半信度 1.含义和计算 分半信度(split-half reliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。   校正后的皮尔逊积差相关系数 校正公式:斯皮尔曼-布郎公式 rxx= 2 rhh /(1+ rhh)

例:有一个由100题构成的量表施行于10个高三学生,测验一次后,应试者即毕业离校。现在怎样评价测验结果的信度?

得 分 被 试 奇数题 总分X1 偶数题 总分X2 X12 X22 X1X2 1 2 3 4 5 6 7 8 9 10 38 37 41 40 36 39 35 34 1444 1369 1681 1600 1296 1521 1225 1269 1156 1406 1368 1599 1560 1224 1260 ΣX1=382 ΣX2=374 ΣX12 =14624 ΣX22 =14014 ΣX1X2=14311

常见的分半方法是按测题序号奇偶分半: l  测验题目按某种顺序(如难度)排列; l 如果是随机排列的题目,则必须是所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的); l 如果测验有多个分量表,应在分量表内部排好顺序,再把各分量表的两半组合起来求相关。 使用奇偶分半法一定要注意两个问题: 1、如遇到有牵连的项目或一组解决同一问题时,这些项目应放在同一半,否则将会高估信度的值。 2、当试卷中存在任选题或试卷为速度测验时,不宜采用分半法。

弗朗那根公式: rxx = 2 [ 1 -(Sa2 + Sb2)/ Sx2] 卢仑公式: rxx = 1 - Sd2 / Sx2   2.使用的前提条件 一个测验可以分为对等的两半时; 假定两半等值,也即两半测验分数具有相同的平均数和标准差。

四、同质性信度 1.含义 同质性信度(homogeneity reliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。   2.计算及适用范围 rxx = K / rij [ 1 +(K - 1)rij ]

KR20公式: rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] pi为答对第i题的人数的比例;qi为答错第i题的人数的比例。 K为题目数, Sx2为测验总分的变异。 KR21公式: rxx = [ K /(K - 1)] [1 -(K p q )/ Sx2 ]  

例:有一种包含6个问题的测验,10个应试者得分如下表(答对得1分,答错得0分),试估计应试者反应的一致性程度。

得分 题目 被试 1 2 3 4 5 6 ΣZ 1 2 3 4 5 6 7 8 9 10 1 0 0 0 0 0 1 1 0 0 1 0 0 2 0 0 0 0 1 1 2 1 1 1 0 0 0 3 0 1 0 0 1 1 3 1 1 1 1 0 0 4 1 1 0 1 1 1 5 1 1 1 1 1 1 6 ΣX= p q pq 8 7 5 5 4 4 0.8 0.7 0.5 0.5 0.4 0.4 0.2 0.3 0.5 0.5 0.6 0.6 0.16 0.21 0.25 0.25 0.24 0.24 Σpq=1.35

克龙巴赫α系数: α = [ K /(K - 1)] [1 -(ΣSi2)/ Sx2 ]   菏伊特信度: rxx = 1 - MS人×题/ MS人 一般用于预测的测验或学绩测验可不考虑同质性。而验证理论构想时必须考虑同质性。因此,同质性不但与信度有关,还与效度有关。

例:有一种包含6个论文式题目的测验,对5个应试者施行,得分列入下表,试求该测验的信度.

被试 题号 A B C D E Σ Si2 1 2 3 4 5 6 11 8 11 11 48 3.04 6 9 7 8 9 39 1.36 6 10 6 8 9 39 2.56 8 11 6 8 3 36 6.96 7 11 8 11 11 48 3.04 Σ 40 62 41 54 52

五、评分者信度 1.含义和计算 评分者信度(scorer reliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。   2人时:相关系数 多人时:肯德尔和谐系数 W=12 [ΣR i2 -(ΣR i)2 / N] / [K2(N3 -N)] (K=3 ~ 20;N=3 ~ 7时,查W表检验) R I为第i个被试被评的水平等级之和

例:甲乙两位教师评阅10份试卷,他们对每一试卷各自所评的分数和等级列入下表,问这两位教师评分的一致性如何?

试卷 得分 名次 等级之差D D2 A B C D E F G H I J 94 90 86 72 70 68 66 64 61 93 92 甲评分 乙评分 甲名次 乙名次 A B C D E F G H I J 94 90 86 72 70 68 66 64 61 93 92 82 76 65 60 1 2 3.5 5 6 7 8 9 10 2.5 4 5.5 -0.5 -3.5 0.5 -2 0.25 12.25 6.25

例:六位教师各自评阅相同的五篇作文,每位教师给每一篇作文都评了等级(共5等)并列入下表。问六位教师所评的等级的一致性是大还是小?

评分者K26 试卷编号(N=5) 1 2 3 4 5 赵 钱 孙 李 周 武 Ri 3 5 2 4 1 3 4 1 5 2 3 5 1 4 2 18 29 10 25 8

若N>7,用χ2检验。 χ2 = K(N - 1)W,df = N - 1   若评分中有相同等级时,需校正: W=12[ΣR i2 -(ΣR i)2 / N] / [K2(N2 -N)- KΣΣ(n3 - n)/12]

各种信度系数相应误差变异的来源 信度 误差变异来源 重测信度 时间取样 复本信度(连续施测) 内容取样 复本信度(间隔施测) 时间与内容取样 分半信度 同质性信度 内容取样和内容的异质性 评分者信度 评分者间的差异

第三节 提高测量信度的方法 一、影响测量信度的主要因素 (一)被试方面 被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。 被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。   (二)主试方面  指导语、态度、期望等 (三)施测情境

(四)测量工具 测验长度:测验越长,信度越高。 测验难度:过难或过易都会使个体间得分差异减小,降低信度。  测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。 (五)两次施测的间隔时间 间隔时间越短,信度越高; 间隔时间越长,信度越低。

二、提高测量信度的常用方法 (一)适当增加测验的长度rtt= 2rx1x2∕(1+rx1x2) rtt =Krxx ∕[1 +(k-1)rxx] (二)使测验中所有试题的难度接近正态分布,并控制在中等水平 (三)努力提高测验试题的区分度 (四)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度 (五)主试者严格执行施测规程,评分者严格按照标准给分,施测场地按测验手册的要求进行布置,减少无关因素的干扰

例1:如有一种饱含10题的测验,其信度系数为0.30若把测验增加原长度的3倍时,信度为多少。 例2:原测验共10题,其信度系数为rⅹⅹ=0.30如果把信度系数提高到0.954,需要把测验延长几倍?增加多少题?

三、信度的特殊问题 1.速度测验的信度问题  因为速度测验的题目难度都很低,所以不能用奇偶分半求分半信度;可以将测验分两半来施测。 因为几乎不可能把题目做完,所以同质性信度不适用。 可以用重测信度和复本信度。 2.标准参照测验的信度问题  总体越同质,相关系数越低。 用复本,通过人数的百分比差别越小,信度越高。

四、信度好坏的判断标准 标准化能力或学绩测验:>0.90 人格测验:>0.80 教师自编学绩测验:>0.60 五、测验使用时的信度标准 一般来说,当信度<0.70,测验不能用于对个人作出评价与预测,而且不能作团体间比较; 当0.70≤信度<0.85时,可用于团体比较; 当信度≥0.85时,才能用来鉴别或预测个人成绩。