学业评价的理论与实践 江西财经大学 谭光兴 教授、博士生导师.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
2014 年职称英语等级考试 综合类精讲班 主讲:叶老师. 职称英语考试与复习方法 一、职称英语考试 1. 职称英语考试的特点: a 综合英语分为 A B C 级 b 职称英语考试和教材的关系 c 可以借助字典 d 送分( 分) (1) 词汇选项(可能送 3—8 分) (2) 阅读判断.
1 计算机软件考试命题模式 计算机软件考试命题模式 张 淑 平 张 淑 平. 2  命题模式内容  组织管理模式 − 命题机构和人员组成 − 命题程序  试卷组成模式.
数据结构的引入. 通讯录管理 社团机构管理 校园导航管理 通讯录管理 社团机构管理 校园导航管理.
专 业:心理学、教育学 主 讲:章 永 单 位:教科院 一、客观性测验题目的编制 1. 客观性测验题目的常见类型 1. 客观性测验题目的常见类型 选择题 是非题 匹配题 填空题 简答题 选择题 是非题 匹配题 填空题 简答题 2. 客观性测验题目的特点 2. 客观性测验题目的特点.
2 、 5 的倍数的特征. 目标 重点 难点 关键词 2 、 5 的倍数的特征 1 、发现 2 和 5 的倍数的特征。 2 、知道什么是奇数和偶数。 能判断一个数是不是 2 或 5 的倍数。 能判断一个数是奇数还是偶数。 奇数、偶数。 返回返回 目录目录 前进前进.
北师大版四年级数学下册 天平游戏(二).
专题六 语文课程标准修订对“实验稿”作了哪些修改和调整
单项选择题 判断题 陈 琳.
计算机网络教程 任课教师:孙颖楷.
——Windows98与Office2000(第二版) 林卓然编著 中山大学出版社
小四高级华文课程 简要说明会
山东英才学院 SHANDONG YINGCAI UNIVERSITY
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
药物分析 pharmaceutical analysis
C++面试笔试精要 张立伦 讲师的CSDN博客地址
XXXX学院2014年度 本科教学工作总结 2015年1月15日.
课程泛雅 2017/3/15.
证券投资技术分析.
学年第一学期 期末上交材料说明 2015年1月23日.
人教新课标版三年级数学下册 笔算除法.
对 培训者 培训的理解 丁革建
《高等数学》(理学) 常数项级数的概念 袁安锋
关于本门课程.
四种命题 2 垂直.
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
常用逻辑用语复习课 李娟.
《小学教育学》 模块二 小学教育源流 第五单元 小学教育走向的探究成果分享 自主学习指南.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
苏教版(国标本)第六册 习作四 南京市五老村小学   王咏慧.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
《数据结构》课程简介 李武军 南京大学计算机科学与技术系 2016年秋季.
Harvard ManageMentor®
Computer Graphics 计算机图形学基础 张 赐 Mail: CSDN博客地址:
第十章 方差分析.
苏瑞凤 信息技术教育的理论与方法.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
人教版五年级数学上册第四单元 解方程(一) 马郎小学 陈伟.
实用网络营销基础 冯英健 2006年8月6日 首页.
论文答辩PPT模板 答辩学生:橘子皮 指导老师:PPT工作室.
网页设计与制作 —— 学习情境二:网页模板设计
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
更新教学理念,提高教学有效性 感城中心学校 陈利平.
北师大版五年级数学下册 分数乘法(一).
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
评价多元化,学习自主化 —课程多元评价指标的设计
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
TEM8人文知识 ——英语国家概况部分讲解 上外贤达学院 昌兰华.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
试卷质量评价要素分析 按照安徽农业大学本科试卷评价表: 一、试卷(命题)质量(40分) 二、卷面质量(10分) 三、试卷评阅(40分)
我们能够了解数学在现实生活中的用途非常广泛
两位数加两位数(进位) 刘晓玲
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
教师职业道德 主讲:王兰英 课件制作:林彬(湖北教育学院).
第八讲 评价理论在课堂教学中的应用 讲座1:教学评价的含义 陶保平 华东师范大学教育学系.
第十七讲 密码执行(1).
位似.
任课教师:戴开宇 TA:时均帅、谭肖、王安华 程序设计B班 :20-16:50(90分钟)
质量控制(QC)模式 BrookFIELD.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
IT 方法 INTOSAI IT 审计培训.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

学业评价的理论与实践 江西财经大学 谭光兴 教授、博士生导师

几个概念的辨析 教育测量:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。教育测量是为了了解学生的发展,尤其是为评定学习成绩而进行的测量活动,这是教育测量最原始的动机。但是,教育测量并不仅仅是评定学生的学习成绩,还要关注学校的教学效果和学生的发展情况,涉及到学生在德、智、体、美、劳及心理素质等方面的内容。 几个概念的

教育评价(educational evaluation) :对学校教育活动和学生学习效果进行测量(定量方法)、描述(定性方法)和作出判断(价值判断)的过程。 ♫ 因此,教育评价是建立在教育测量和教育观察基础上的,对学校教育教学活动及其效果进行价值判断的过程。 ♫ 这种判断的依据是教育目标及其质量标准。

教育评估(educational assessment):对学校教育进行测量、观察、描述,有时也作出价值判断的过程。 教育评估与教育评价经常混用,但严格来说它们是有区别的,教育评估重点是测量和描述客观事实(重在结果),而教育评价重点是作出价值判断(重在结论)。因此,带有价值判断的教育评估就是教育评价。

教育测量与评价的分类 按在教学中运用的时机分,主要有: ♫ 形成性测量与评价,即为及时获得教学信息反馈而采取的一种教育测量与评价方法。教师在教学过程中需要保持对学生学习情况(学习历程、学习特点、学习困难、学习效果等)的了解,以便及时调整自己的教学策略;学生在学习过程中也需要及时了解自己的学习状况,以便修正自己的学习策略。形成性测量与评价就是为此目的而进行的,一般运用在(单元)教学的过程中。

♫ 诊断性测量与评价,为了帮助某些学习遇到困难的学生找出发生困难的原因而采取的一种教育测量与评价方法。诊断性测量与评价一般是在形成性测量与评价之后实施,即随时给予个别辅导,在辅导中帮助学生改善学习习惯,克服学习困难,提高学习效率。如果一般的辅导起不到改善学生学习效果的作用,那么就需要诊断性测量与评价来找出其原因。所以,它运用在教学过程中遇到需要诊断问题的时候。

♫ 终结性测量与评价,某一课程教学结束以后,要检验该课程教学达到目标的程度和评定学生该课程的学习成绩,这时就要实施终结性教育测量与评价,通常运用在课程教学结束时。 ♫ 按其他方法进行的分类,由于时间关系,不一一加以介绍,有兴趣的老师可以阅读任何一部关于教育测量与评价的著作。

学业评价的定义与作用 什么是学业评价? ♫ 学业评价是教师或教学管理部门通过各种教育测量与评价手段,对学生的学习能力、学习状况和学习效果作出判断或进行评定的过程。 ♫ 学业评价的内容主要是学生的学习方法、学习态度、学习进展,尤其是学习效果,即学习目标的实现情况,学习内容、学习方法的掌握情况以及学习的迁移效果等。

♫学业评价的主要目的是,发现教学过程中的问题,以修正教学策略和学习策略;检验教学目标的达成程度;诊断个别学生学习中的困难与问题;评定学生的学习成绩。 ♫学业评价以教师的评价为主,教学管理部门的评价为辅;学业评价是教师的责任与义务,教师应当自觉地搞好学业评价,教学管理部门有责任做好监督与服务工作。

学业评价对教学起着重要作用,其功能有: ♫测量评定的功能。学业评价的直接目的是客观地评定学生的学习成绩,或是为了给学生在校的行为表现一个评价(或等级)。 ♫事实判断的功能。学业评价过程中需要系统地收集资料,编辑试题,采用各种评价方法,能够客观地判断学生学习的实际状况。

♫价值判断的功能。学业评价的重点是依据教育目标和教学要求,在教育测量和观察的基础上作出价值判断。如果说,事实判断更多的具有写实性,那么,价值判断就更多的具有社会性(或思想倾向性)。 ♫问题诊断的功能。学业评价为了改善教师的教和学生的学,需要发现教学中的问题,就像医生看病一样。这也是学业评价的重要功能之一。

♫激励学生学习动机的功能。一次有效的测试,可以通过以下几方面直接影响学生的学习: (1)为学生提供短期的学习目标; (2)使学生明确学习内容; (3)使学生了解自己学习中存在的问题; (4)提供有关学习进展的反馈信息。

♫帮助学生记忆和促进迁移的功能。学业评价可以引导学生朝着教学目标努力,克服心理障碍,改善学习状态,自然有助于学生的学习记忆和学习迁移。 ♫促进学生自我评价的功能。学业评价使学生了解了自己学习中的问题,同时也了解了自己学习中的优点,清楚了自己在同学中的位子,有利于确定自己的努力方向和调整自己的学习策略。

由于学业评价的功能,我们可以发现学业评价具有以下作用: ♫作为教学的指挥棒,引导教师的教与学生的学。 ♫调动学生的学习积极性,改善学习效果。 ♫甄别学生的学习能力,评定学生的学习成绩。

学业评价的方式与方法 测量知识掌握的程度通常用测验的方法,主要用闭卷笔试的方式; 测量综合能力的强弱通常用综合测试的方法,主要用问题解决的方式; 测量技术能力的高低通常用具体测试的方法,主要用现场操作的方式; 测量语言能力强弱通常采用面试的方法,主要用对话的方式。

学业评价常常采用多种方式进行,课程教学的终结性测量与评价通常采用考试,考试不只是闭卷笔试一种方式,应当根据课程的性质和教学要求或教学目标采用适当的方式,有时可以采用多种方式,最后综合评定成绩。 通常我们总认为学业评价就是期中或期末考试,而且与集中统一笔试等同起来。其实不然。

比如,集中闭卷笔试;集中开卷笔试;单个面试(提问式);小组面试(讨论式);上机考试(知识或技能测试);项目实验(专业基本技能测试);大作业(小论文、小设计、专题综述、综合报告等)。这些都是可以采用的考试形式。 考试的关键是制作试卷,根据不同的考试方式,试卷的内容和形式也应有所区别。

上面提到的项目试验和大作业的中具体考试形式就可以看成是不同形式的试卷。 试卷的制作要讲究科学性、公平性和简洁性。这些是试卷制作的基本技术要求。

学业评价的基本技术要求 学业评价的科学性:科学性是指测评结果能准确地反映被测对象的真实情况,达到测评的目的。测评的科学性要求测评方法、测评手段和测评时机都科学合理。主要体现在试卷的信度、效度、难度和区分度上。

信度:简单的说就是测验结果的可信程度,就是说考察测验结果的稳定性程度。换句话说,就是多次测验之间的一致性程度。 由于测量过程中存在着许多难以控制的因素,每次测量的结果不一定完全相同,存在着随机误差,信度的追求就是为了对随机误差的控制。

但是,教育与心理测量不同于物理测量可以用同一工具反复测量同一个人的同一心理特质,比如,不能在短时间内用同一道数学题去测量同一个人的数学能力。因此,教育测量中常采用以下方法定义信度。

在T与E独立或不相关的条件下, X的方差可以表示成: σX = σт+ σE 设X是测量得到的分数,叫做观察分数;T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数,于是 X = T+E 在T与E独立或不相关的条件下, X的方差可以表示成: σX = σт+ σE

于是信度被定义为: βхх=σт∕σх =1 - σE∕σх 但是,T一般事前并不知道,因此,上式实际只是一个理论定义,无实际操作价值。 为了计算信度,通常采用其它方法。具体计算方法可参考任何一部《教育测量》著作。

效度:简单的说就是测量的有效程度,指的是一个测量(考试)实际能够测出其所要测量的特性(目的)的程度。效度一般反映在测量工具的使用是否得当上。比如,我们想要测量一个学生的写作能力,我们应当给这个学生命一个适当的作文题,在规定的时间内让其独立写出一篇作文。而不能给他先阅读一篇短文再让其写出它的中心思想。

效度的定义如下: 设X是测量得到的分数,叫做观察分数; T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数。我们把T再分解为目标真分数(V)和非目标真分数(I), 于是: X = V+I+E

于是效度被定义为: λхх=σV∕σх =1 - σI∕σх - σE∕σх 同样,这只是一个理论定义,不具有实际操作意义,真正的效度计算要用其他方法。 • 由效度定义可以看出,信度比效度多了一个非目标真分数相关度。可见效度比信度更精细。

一般来说,高效度肯定有高信度,但高信度未必有高效度,而低信度肯定也无高效度。所以,我们的目的是追求高效度,而为此目的必须先追求高信度。 影响信度的因素是一些随机因素,所以,为保证高信度必须尽量控制随机因素的干扰。而为了保证高效度,还要排除非目标因素的影响。

影响学业评价的随机因素通常有: Ⅰ 命题教师的水平与责任; Ⅱ 阅卷教师的水平与责任; Ⅲ 考试的方法与纪律; Ⅳ 阅卷的方法与纪律; Ⅴ 教学管理部门的指导思想。

而影响效度的除了随机因素外还有非目标因素。因此,要提高效度,必须先提高信度,然后要提高对教育或教学目标的理解,尽量排除非目标因素进入学业评价行为中。 那么,怎样才能提高对教育或教学目标的理解呢?下面提几条原则,其余的自己思考。

正确理解党的教育方针和高等教育的教育目的; 正确理解本校的教育目标,即人才培养目标; 正确理解本专业的教育目标,即专业培养目标; 正确理解本课程的教学目标,即了解本课程的教学要求。

难度:顾名思义,难度就是被试完成测试的困难程度。一般来说,太难或太容易的试题都不能很好的测试出被试的水平,尤其不能达到选拔和甄别的目的。难度是一个相对概念,是针对不同的被试来说的。因此,难度必须在对被试充分了解的基础上才能恰当地确定。 难度可分为题目难度和试卷难度,前者是指某道题的难度,后者是指整个试卷的难度。当然,题目的难度直接影响试卷的难度。

难度可用难度系数来衡量,难度系数的计算有多种方法。 Ⅰ 以全体被试得分率为难度系数: (1)试卷的难度系数 P = X / y X为平均实际得分,y为满分。如果得分率低于0.6可认为偏难,如果得分率高于0.9,则可认为偏易。

(2)题目的难度系数 P = X / y 此处的X为被试在该道题目上的平均得分, y为该道题目的满分。如果得分率低于0.5,则可视为偏难,高于0.8,则可视为偏易。

Ⅱ 以全体被试失分率为难度系数: 计算时只要作如下转换即可 Q = 1 – P Ⅲ 以两端组被试得分率的均值为难度系数 P =(PH+PL)/2 其中PH、PL分别为高分组和的低组的得分率 高分组和低分组分别取最高和最低的27%。

区分度:即区分被试能力或水平差异的量度。作为学业评价,我们除了要给每位学生的课程学习给出一个分数外,重要的是要分出好学生和差学生来,这样才能有效地调动学生的学习积极性,也有利于社会选拔人才。因此,这个分数应当客观地反映学生的真实水平,不同的水平必须通过不同的分数加以区分。所以,学业评价的区分度同样十分重要。

区分度与难度密切相关,太难和太易都不具有很好的区分度。区分度一般通过编制不同难度的试题来实现。所以,将试题分成高难度、中等难度、一般难度和低难度的试题,并按适当比例进行搭配是保证合理区分度的关键。 区分度的计算比较复杂,我这里只介绍一种最简单的方法:D = PH - PL 其中PH 、 PL分别为高分组和低分组的得分率。

判断一个考试是否具有合理的难度和合理的区分度的方法是,将全体被试的得分情况进行统计计算,如果全体被试的得分服从正态分布,均值在75分上下,均方差在12分左右,那么这个考试属于较好的考试,否则,其科学性就要受到质疑。

学业评价的公平性:公平性是指在学业评价中任何学生都有同样的机会获得好成绩。 保证学业评价的公平性必须做到以下几点: Ⅰ 教师不能带有偏见,不能随意给某人加分或给某人减分; Ⅱ 教师在命题中应尽量避免试题内容对某些学生有利,而对某些学生不利的情况。

Ⅲ 测试的场地、条件、纪律要求应该相同,不能要求不一。 Ⅳ 阅卷的时候最好是密封阅卷,避免带有感情色彩。 Ⅴ 学业评价应当采用同样的手段,尽量在同一段时间内进行。

学业评价的简洁性:学业评价的手段应当简便,试卷应当清晰整洁,测试要求和题目分数应当标明。这样可以消除一些不确定性因素的影响,提高测试的信度。 要保证学业评价的简洁性,关键是教师要确实负起责任,要对测评内容和手段仔细斟酌。

命题的基本要求 我们作为教师最常用的学业评价方法还是考试,而考试最常用的方式是命题考试,无论是平时测验还是期中或期末考试,我们都要制作试卷,一份试卷就是一系列精心编排的试题。所以,制作试卷的主要过程是编制试题的过程,即命题。 试题的质量直接影响到学业评价的科学性和公平性。

试题可分为:客观性试题和主观性试题。 所谓客观性试题,是指评分时具有标准答案和标准分数的试题,无论谁来评分都会得到相同的或基本相同的结果。客观性试题的题型有选择题、是非题、配合题、填空题和简答题。 主观性试题就是评分时没有标准答案,评分结果因人而常有较大差别的题,题型有论述题、操作题、作文题、分析题等。

各类试题命题时都有一定的要求,下面就其命题原则作一介绍: 选择题的命题原则: Ⅰ题干意义完整并能表达一个确定的问题; Ⅱ题干简明;

Ⅲ题干不要滥用否定结构,要尽可能用正面陈述; Ⅳ诱答项应具有似真性; Ⅴ不能对正确答案有任何暗示; Ⅵ同一份试卷中题与题应当是独立的; Ⅶ选项的文字表述应简洁明了。

是非题的命题原则: Ⅰ测试的内容应当有价值,符合教学要求; Ⅱ题目应用于测量理解能力而不能用于测量记忆能力,更不能抄录教科书中的句子。 Ⅲ试题是非界限明确,避免模棱两可; Ⅳ一个题目中只能有一个中心问题; Ⅴ题目叙述应清楚,不能使人造成误解; Ⅵ正句和误句的排列要随机化。

配合题的命题原则: Ⅰ在同一道题中,各个题干和选项应具有相同或相近的性质,以保证其似真性; Ⅱ选项的数目不能少于题干的数目; Ⅲ题干与选项之间如存在逻辑关系,应按其逻辑顺序编排;(比如,时间或距离的远近、数目的大小、字母的顺序等) ;

Ⅳ要以清晰的指导语指出题干与选项之间的配合关系以及对每个选项可以被选的次数的规定; Ⅴ选项的词语要短,而题干的词语应相对较长; Ⅵ同一道试题不要分散在不同的试卷页上。

填空题的命题原则: Ⅰ题意要明确、限定要严格,空白处要填的答案是唯一的; Ⅱ要填的答案应是关键词语,并要与上下文密切相关; Ⅲ同一道题中所留的空白处不要太多(一般不超过两个),以免造成阅读困难; Ⅳ空白不要放在句首; Ⅴ所留空白的空间应当相同,以避免暗示; Ⅵ若答案是数字,应指明单位和数字的精确度。

论述题的命题原则: Ⅰ试题是用来测量较高层次的教学目标,比如,理解能力、表达能力、逻辑分析能力等。要求题目表达的主题明确、观点正确、有理论依据; Ⅱ论述的界限清楚,符合考试对象的心理特点和教学要求; Ⅲ答案要有统一的定论,可以分解为答题要点; Ⅳ试题的分量要能在设计的时间内答完。

操作题的命题原则: 操作题是测量考生操作性技能的试题,一般的计算题、制作题就属于这一类。操作题要求: Ⅰ试题要符合操作程序,关键步骤不能省略; Ⅱ要明确需要测试的关键环节,必要时要加以说明; Ⅲ要给出每一步的评分标准。

作文题的命题原则: Ⅰ文体要依目的而定; Ⅱ题目要反映现实生活,有实际意义; Ⅲ选题要符合被试的实际情况,在确定选材和写作意图时要注意公平性; Ⅳ要注意题目大小与测试时间的匹配; Ⅴ要给出合理的评分标准。

分析题的命题原则: Ⅰ分析的对象要符合教学大纲的要求和被试的心理特质; Ⅱ必须给出被分析对象的详细情况,指明要分析的内容; Ⅳ分析的材料具有客观的标准且对每个被试是公平的; Ⅴ要给出每一步的评分标准。

祝大家工作顺利,事业有成!