第二节 学生学业评价 学生评价,顾名思义,就是根据一定的标准,通过使用一定的评价技术和方法,以学生为对象所进行的价值判断。学业评价是学生评价的重要组成部分,“是指以国家的教育教学为依据,运用恰当的、有效的工具和途径,系统地收集学生在各门学科教学和自学的影响下认知行为上的变化信息和证据,并对学生的知识和能力水平进行价值判断的过程”。
一、当代学生学业评价的内容 布卢姆的教育目标分类学:认知领域、情感领域和动作技能领域。 加涅的5种学习结果: 加德纳的多元智力理论 (1)智力的技能:知道“如何”(know how)组织和使用言语和数学符号,通过规则和问题解决形成概念; (2)信息:我们可以把这些信息描述为“知道什么”(know what)——关于事实、名字和日期等知识; (3)认知策略:进行信息处理和信息组织所需要的技能,也就是我们今天所谓的“学习策略”或者“学习技能”; (4)运动技能:这些协调移动和复杂运动的能力,这种能力伴随着实践和指导过程产生; (5)态度:通过积极和消极的经验所习得的情感和感情。 加德纳的多元智力理论
教育目标分类学视野下的学生学业评价内容 “教育目标分类学”把学生学业评价的内容分为三个方面: 第一,认知领域:知识、理解、应用、分析、综合、评估; 第二,情感领域:接受、反应、价值判断、组织、表达; 第三,动作技能领域:模仿、操作、精确、连贯、自然。
多元智力理论视野下的学生学业评价内容 “智力是在某种社会或文化环境的价值标准下,个体用以解决自己遇到的真正的难题或生产及创造出有效产品所需要的能力”。 个体身上存在着相对独立的、与特定的认知领域或知识范畴相联系的多种智力,分别是言语—语言智力、音乐—节奏智力、逻辑—数理智力、视觉—空间智力、身体—动觉智力、自知—自省智力和交往—交流智力。1997年和1999年,经过近20年坚持不懈的努力,加德纳为这份智力名单增加了两个“新成员”——自然观察者智力和存在智力。
多元智力理论—学科—教育目标分类学 的学生学业评价三维模型 评估 综合 分析 应用 理解 知识 艺术 应用艺术与体育 全球研究与地理 科学 语言艺术 数学 历史 视觉—空间智力 音乐—节奏智力 数理—逻辑智力 言语—语言智力 身体—动觉智力 交流—交往智力 自知—自省智力 自然观察者智力
所有的学生在本质上都一样,并且都以同样的方式在学习,因此,也应该采用标准化的教学和评价; 传统评价观 多元智力评价观 所有的学生在本质上都一样,并且都以同样的方式在学习,因此,也应该采用标准化的教学和评价; 认为没有标准的学生,每个学生的发展都是独特的,因此,教学和评价应该是个性化的、多样化的; 标准参照测验分数是学生知识和学习的主要衡量标准,也是最重要、最准确的衡量标准;. 基于学生表现的直观的评价,运用多样化的测量工具,为学生的知识和学习提供了更准确、更完整、也更公平的图景; 评价与教学和课程相分离,也就是运用专门的时间、地点、采用专门的评价工具来评价; 评价与课程、教学的界限日益模糊,评价贯穿于课程以及日常的教学中; 外部的评价手段以及评价机构对学生的知识和学习提供了唯一正确和客观的图景; 人的因素在评价中的地位日益重要,也就是说,家长、教师以及学生自己积极地参与评价活动,使评价过程更全面、更准确; 对学生在学校中所学的知识有明确的界定,并且要求学生能够在纸笔测验中表现出来; 教授学生学会学习、学会思考以及学会以多种方式发展自己的聪明才智是教育的主要目标(也就是说,要培养终身学习者); 在统一的标准化测验中不能测试的内容就不值得教与学; 学习的过程同课程的内容同样重要,不是所有的学习都能以标准化的方式予以客观地测查; 学生是消极的学习者,是一个有待被填充满的空的接受器; 学生是积极的和反馈性的学习者,在学习过程中是教师的舞伴; 课程和学校的教育目标受测验和测验分数的引导; 课程和学校教育的主要目标是尽可能充分开发每个学生的智力和学习潜力; 运用钟型曲线将学生分成优等生、中等生和差等生(依据是特定时间所进行的特定测验分数); 运用J型曲线对学生的知识和能力进行值得信赖的评价,以复合的方式表现了学生的知识和能力; 一元化的测验模式(语言-言语智力和逻辑-数理智力,也就是读写等)是测验学生的唯一可行的方法; 基于多元智力理论的多元化测量实践(包括视觉-空间、身体-动觉、音乐-节奏、人际关系智力等等)都是测量学生的可行方法; 在相同的时间运用相同的测验手段、相同的测验标准测验所有的学生,为教育工作者提供了对比学生之间成绩的手段; 每个学生都有自己不同的发展阶段,测验应该是个性化的、发展适宜性的,并且为教育工作者提供了更有效地教育和达到每个学生的方法,使学生在多数时间都有成功的体验; 在编制测验试题时,测验方法的有效性至关重要,也就是说要易于评分、易于量化、易于实施; 评价最重要的方面是对学生的学习有帮助;如果评价能够满足学生需要,并且能帮助他们提高生活质量,则评价内容的有效性并不是主要的问题; 教与学必须以课程内容和需要掌握的信息为中心; 教与学应该与学生智力的发展相适宜,并且关注学生的学习过程、思维技能的发展以及对课程内容与实际生活之间的动态关系的理解; 应该用传统的、预先设定的标准化评价标准和评价工具来测量学生学业的进步和成功; 应该用当前的、基于研究的教育实践来评价学生的学业进步,这样就能考虑到学生的个体需要、个体差异、以及认知和心理因素等; 学习就是掌握和理解各种客观的事实信息,如年代、过程、公式、数字等; 学习首先并且最主要是主观事件,在学习过程中,个体对自己以及对整个世界的理解得到了改变、延伸、深化; 成功的教学是能让学生在评价他们不同学科知识的测验中取得好的成绩。 成功的教学是能让学生为今后有效的生活做准备;关注的是教学的迁移,使学生能将学校所学的知识应用于日常生活中。
二、当代学生学业评价的主体和方法 教育部门和教师作为评价主体所进行的测验 多个评价主体参与的档案袋评价 自评与他评相结合的三好学生的评选
教育部门和教师作为评价主体所进行的测验 以测验为核心的对学生认知领域进行评价是学生学业评价理论研究中最早和最成熟的部分,到现在仍然处于主流的地位。 测验就是通过让学生回答一系列与教育目标相关的有代表性的问题,从学生对问题的回答中,提取信息并根据一定的标准进行判断的过程。中小学常用的测验类型包括:准备性测验和终结性测验;标准化测验和教师自编测验;客观性测验和主观性测验。
客观性测验 表现性评价 测量学习的成果 能有效地测量事实性知识。某些题型(如选择题)也能够测量理解、思维技能和其他复杂的学习成果。但是不适合测量选择和组织观点的技能、写作能力或者某些问题解决能力。 能够测量理解、思维技能和其他复杂的学习成果(尤其是创造性)。测量与现实贴近的教学目标比较有效,但不适合用来测量事实性知识。 问题的准备 测量所需的题目总数很大,准备耗时且难度大。 只需几个任务。 课程内容取样 因为测验中所包含的题目较多,所以能够获得广泛的样本。 课程内容的取样由于评定中包含的任务有限而受到限制。 对学生反应的控制 完全结构化的任务限制了学生反应的类型,能防止欺骗行为的出现以及写作技能的影响,尽管选择题有猜测的嫌疑。 可以按照自己的方式自由反应,使学生的创造力得以表现,而且使猜测的可能性最小化。 评分 客观 主观判断评分 对学习的影响 通常鼓励学生对具体的细节有全面的掌握,并且能够区分细节。如果设计得好,还可以鼓励学生发展理解、思维技能和其他复杂的学习成果。 鼓励学生关注大的内容单元,并特别强调组织、整合及有效表达思想的能力。 信度 测验设计得越严谨信度越高。 信度通常较低,主要是因为评分标准不一致,任务样本有限。
多个评价主体参与的档案袋评价 档案袋评价是表现性评价的主要形式。档案袋(portfolios)是学生作品的收集册,是有目的地收集学生有代表性的作品,以展示学生在某一或某些给定领域中所付出的努力、所取得的进步或成就。档案袋不是储存学生课程作业的笔记本,而是师生共同精心挑选,并有目的地组织起来的学生作品、相关评价标准、录像带、观察记录表以及学生对某些问题的简单答复等的收集册。档案袋内容丰富、全面,可以展示儿童发展的全貌,能体现儿童独特的学习风格,也为儿童、家长参与评价搭建了平台。因而是评价个体智力发展水平的理想方式之一。
自评与他评相结合的三好学生的评选 1982年5月5日,教育部、共青团中央联合发出通知,公布《关于在中学生中评选三好学生的试行办法》,规定“三好学生”的标准是:思想品德好,学习好,身体好。教育部在2001年1月11日发出的有关通知(教基[2001]1号)中规定:根据《意见》精神,各地在高中阶段各类学校评选省级“三好学生”的基础上,按当年毕业生万分之一的比例评选并确定的优秀学生,享受普通高等学校的保送生资格。 ,2004年5月20日,中国教育学会会长、北京师范大学教授顾明远先生在上海教育论坛上呼吁废除“三好学生”的评选制度。据《人民日报》报道,从2005年起,湖北省的“三好学生”只作为荣誉称号,一律不与升学挂钩。 但是“三好学生”的评选到底何去何从,现在仍然在各地有着不同的做法。你对此有什么看法?
三、国际学生学业评价的新趋势——PISA PISA在2000年首次开始实施评价,每三年一次,以评价年命名。PISA2000有32个国家参与,评价的重点是阅读素养;侧重测评学生运用、解释和思考书面材料的能力。 PISA2003有41个国家和地区参与,评价的重点是数学素养;侧重测评学生运用数学知识的能力,利用各种各样的深度模型考察学生在不同情境下运用数学功能的能力。 PISA2006有56个国家和地区参与,评价的重点是科学素养。这一轮的科学素养评价主要关注四个领域:(1)科学知识和利用科学知识去识别问题、获取新知识、解释科学现象以及推断出相关问题的可靠解决方案;(2)理解科学作为人类知识和探究的一种形式的典型特征;(3)了解科学和技术是如何造就我们物质、智力和文化环境的;(4)自愿解决与科学相关的问题,形成科学思想,做一个有思想的公民。在这次有关科学素养的评测中, OECD国家的平均分是500分, 其中,芬兰以563的平均分位居第一,平均分在530到542之间的国家和地区依次是加拿大、日本、新西兰、中国香港、中国台北和爱沙尼亚。 PISA2009评价的重点又轮回到阅读素养,预计将有66个国家与地区参与。
PISA的分析框架 领域1 领域2 领域3 产出与成果 学习的影响 政策杠杆 对教育结果的定型 前提条件 接近或约束教育政策 层面A 领域1 领域2 领域3 产出与成果 学习的影响 政策杠杆 对教育结果的定型 前提条件 接近或约束教育政策 层面A 个体学习 知识、技能的质量与分布 个体态度、投入程度与行为 学习者的社会经济背景 层面B 教学设置 教学实施的质量 教学、学习实践与课堂气氛 学生学习、教师工作条件 层面C 学校和其他结构 机构的表现与产出 学校的学习环境 社区与学校的特色 层面D 国家或体制 教育的社会经济成果 结构、资源分配与政策 国际的教育、社会和经济环境