教育测量的基本原理与方法 童辉杰 博士 教授. 一、从两份载入史册的评语说起 1. 黑格尔的老师对他的评价 黑格尔是德国的著名哲学家, 18 岁进入图宾根大 学(符腾堡州的一所新教神学院)学习。毕业时, 他的老师为黑格尔写下一段评语: “ 健康状况不佳, 中等身材,不善辞令,沉默寡言,天赋高,判断.

Slides:



Advertisements
Similar presentations
Copyright © 上海师范大学图书馆 All Rights Reserved 高校英语资源数据库 使用指南 最后更新时间 2010 年 2 月.
Advertisements

新东方多媒体学习库 产品介绍 北京新东方迅程网络科技有限公司 Contents 数字图书馆产品服务 2 应试类产品 3 数字图书馆产品体系 1.
多 库 融 合. 创 新 服 务 高校英语资源数据库. 资源概述 金图国际《高校英语学习资源总库》是一个专业面向高等专业院校英 语教学及学习的综合性英语学习平台。 该资源目前分三个部分设计: 1 、英语资源库:由《英语学习参考书》、《英语知识小资料》、 《英语教材》、《英语杂志精选》、《世界演讲集萃》、《电影及.
新东方多媒体学习库 集课程,练习,考试,资讯,互动, 服务于一体的学习系统. 新东方多媒体学习库 特色概览 课程中心 课后练习 & 每日一练 考试中心 爱学资讯 爱学励志 爱学互动 移动端 学习应用.
长春工程学院图书馆. CHANGCHUN INSTITUTE OF TECHNOLOGY 新东方多媒体学习库 选库学习 3 检索方式 2 资源介绍 1 课程体系与考试技巧 4 爱学服务 5.
北京爱迪科森教育科技股份有限公司 爱迪科森就业培训数据库 开篇 —— 就业培训 职业生涯的开始.
长春工程学院图书馆. CHANGCHUN INSTITUTE OF TECHNOLOGY 资源介绍 爱迪科森就业培训数据库涵盖了学历考试类、应用英语类、 出国考试类、职业英语类、小语种以及职业认证培训、研 究生考试、公务员考试等课程资源,为高校师生提供英语 基础、小语种入门、考前辅导、求职指导等全方位培训。
新东方在线简介 新东方在线是国内最著名的综合教育机构 —— 新东方 教育科技集团旗下专业的在线教育网站。自 2000 年 上线以来,经过十余年的发展,新东方在线已成为中 国最强大的网络教育服务平台和最领先的网络教育品 牌 新东方在线依托于新东方教育科技集团的强大师资力 量与教学资源,拥有中国最先进的教学内容开发与制.
教学目标 知道能力的定义以及能力测验相关的功能; 了解能力的相关理论; 了解各种能力之间的差别 了解自己的能力水平; 掌握能力测验在相关的人力资源环节中的应用。
成功家教三步法 王晶 清 华 大 学 2013 年哈佛新生 江苏省镇江中学高三 (6) 班 17 岁的女孩 高秋秋,哈佛大学全额 5 万奖学金录 取。 15 岁 PK5 千人免费游,带着母亲 前往 “ 暮光之城 ” 加拿大温哥华。
攜手邁向大學之路 內壢高中輔導室 蕭毓文 大溪高中99學年度親職教育講座. 第一部份 「大學」瞭了沒.
1 2 3 1. 二年级以上( “ 社会捐资助学金 ” 除外); 2. 学生政治思想素质好,道德品质优良; 3. 诚实守信,遵纪守法,未受纪律处分; 4. 各科学业成绩合格,必修课无补考或重修。 参评基本条件.
Welcome back 高二( 21 )班 2016 年 2 月 16 日. 学生素质报告册 ( 家长意见及签名 ) 社会实践表及社区服务表 行为反馈表 美方成绩单(家长签名) 缴 交 的 材 料.
为了满足学生发展的个性化需求 ----AP 与 CAP 课程解析 克拉玛依市高级中学. 内容提要 4 AP 课程简介 CAP 课程的发展 关于 CAP 课程的几点认识 AP 与 CAP 课程在我校开展的现状 工作和学习计划.
上业 外语多媒体学习库 客户至上 基业长青 Contact Us 上海市闵行区三鲁公路 3279 号 Tel: 021 -
教育无疆 环球共享 《环球英语多媒体资源库》 产品及使用方法介绍.
膳食计算. 1 、了解被调查对象食物摄取情况 可通过膳食调查实现 称重法 记帐法 询问法 化学分析法 频数表法.
读研之路 —— 考研、保 研相关经验交流. 目录 保研须知 考研经验 读研选择 保研 or 考研 学硕 vs 专硕 专业用书 备考秘籍 简历制作 面试技巧 学校 and 方向.
第一章英语类馆藏图书资源的获取与利用 图书馆学科部 : 王芳 QQ : :
第九章 骨关节病变MR诊断 陈 燕 萍 南方医院影像中心.
人才的招募与甄选 人才招募的基本问题 有关测验的基本概念 笔试 阿里巧巧
特殊人群的营养与膳食.
梦想 成真 职业生涯规划设计大赛参赛作品 参赛选手:李 艳 学校:哈尔滨工业大学.
美國公開測驗 班級:四英二B 姓名:江珞琦.
Testing and Education Reference Center 留學資訊與考試資源參考中心
贴着生活写作 慈溪中学 黄宏武.
留学扫盲贴 新东方教育科技集团 太原学校 王琪 tel:
大学人才培养与教育改革: 理念与实践 中国农业大学 柯炳生.
班主任工作要求 王煜.
班主任工作要求 王煜.
义务教育语文课程标准 修定与发展趋势介绍 华中师范大学 雷 实.
新东方多媒体学习库培训   北京新东方迅程网络科技有限公司 王伟 电话 : QQ:
多元入學管道簡介 西元2014年 歡迎香港同學赴臺升學 各位師長、同學好,我們是海外聯合招生委員會,
杨义先 教授 北京邮电大学信息安全中心主任 灾备技术国家工程实验室主任
高考后之路, 如何选择?.
布鲁氏菌病 传染病防制所 凌锋.
津桥留学 美国部 经典案例 走向津桥 迈向成功.
把握高考改革的历史机遇 实现学校跨越式发展
第三章 领悟人生真谛 创造人生价值 素质教育部 思政教研室.
李江帆 中山大学中国第三产业研究中心 主任 中山大学管理学院 教授 博士生导师
天主教道明高級中學 104 學年度 大學多元入學家長說明會 主講人:方逸琳
新东方多媒体学习库检索方法.
變異數的估計 自一個平均數為μ,標準差為σ的常態母體抽出一組隨機樣本X1,X2,…,Xn 樣本平均數 樣本變異數.
第九章 風險回應(一) ─風險控制與BCM等特殊管理
宜点通账户策划.
高二大學甄選入學 備審資料說明會 台中女中輔導室
社会用字现状 外国语学院2011级朝鲜语班 于海婧 学号:
美国肯特州立大学 Kent State University Excellence in Action.
深圳市快易典电子技术有限公司市场部培训组
漢 字 簡 化.
蛇口集装箱码头(SCT)见习报告 06秋物流管理第一小组见习报告 组长:姜 珊 组员:陈 娟
组长:赖昌柱 演讲:郑茜玲 PPT制作:肖东辉 组员:黄鲜娣、韩丽珠、杨昀其、周志航、江国文、陈计伟.
國立高雄大學卓越講座 假如我再成為大學生 陶幼慧 國立高雄大學資管系 兼圖資館館長 2010/11/9.
我的职业生涯发展图.
中外运江湾项目-上海宝山区逸仙路旧厂房改造
第四章 德国的新闻传播事业.
大学生如何进行职业生涯发展规划及有效应聘 厚积薄发
基因突变 授课人:羊金华
“心”港湾 新征途 深圳市招商港湾集团有限公司.
大学生职业发展和就业指导.
贲门失弛缓症 Esophageal Achalasia.
金門縣國教輔導團 語文領域 漫遊與迷向-- 語文教育的反思與創新 中正國小 姚語歆
Synthetic Chemical Experiment
議 程 證交所致詞 新式證券交易資訊網路-行情傳輸系統 (NG-SDH over MPLS)建置說明 中華電信電路介紹 新世紀資通電路介紹
爱之队 Show 成功案例.
Are you 『READY』? 歡迎您! 我們即將開始!
2011 邀请中国姐妹学校韩国语研修团项目 申请时间: ~5月 27日 / 项目地点: 汉阳大学 安山校区 / 项目时间: (星期日) ~ 7.22(星期五) 费用: 100万元(韩币/人 (包含项目 - 学费, 教材费, 宿舍费, 接机费用及所有文化体验活动项目费用)
108學年度特殊選才招生 應用經濟學系 張嘉玲特聘教授兼系主任.
斯图尔特商学院 M.P.A.奖学金项目招生简介 美国伊利诺伊理工学院
请大家起立,练习“站桩”:两手平伸,两脚与肩间宽,双脚尽量下蹲,上身保持平直。
Presentation transcript:

教育测量的基本原理与方法 童辉杰 博士 教授

一、从两份载入史册的评语说起 1. 黑格尔的老师对他的评价 黑格尔是德国的著名哲学家, 18 岁进入图宾根大 学(符腾堡州的一所新教神学院)学习。毕业时, 他的老师为黑格尔写下一段评语: “ 健康状况不佳, 中等身材,不善辞令,沉默寡言,天赋高,判断 力健全,记忆力强,文字通顺,作风正派,有时 不太用功,神学有成绩,虽然尝试讲道不无热情, 但看来不是一名优秀的传教士。语言知识丰富, 哲学上十分努力。 ”

2. 卡尔 · 马克思《中学毕业证书》上的评语 一、操行:对待师长和同学态度良好。 二、才能和勤勉:该生才能优异,在古代语、德 语和历史课方面表现了十分令人满意的勤勉,在 数学课方面是令人满意的勤勉;只是在法语方面 稍为勤勉。

三、知识和成绩 1. 语言 ( 1 )德语:语法知识和作文都很好。 ( 2 )拉丁文:无需准备就能熟练、细致地翻译和 解释中学选读的古典作品中比较容易的段落,经 过适当准备或稍作辅导后,常常能熟练、细致地 翻译与解释较难的读物,尤其是语言本身并不太 难和所涉及的事物和思想内容都较难懂的读物。 他的作文就内容而言,既富于思想,又对事物有 深刻的了解,但时常过于冗长,在掌握拉丁文方 面达到了令人相当满意的熟练的程度。

( 3 )希腊文:对中学选读的古典作品的理解,其知识和 熟练程度同拉丁文不相上下。 ( 4 )法语:语法知识相当好,略加辅导就能读较难的作 品。口语表述方面达到了一定的熟练程度。 2. 学科 ( 1 )宗教知识:对基督教的教义和自诫相当清楚,能很 好地论证;对基督教的历史也有一定的了解。 ( 2 )数学:有丰富的知识。 ( 3 )历史和地理:总的来说,具有相当令人满意的知识。 ( 4 )物理:知识中等。

因此,本委员会衷心希望将由于得天独厚而获得 应有的美好前程。 学校考试委员会 思维丰富,文学结构严谨,然而有追求与众不同 的形象用语的倾向。 —— 校长维登巴赫

反思 1. 我们能为学生写出同样的全面中肯的评语吗? 2. 评语是怎样做出的? 3. 什么是教育测量与评价?

1. 我们能为学生写出同样的全面中肯的评语吗? 任何一个普通的老师,都完全能够看到每一个学 生全面的发展和特点。如果让一个老师自主地、 自由地对任何一个学生作出评价,我相信他们都 完全可以作出全面的恰当的评价而不失分寸。那 么,是什么东西屏蔽了全体教师的眼光呢?是什 么东西不让这些教师看到学生的全面发展呢?无 疑就是我们的教育部门的官僚主义和行政取向。 领导们那么忙,怎么能够看到学生全面的发展和 特点呢?他们也不需要看到、不愿意看到。他们 只需要分数!分数,多么简单而好使!

我们的教育体制表现出两个特点。一是应试主义, 只看到考试成绩,看不到学生其它方面的发展; 二是官僚主义和行政取向。正因为教育部门广泛 而深入的官僚主义和行政取向,才造成了一切向 分数看的体制。

所以说,我们厌倦了应试教育这么多年,批评应试教育这 么多年,一点进展也没有,原因就在于我们竟然没有看到 应试教育是怎样来的。怎么这么多年来没有人发现应试教 育完全是来源于教育部门广泛而深入的官僚主义与行政取 向!教育部门的官僚主义和行政取向导致了应试教育,这 种 “ 异化 ” 的组合一道忽略和抹杀了我们的学生的生动活泼 的天性、丰富多彩的创造性、无限的发展潜能 …… 却只需 要易于管理的升学率、需要服从、听话、刻板、机械的品 质。在简单管理的官僚主义和行政取向的 “ 升学率 ” 的指挥 棒下,全体师生只能服从、听命,于是高强度的 “ 题海战 术 ” ,铺天盖地的大考小考,永远的死记硬背,从小学的 6 年,再到中学的 6 年 …… 所以才出现今天高校的 “ 阴盛阳衰 ” 现象。

2. 评语是怎样做出的? 评语是一种非常重要的教育评价。 教育评价是依据教育测量、行为观测、综合考察 的结果做出的。

3. 什么是教育测量与评价? 对受教育者并且同时也对教育者的行为进行标准 化的量化分析,从而作出客观的科学的评价。 标准化:( 1 )测量过程的标准化;( 2 )领域参 照和常模参照标准。 量化分析:( 1 )掌握水平:学业成绩;( 2 )标 准分( Z,T,IQ, 等等) 对受教育者:因材施教。 对教育者:促进教育发展。

国外对学校教育质量的评价 Horwitz ( 1979 ):学业成绩、自我概念、对 学校的态度、创造力、独立性与顺从性、好奇感、 忧虑与调节、控制点、互助性。 Hedges 等人( 1981 ):成就动机、调节、忧 虑、对学校的态度、对老师的态度、互助性、创 造力、好奇感、一般思维能力、独立性与自立性、 控制点、自我概念、语言能力、数学成绩等学业 成绩。

二、从最早的教育测量到今天的教育测量: 回顾与反思 正是中国孕育了世界上最早的教育测量。在测量 史上,世界公认人类最早出现的教育测验,是在 中国发现的。公元前 2200 年,大禹对官员每三年 一次进行能力测验,作为晋升或罢免的依据。这 可以说是人类最早出现的教育测验。并且,有史 料可循的中国汉朝出现的文官选拔考试,也是比 西方早了一千多年。汉武帝(公元前 156 年 - 公元 前 87 年)时,兴办太学,并开科取士,及至隋唐 成为制度。而在欧洲,大学里出现正式考试是公 元 1219 年的事,文官考试则更是要到 1833 年后。

1. 中国人这项最早的创新意义何在? 大家不要低估了开科取士的伟大意义,这种创举: 一是使用了测量的方法和心理选拔的策略,从而能够真正 公平地选拔到合适的人才,使人力资源的配置达到优化; 二是广开了才路,使有能力的寒门子弟也能够晋升,为国 家效劳,从而开发了国力。历史已经检验了这种创举的 “ 实证效度 ” ,汉武帝时中国的强盛就能说明问题,汉武帝 于是也成了 “ 雄才大略 ” 的一代雄君。 所以,其意义比美军使用 “ 陆军 A 、 B 种智力测验 ” 还值得称 道。

2. 为何到后来反而成了僵化的体制? 从晚清腐败的科学考试 今天的应试教育。

3. 教育与国家发展究竟有多大关系?

三、信度的原理与方法 1. 信度的意义 假设有人前几天给你量过身高,你的身高是 175 厘米。今天再次给你量了身高,你的身高是 165 厘米。你作何感想? 根据这样的测量,请问,你究竟是多高?你能够 下结论吗?显然,测量误差很大的测量结果,是 不能够给出结论的。

5 位教师对一位学生的作文评分的结果是: 90 、 20 、 70 、 10 、 30 ;请问,这样的评分能够相信吗? 评分从 10 分到 90 分,彼此相差太大,评分者信度是很低的。 在这样的情况下,能够对学生作出可靠的结论吗? 评分者信度低,说明教师们或者对评分标准有不同的理解, 或者对学生存有偏见。也就是说, 5 位教师的评价存在很 大的误差,这样是不能够对学生做出客观可靠的结论的。 否则就是草菅人命。

2. 信度的计算 信度常以相关系数表示: 例如, 50 个被试第一次测验与相隔一周后的第二次同样的 测验,两次测验成绩的相关系数 r 为 0.85 。这个相关系数 表示的是重测信度。 有 5 种信度(重测信度、复本信度、分半信度、内部一致 性信度和评分者信度)算法。

各种信度的含义 信度要说明的问题取样特点 重测信度第一次测验与第 二次测验是否一 致? 在不同时间取样稳定性系数 复本信度不同的复本在同 时或不同时测验 时是否一致? 对内容与时间取 样 等值性及稳定性 系数 分半信度测验分为两半时 是否一致? 对内容取样同质性系数 内部一致性系数测验的内部各个 项目之间是否一 致? 对内容取样同质性系数 评分者信度不同的评分者之 间的评分一致性 如何吗? 对评分者取样评分者一致性系 数

四、内容效度问题 通俗地说,或者从字词的意义上说,内容效度就是从测验 的内容方面去检验测验的效度。内容效度主要去考察被试 过去学得怎么样和做得怎么样。 内容效度检验一个测验是否包括足够的行为样本并且有适 当的比例分配。一是要有足够的覆盖面,二是分配的比例 必须适当。

假如关于高一期末考试的试卷出现争议?

高一数学学过的内容 必修 1 内容:函数,基本初等函数 1 ,函数模型及其应用 必修 2 内容:立体几何初步,空间中的线面关系,直线与 方程,圆与方程 必修 3 内容:算法初步,统计,概率, 必修 4 内容:三角函数,平面向量,三角恒等变换

五、标准化问题 1. 参照的意义 原始分数毫无意义。 ( 1 )常模参照。 ( 2 )领域参照。

2. 领域参照测验的主要特征是: ( 1 )界定明确的领域与内容的范围。首先一定要界定清 楚测验的领域与内容的范围,例如,过去学了哪些东西, 做了哪些事。 ( 2 )根据明确的领域与内容的范围,确定掌握水平。明 确界定了测验的领域与内容范围之后,就可以确定一个掌 握水平。例如,明确了高一某学期学过集合、代数、函数、 几何这些内容,就可以每个部分编制若干道题,总共 100 分,并确定 60 分为及格。这分数就对知识与技能的掌握水 平。

3. 领域参照测验与常模参照测验的关系 ( 1 )领域参照测验可以与常模参照测验结合。当测验的 领域清晰时,我们可以编制领域参照测验,也能编制成常 模参照测验。例如,学业测验本来是领域参照测验,但是, 我们可以进一步将它发展成常模参照测验。那些学业标准 化测验就是如此。著名的测验 GRE 、托福、美国学业评定 测验方案( SAT )、美国大学测验方案( SCT )等就是常 模参照测验。 ( 2 )常模参照测验不可编制成领域参照测验。当测验的 领域不清晰时,只能编制常模参照测验,不能编制领域参 照测验。智力、人格、创造力、心理健康这些领域都是不 清晰的,难以明确辨别的,所以,只能编制常模参照测验, 不能编制领域参照测验。领域都不清晰,谈何领域参照?

3. 常模参照的标准化测验的应用 从标准化的学业测验到学习风格(反省监控)、 人格(成就动机和抱负水平)、认知能力(智 力)、心理健康( 病态人格、强迫、焦虑、抑 郁) ……

六、几个展望 1. 项目反应理论与计算机自适应测验 2. 大数据与教育测量