关于成绩的数理统计的探讨 望您多多指教!多谢!!
提 纲 本次探讨的缘起—— ⑴一项任务;⑵一次请教。 提 纲 本次探讨的缘起—— ⑴一项任务;⑵一次请教。 成绩分析中经常出现的统计学术语—— ⑴平均分的可疑;⑵数据集中性的描述; ⑶数据离散性的描述。关键词:稳健性。 古典概型的“数学期望”—— 正态分布“可求不可遇”,引发消弥差异。 一些数据分析的看法—— ⑴错因分析;⑵“差减差”;⑶学科成绩均衡 图;⑷聚类分析与数据挖掘。
探讨的缘起 —— 更好的使用网络阅卷系统的分析数据。系统中出现 的标准差、均值差异等统计学名词,能够细致反映 学生个体情况和班级、年级整体情况的同时,增加 了我们理解与习惯的难度。 向各位老师汇报高一年级组物理学科仅在一次使用 网络阅卷、统计与讲评后的认识,期望得到您更多 的指点。 一些个人看法与做法,探讨与请教的成分多,交流 的意味少。古典数据统计和现今提倡的聚类分析和 数据挖掘,是专门的博大精深的领域。忝颜献丑。
对成绩分析的个人看法 —— 只依赖一种或几种统计方法来表现和反映学生成绩、教学成绩 是不完善的,也是不客观的。 当被统计的学生数较少时,对数据更有意义的处理,不仅仅是 统计,而是聚类分析和数据挖掘——依据一次成绩或多次考试 成绩,按照已知的情况和条件,从数学的角度看“如何给学习 群体分类”和“用有限次数的成绩做出符合学生学习特点的未 来成绩的推测”。特别的,传统的“一分三率”受特异成绩(极 高分数或极低分数)的影响非常大,失去稳健性。 对成绩分析的一些数学期望,例如分数段与人数是否趋中或正 态分布,在概念上是模糊的。 数据是客观的,教师对学生——以面对“活动人”的视角—— 把握学习往往是主观的,但是这种主观分析所带来的情感、沟 通、管理等要素,往往强于数据的客观性分析所带来的成效。 用发展的眼光看学生,用发展的眼光看数据,用发展的眼光看 发展。
刚刚展示的图片里都有哪些人? 当我们被要求需要面向全体时,我们最先想到的是哪 些人? 正常人的正常心理特征: ①整体中,最具有突出特征的部分被高度关注; ②需要面向整体时,首先想到最弱的部分,然后是平 均的部分。
表二:10名学生成绩相对集中,但有一名学困生(特异值) 关于统计分析中经常用到术语—— “平均分”: 假设有两组学生,每组10人,某学科成绩。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
关于统计分析中经常用到术语—— 平均分的计算方法,本质上认为每一名学生对总体分数 的贡献能力都是相同的,但事实上,分数极低的特异分 数,极大影响平均分的可信程度。 → 平均分缺乏学生的层次差异的考虑,或者反映的信息 不够准确和详细。 → 平均分受特异成绩影响大,特别是在学生人数较少时 ,影响更大。 → 如何看待学生的平均成绩?唯一指标不存在,只存在 稳健性指标。
表二:10名学生成绩相对集中,但有一名学困生(特异值) 关于统计分析中经常用到术语—— “众数”: 在所有的被分析的成绩中,选出出现次数最多的那个 分数。可能不唯一。表一和表二中的众数,均为85 分。 众数具有稳健性。不受特异值影响。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
表二:10名学生成绩相对集中,但有一名学困生(特异值) 关于统计分析中经常用到术语—— “中位数”: 把所有的被分析的成绩排序,选出处于中间位置的那 个分数。如果中间数据有两个,则加和除以2。表一 和表二的中位数,均为86分。 中位数具有稳健性。不受特异值影响。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
关于统计分析中经常用到术语—— 对我们的个人教学,当学生人数较少时,平均分较为 缺乏普遍特征,难以作为教学层次和起点的参考。 结论:对我们分析成绩有意义的是 平均分、众数、中位数。 推荐研究:加权平均数、调和平均数的教育统计中的 应用。
关于统计分析中经常用到术语—— 成绩的悬殊、学生的程度差距太大,是最值得关注的问题;学 科间的不均衡和偏科,形成学生个体成绩的不同权重,总成绩 受最弱学科影响最大(可研究调和平均数的意义)。 把握整体和整体的层次,需关注数据的离散和离散程度。 “极差”:最高分减去最低分所得数值。在试卷分析里,经常被 称为“全距”。表一为20,表二为80。 “上、下四分位数”:把被分析的学生成绩按高低排序,取出总 排序中位于75%和25%位置的成绩,分别称为上四分位数和下四 分位数。显然,“中位数”是50%分位数。同样,分位数不受特 异值影响。表一和表二的分位数,见表格(L列为成绩)。 “半极差”:上、下四分位数之差,从总体把握学生成绩差异。 下四分位数Q1 85 EXCEL公式:QUARTILE.EXC(L1:L10,1) 中位数Q2 86 EXCEL公式:QUARTILE.EXC(L1:L10,2) 上四分位数Q3 89 EXCEL公式:QUARTILE.EXC(L1:L10,3)
表二:10名学生成绩相对集中,但有一名学困生(特异值) 关于统计分析中经常用到术语—— “标准差”:反映各个数据偏离平均值的程度。标准差越大, 数据越分散。公式较繁,不介绍。 表一标准差6.01,表二标准差为22.75,显然,第二组数据离散 程度大。 标准差的EXCEL公式为STDEV.S(L1:L10)。(L列为成绩) “均值差异”:统计学中常称为“离均差”,即某个学生成绩 与总体平均分的差值。 由于平均分受特异值影响严重,“均值差异”不如“标准差” 稳定。由此出现众多统计计算的“变异”方式。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
古典概型的“数学期望”—— 在古典统计里,若某一观测事件,受众多彼此独立的 因素影响,且每一因素对观测结果影响都很小,最终 的观测结果应该是“正态”分布的,即分布曲线有对 称性,“两头小、中间大”。 正态分布承认平均值存在,且真实可信;影响因素之 间彼此独立,互不影响,对最终结果影响机会均等。 在成绩分析中,往往得不到正态分布曲线。如试题简 单或困难,会使尖峰左移或右移,出现偏态曲线。 数据分析有指导教与学和引领教与学的功能。 ①引领学生做出,对常规教学效果反馈性的平时考试 、达标测试(含期中、期末及会考)和类似于高考、中 考的选拔性考试的考查特征与命题方向的预判;
古典概型的“数学期望”—— ②指导教学做出,对掌握而形成为思想与能力的“活 的双基”而不是“固”而未“化”的“死的双基”, 其影响颇大; ③期望与实际统计的偏离,更为显示评判规约的变化 和变化前期的预知的重要性,以及理想模型统计在自 然统计面前是多么的力不从心。 分析: ①出乎预判的教之一方与学之一方的错因分析; ②消弥试卷差异和基础差异的“差减差”; ③对学生、班主任极具参考价值的学科均衡图; ④对备考、报考和整体管理有意义的聚类分析与数据 挖掘。
阅卷系统中的错因分析数据—— 卷面分析表: 2 1 以第5题为例
阅卷系统中的错因分析数据—— 错因分析表: 3 以C选项为例
阅卷系统中的错因分析数据—— 难度结构表: 4 5 6
9 7 8 阅卷系统中的错因分析数据—— 知识点分析表: 以第5题为例:命题为基础题,但实测却是难题。表明学生不明知识来源,生记的色彩较浓;另一种可能,就是适应。
阅卷系统中的错因分析数据—— 能力分析表: 11 10 12
这个神秘的第5题究竟是谁——
这个神秘的第5题究竟是谁—— 知识点分析表数据: 错因情况表数据: 另可查找错题学生名单。
阅卷系统中的错因分析数据—— 其它反馈表格: 家长小条、学困生名单、错题学生名单等; 其它反馈表格: 家长小条、学困生名单、错题学生名单等; 个人之见: ①我们关注的题目,往往是特定的几个;我们关注的 学生,往往是特定的几组。 ②根据个人需要,取其所需。占有资料和信息过多, 和缺乏资料和信息近乎等同。 ③人力与计算机各自整合统计分析工作的一部分,信 息过多,相当于互相干扰,而使分析不能集中目标。
“差减差”观测成绩进步—— 标准差 均值差异 10.59 10.29 11.52 2.16 12.05 -4.19 15.09 -5.95 标准差 均值差异 10.59 10.29 11.52 2.16 12.05 -4.19 15.09 -5.95 12.61 -1.89
“均衡图”横向观测学科差距——
对成绩合理分类与推测——
统计数据是一件有趣的事——
统计数据是一件有趣的事—— 班级小组积分奖励 核心利用的是“差减差”。 辅助奖励积分、 动态积分和 抽奖游戏。
非常期望您的指点!非常感谢! 如果您对数据统计与分析感兴趣,希望我们能共同学 习和研究。 彻底的“门外汉”,“外行充内行”的交流与探讨, 期望内行指点。 尽我所知,推荐研究: ①《统计建模与R软件》,清华大学出版社; ②《数据挖掘导论》,人民邮电出版社; ③《复杂数据统计方法》,中国人民大学出版社。 成绩分析的本质是面对复杂数据的某一次的分类和与 时间相关的变化且多因素数据的分类、跟踪、评价和 推测。
非常期望您的指点!非常感谢! 掌握情况和把握动向很重要,但关注未来和变化,经 常在关注形势本身时被轻视。 感谢倾听。期待您的指教!再次感谢。