Download presentation
Presentation is loading. Please wait.
1
关于成绩的数理统计的探讨 望您多多指教!多谢!!
2
提 纲 本次探讨的缘起—— ⑴一项任务;⑵一次请教。
提 纲 本次探讨的缘起—— ⑴一项任务;⑵一次请教。 成绩分析中经常出现的统计学术语—— ⑴平均分的可疑;⑵数据集中性的描述; ⑶数据离散性的描述。关键词:稳健性。 古典概型的“数学期望”—— 正态分布“可求不可遇”,引发消弥差异。 一些数据分析的看法—— ⑴错因分析;⑵“差减差”;⑶学科成绩均衡 图;⑷聚类分析与数据挖掘。
3
探讨的缘起 —— 更好的使用网络阅卷系统的分析数据。系统中出现 的标准差、均值差异等统计学名词,能够细致反映 学生个体情况和班级、年级整体情况的同时,增加 了我们理解与习惯的难度。 向各位老师汇报高一年级组物理学科仅在一次使用 网络阅卷、统计与讲评后的认识,期望得到您更多 的指点。 一些个人看法与做法,探讨与请教的成分多,交流 的意味少。古典数据统计和现今提倡的聚类分析和 数据挖掘,是专门的博大精深的领域。忝颜献丑。
4
对成绩分析的个人看法 —— 只依赖一种或几种统计方法来表现和反映学生成绩、教学成绩 是不完善的,也是不客观的。
当被统计的学生数较少时,对数据更有意义的处理,不仅仅是 统计,而是聚类分析和数据挖掘——依据一次成绩或多次考试 成绩,按照已知的情况和条件,从数学的角度看“如何给学习 群体分类”和“用有限次数的成绩做出符合学生学习特点的未 来成绩的推测”。特别的,传统的“一分三率”受特异成绩(极 高分数或极低分数)的影响非常大,失去稳健性。 对成绩分析的一些数学期望,例如分数段与人数是否趋中或正 态分布,在概念上是模糊的。 数据是客观的,教师对学生——以面对“活动人”的视角—— 把握学习往往是主观的,但是这种主观分析所带来的情感、沟 通、管理等要素,往往强于数据的客观性分析所带来的成效。 用发展的眼光看学生,用发展的眼光看数据,用发展的眼光看 发展。
6
刚刚展示的图片里都有哪些人? 当我们被要求需要面向全体时,我们最先想到的是哪 些人? 正常人的正常心理特征: ①整体中,最具有突出特征的部分被高度关注; ②需要面向整体时,首先想到最弱的部分,然后是平 均的部分。
7
表二:10名学生成绩相对集中,但有一名学困生(特异值)
关于统计分析中经常用到术语—— “平均分”: 假设有两组学生,每组10人,某学科成绩。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
8
关于统计分析中经常用到术语—— 平均分的计算方法,本质上认为每一名学生对总体分数 的贡献能力都是相同的,但事实上,分数极低的特异分 数,极大影响平均分的可信程度。 → 平均分缺乏学生的层次差异的考虑,或者反映的信息 不够准确和详细。 → 平均分受特异成绩影响大,特别是在学生人数较少时 ,影响更大。 → 如何看待学生的平均成绩?唯一指标不存在,只存在 稳健性指标。
9
表二:10名学生成绩相对集中,但有一名学困生(特异值)
关于统计分析中经常用到术语—— “众数”: 在所有的被分析的成绩中,选出出现次数最多的那个 分数。可能不唯一。表一和表二中的众数,均为85 分。 众数具有稳健性。不受特异值影响。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
10
表二:10名学生成绩相对集中,但有一名学困生(特异值)
关于统计分析中经常用到术语—— “中位数”: 把所有的被分析的成绩排序,选出处于中间位置的那 个分数。如果中间数据有两个,则加和除以2。表一 和表二的中位数,均为86分。 中位数具有稳健性。不受特异值影响。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
11
关于统计分析中经常用到术语—— 对我们的个人教学,当学生人数较少时,平均分较为 缺乏普遍特征,难以作为教学层次和起点的参考。
结论:对我们分析成绩有意义的是 平均分、众数、中位数。 推荐研究:加权平均数、调和平均数的教育统计中的 应用。
12
关于统计分析中经常用到术语—— 成绩的悬殊、学生的程度差距太大,是最值得关注的问题;学 科间的不均衡和偏科,形成学生个体成绩的不同权重,总成绩 受最弱学科影响最大(可研究调和平均数的意义)。 把握整体和整体的层次,需关注数据的离散和离散程度。 “极差”:最高分减去最低分所得数值。在试卷分析里,经常被 称为“全距”。表一为20,表二为80。 “上、下四分位数”:把被分析的学生成绩按高低排序,取出总 排序中位于75%和25%位置的成绩,分别称为上四分位数和下四 分位数。显然,“中位数”是50%分位数。同样,分位数不受特 异值影响。表一和表二的分位数,见表格(L列为成绩)。 “半极差”:上、下四分位数之差,从总体把握学生成绩差异。 下四分位数Q1 85 EXCEL公式:QUARTILE.EXC(L1:L10,1) 中位数Q2 86 EXCEL公式:QUARTILE.EXC(L1:L10,2) 上四分位数Q3 89 EXCEL公式:QUARTILE.EXC(L1:L10,3)
13
表二:10名学生成绩相对集中,但有一名学困生(特异值)
关于统计分析中经常用到术语—— “标准差”:反映各个数据偏离平均值的程度。标准差越大, 数据越分散。公式较繁,不介绍。 表一标准差6.01,表二标准差为22.75,显然,第二组数据离散 程度大。 标准差的EXCEL公式为STDEV.S(L1:L10)。(L列为成绩) “均值差异”:统计学中常称为“离均差”,即某个学生成绩 与总体平均分的差值。 由于平均分受特异值影响严重,“均值差异”不如“标准差” 稳定。由此出现众多统计计算的“变异”方式。 表一:10名学生成绩比较集中,层次不明显 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 80 87.6 表二:10名学生成绩相对集中,但有一名学困生(特异值) 1 2 3 4 5 6 7 8 9 10 平均 100 94 92 88 87 85 83 82 20 81.6
14
古典概型的“数学期望”—— 在古典统计里,若某一观测事件,受众多彼此独立的 因素影响,且每一因素对观测结果影响都很小,最终 的观测结果应该是“正态”分布的,即分布曲线有对 称性,“两头小、中间大”。 正态分布承认平均值存在,且真实可信;影响因素之 间彼此独立,互不影响,对最终结果影响机会均等。 在成绩分析中,往往得不到正态分布曲线。如试题简 单或困难,会使尖峰左移或右移,出现偏态曲线。 数据分析有指导教与学和引领教与学的功能。 ①引领学生做出,对常规教学效果反馈性的平时考试 、达标测试(含期中、期末及会考)和类似于高考、中 考的选拔性考试的考查特征与命题方向的预判;
15
古典概型的“数学期望”—— ②指导教学做出,对掌握而形成为思想与能力的“活 的双基”而不是“固”而未“化”的“死的双基”, 其影响颇大; ③期望与实际统计的偏离,更为显示评判规约的变化 和变化前期的预知的重要性,以及理想模型统计在自 然统计面前是多么的力不从心。 分析: ①出乎预判的教之一方与学之一方的错因分析; ②消弥试卷差异和基础差异的“差减差”; ③对学生、班主任极具参考价值的学科均衡图; ④对备考、报考和整体管理有意义的聚类分析与数据 挖掘。
16
阅卷系统中的错因分析数据—— 卷面分析表: 2 1 以第5题为例
17
阅卷系统中的错因分析数据—— 错因分析表: 3 以C选项为例
18
阅卷系统中的错因分析数据—— 难度结构表: 4 5 6
19
9 7 8 阅卷系统中的错因分析数据—— 知识点分析表:
以第5题为例:命题为基础题,但实测却是难题。表明学生不明知识来源,生记的色彩较浓;另一种可能,就是适应。
20
阅卷系统中的错因分析数据—— 能力分析表: 11 10 12
21
这个神秘的第5题究竟是谁——
22
这个神秘的第5题究竟是谁—— 知识点分析表数据: 错因情况表数据: 另可查找错题学生名单。
23
阅卷系统中的错因分析数据—— 其它反馈表格: 家长小条、学困生名单、错题学生名单等;
其它反馈表格: 家长小条、学困生名单、错题学生名单等; 个人之见: ①我们关注的题目,往往是特定的几个;我们关注的 学生,往往是特定的几组。 ②根据个人需要,取其所需。占有资料和信息过多, 和缺乏资料和信息近乎等同。 ③人力与计算机各自整合统计分析工作的一部分,信 息过多,相当于互相干扰,而使分析不能集中目标。
24
“差减差”观测成绩进步—— 标准差 均值差异 10.59 10.29 11.52 2.16 12.05 -4.19 15.09 -5.95
标准差 均值差异 10.59 10.29 11.52 2.16 12.05 -4.19 15.09 -5.95 12.61 -1.89
25
“均衡图”横向观测学科差距——
26
对成绩合理分类与推测——
27
统计数据是一件有趣的事——
28
统计数据是一件有趣的事—— 班级小组积分奖励 核心利用的是“差减差”。 辅助奖励积分、 动态积分和 抽奖游戏。
29
非常期望您的指点!非常感谢! 如果您对数据统计与分析感兴趣,希望我们能共同学 习和研究。
彻底的“门外汉”,“外行充内行”的交流与探讨, 期望内行指点。 尽我所知,推荐研究: ①《统计建模与R软件》,清华大学出版社; ②《数据挖掘导论》,人民邮电出版社; ③《复杂数据统计方法》,中国人民大学出版社。 成绩分析的本质是面对复杂数据的某一次的分类和与 时间相关的变化且多因素数据的分类、跟踪、评价和 推测。
30
非常期望您的指点!非常感谢! 掌握情况和把握动向很重要,但关注未来和变化,经 常在关注形势本身时被轻视。 感谢倾听。期待您的指教!再次感谢。
Similar presentations