欢迎光临四川新闻资讯网!

当前位置: 首页 > 教育

为什么老师给作文打分永远做不到客观公正?

至少到目前为止,一个学生的考试成绩,并不是完全取决于他自己。

因为卷子是老师来打分的,且因为在打分的过程中,无可避免的有主观题(比如最典型的作文题),这个主观题可以得到多少分就不是一个确凿无疑的数字。

一个老师给一道主观题打多少分,这是一次“判断”,许多个这样的“判断”累积到一起,就可能改变一个学生的命运。

相信每一个参与评卷的老师,尤其是参与高考评卷的老师,都希望自己能做到绝对的客观公正,这是一种对考生负责任的态度。

不过理性告诉我们,只要评卷的是人,绝对客观公正就是不存在的。

今天我们聊聊“判断”这件事,来看看比如老师在评卷过程中的“不客观”是怎么产生的。

什么叫做“判断”的客观性呢?

你喜欢一位导演拍的电影,他现在马上一部新电影要上映,你一定会真金白银去捧场,但你下了这么一个结论:因为这个题材有点小众,加上导演任用的全是新人演员,所以这部片的票房应该很惨淡。

你看,下这个判断,是没有被自己的喜好所裹挟的,是建立在事实和逻辑基础上的,这才能叫判断。

别小瞧这个区别,日常生活里大多数人根本分不清自己是在做判断还是在表达喜好——判断的目标不是为了煽动别人的情绪,不是为了让别人同意你,而是为了尽量接近事实真相,避免犯错误。

那么在理想状态下,比如一篇学生的作文,应该有怎样的“判断”待遇呢?

既然作文有一些评分标准的细则,那么无论请多少个老师来给它打分,这篇作文所得到的分数都应该非常接近才对。

可事实显然不是如此,比如高考作文评卷组就有这样的设定(以下为北京语文特级教师王大绩在接受网易教育采访时透露的细节):

两个老师面对电脑,背对背,谁也不知道哪篇作文发到谁那里去,然后电脑统计。

如果这两个老师判断这篇作文的分差在5分、6分之内,取他们俩的平均分,作为这篇作文的得分。

如果这两个老师的分差在5分、6分之外,差距比较大,这篇作文就会由电脑自动派位,派第三个老师去看。

第三个老师判的分和前面哪一位老师的分差在5、6分之内,那就取他们俩的平均分,第三个分数就作废。

如果第三个和头两个都距离在5、6分之外,那就太特殊了,这就由阅卷领导小组去判断。

必须说咱们高考作文的这个评分方法已经很科学了,但是你看,这里头还是有最后一种特殊情况,就是三位老师各自打分的分差都很大。

按照诺奖得主丹尼尔·卡尼曼的说法,这种情况下,这篇特殊的作文就遭遇了比较大的“噪声”。

“噪声”是个什么玩意?卡尼曼说,噪声是影响人类判断的黑洞。

噪声当然是一种干扰,但它很容易和另一种干扰相混淆:“噪声”和“偏差”不是一回事。

我们还是拿老师给作文打分为例,现在假设有A和B两位老师,A老师在学校是出了名的以严格著称,他给学生们评作文,50分以上的屈指可数,有人就评价:他们班这批孩子的作文,换别班老师打分,平均能多得5分。

B老师就不一样,他打出的分数,用一个大家熟悉的概念,叫做方差很大。他觉得优秀的作文,动辄就给个满分60分,而他觉得不好的作文,给个不及格也是常有的事。

A老师的这种“手很严”,就叫“偏差”。

B老师的这种“方差大”,就叫“噪声”。

咱们可以用射击来做个类比,A老师评作文就有点像他手里的那把枪本身出了问题,导致打到靶子上都往一个方向偏,但是他每一次中靶,位置与位置之间的相对关系还是有迹可循的。

B老师呢,就好像打靶的时候手会抖,哆哆嗦嗦的有时左偏有时右偏,有时还能中个圆心。

咱们如果用上面这张图类比,Team A是比较理想的状况,而手很严的A老师就有点像这个Team B,方差大的B老师就是Team C,而这个Team D,就是结合了A和B两位老师的打分缺陷……

如果你明白了这两位老师的区别,那请问:你希望在上学的时候,哪位老师来给你们家孩子打分?

如果有人选B,理由可能是:这位老师有自己鲜明的评判标准啊,只要孩子按照这个标准去写作文,就更有可能得高分,得了高分是一种正向激励,良性循环。

这当然有一定道理,不过站在我们所讨论的,“偏差”与“噪声”的区别的角度,我们更建议你跟着A老师学习。哪怕出于最功利的考虑,为了高考作文得高分,A老师的帮助也更大。

因为真实世界是没有一个确定的“靶子”立在远处的。我们之所以说A老师手很严,那是相对于所有老师的平均打分而言,或者说相对于一个班作文分数的正态分布而言,所以“偏差”想得到修正,其实并不难,所谓严师出高徒也有这个原理在其中,因为一旦你进到正常的评价体系,现实终究会给你补偿。

A老师的严格是一视同仁的,而B老师的分数是阴晴不定的,A老师的学生去到高考,正常发挥就是作文多拿5分,可是B老师的学生去高考,谁能保证B老师的喜好就真的是高考评卷老师的喜好呢?

所以最好不要搞那些“投其所好”的小聪明。

因为“投其所好”的这个“好”,就是一种最要命的“噪声”。

我们说一个美国真实的研究案例。

比起给作文打分,给一个犯人量刑可要严肃得多了吧?可是那些大法官们,却在实际工作中表现出了很大的噪声。

研究者将16个案件,交给208名法官,让每一个法官对这16个案件独立做出裁决。

结果是,法官判决这些案件的平均刑期是7年,但标准差高达3-4年,也就是说,假设你是随机某个案子的犯人,可能落到A法官手里你被判5年,落到B法官手里就要被判9年……

当然就像我们刚才说的,肯定其中有些法官“手很严”,但这解释不了全部现象,比如研究者发现:有些整体风格很严的法官,可能对某一类罪犯从宽处理,这是为什么呢?

问题就出在我们刚才提到的,“投其所好”的那个“好”上,只不过具体到案件裁决,犯人并不是主动“投其所好”,而是真的恰好瞎猫撞上死耗子。

比如有个法官来自新泽西州,他对自己的老乡的量刑,就明显轻过其他法官。

比如有个犯人家里有三个女儿,结果家里同样有三个女儿的那个法官,就选择了某种程度上的体谅。

所以类比到改作文的老师,我们完全可以想象到一些个人的倾向:

比如有的老师喜欢辞藻华丽,有的老师恰恰讨厌堆砌,尤其讨厌滥用成语;

又或者这位老师特别喜欢苏轼,结果你的用典恰好用到了苏轼,老师可能随手就多给2分;

再要么这位老师特别重视对开头结尾的设计感,喜欢有回味的表达,你这么做了,那就肯定是高分。

凡此种种,我们没办法穷尽这种个人倾向上的可能性。

这样的事情,在任何领域,任何时候,都是随时随地发生的,比如你是某大学毕业的,当你做了某公司HR,你就对校友看高一线;比如你从小体能好,后来当了足球教练,你就特别重用体能好的球员;比如你曾经出现过一次医疗事故,所以随后的日子里,你对这类患者都报以最大的投入,来减轻自己的负罪感。

也就是说,一个人的日常习惯、成长经历、知识结构、思维方式等等,都会形成判断上的噪声,且这种噪声几乎是无法被消除的。

因为绝大多数情况下,当事人在做出一个判断的时候,他并不知道自己被什么样的噪声所干扰了,那一刻,他必定是有那么一点随心所欲的成分在的。

所以这也给老师们提出了更高的要求:在承认每个人都有判断噪声的基础上,如何尽可能给学生们一个合情合理的作文分数?

而从学生的角度看,不要被任何一个老师的噪声所影响,哪怕你从心底里喜欢这位老师,这是一种会受益终身的理性精神。

如我们在开篇所说,你喜欢一位导演,和这位导演的片子能取得什么票房完全是两码事,同理你喜欢一位老师,不代表他的教学理念就不可被质疑。

又好比你喜欢一座城市,可是高考填志愿就非这个城市不去吗?

当你有这种念头,噪声就已经出现了,这时一个理性人的做法,是尽可能搜集数据,然后看看这些数据究竟多大程度上能支持你的念头。

哪里有这样的大数据?

“网易高考智愿”网站(daxue.163.com)

为千万学子家长提供及时专业、深度权威的报考指导,帮助考生把握未来就业方向、职业生涯规划,传授报考方法技巧,更加人性化地切入个人兴趣和未来发展趋势。

它能——

智能推荐最适合你的大学和专业

为你解答相关专业的就业前景问题

也能为你带来一手的专业前沿资讯

还会介绍一些很有发展前景的小众专业

……

本文来源于网络,不代表四川新闻资讯网立场,转载请注明出处
我要收藏
0个赞
转发到:
阿里云服务器
Copyright 2003-2024 by 四川新闻资讯网 sc.bjdshi.cn All Right Reserved.   版权所有
关注我们: