图 | Tes Magazine
考试局将迎来AI阅卷时代?
AQA考试局表示,其计划利用这一过程来识别和纠正以往人工阅卷中“特定的阅卷人员的个人异常评分情况”。
目前,AQA仍在为该项准备工作设计具体的规范,不过这种方式有望应用到即将开始的数以万计的GCSE和Alevel的考试评分。
这个AI阅卷项目建立于AQA此前研究的基础上,当时曾使用历史考题来对比AI的评分和高级教师评分间的区别。
在近期的一次活动中,AQA评估研究和创新主管Alex Scharaschkin谈到了这些发现并表示“对于建设性回答,比如学生必须写几个句子的问题,我们可以相当准确地预测高级评分员的分数。”
以GCSE生物为例:
对于3-4分的主观短问题,AI给出的评分中80%和高级评分员吻合。而对于6分的长问题,这一比例下降到65%。
目前AQA计划采用同样的方式在今年考试中通过“真实的数据”来检验AI评分。
不过,这届考生们不必太过担心,虽然AI阅卷测试将与2024年的夏季考试系列一起进行,但它不会以任何方式用于为评分提供信息,现阶段仍是研究阶段。