高考作文历来是每年全民热议的焦点。今年,当AI写作工具日益普及,一个大胆的念头浮现:如果让最先进的AI来写高考作文,能拿多少分?为此,本报记者选取了当前全网最热门的四款AI写作工具——ChatGPT-4o、文心一言4.0、通义千问2.5以及Kimi——让它们分别完成2024年全国甲卷“人与科技”主题作文,并邀请省级语文教研员和一线语文教师进行匿名打分。

测试过程:模拟真实考场

测试严格按照高考作文规范进行:40分钟内完成800字文章,不得联网搜索,仅依靠模型自身知识库。题目选择全国甲卷“每个人都要学习与他人相处。有时我们为避免冲突而不愿表达自己的想法。其实,坦诚交流才有可能迎来真正的相遇。”要求自选角度、自定立意。

四款AI均在一分钟内完成“构思”并开始输出,最快的Kimi仅用12秒便生成全文。但出人意料的是,所有AI都未能完全遵守“不得出现真实校名、人名”的指令——有两篇作文出现了“正如苏轼所言”“鲁迅先生说过”等引用,这在高考试卷中会被视为“非正常引用”而被扣分。

评分结果:平均分仅42.3分

四位老师按照高考作文分项评分标准(内容25分、表达25分、发展等级10分,总分60分)独立打分,取平均分。结果令人大跌眼镜:

  • ChatGPT-4o:内容20分,表达22分,发展5分,总分47分(二类上)
  • 文心一言4.0:内容18分,表达20分,发展4分,总分42分(二类中)
  • 通义千问2.5:内容16分,表达19分,发展3分,总分38分(三类上)
  • Kimi:内容15分,表达18分,发展2分,总分35分(三类下)

平均分42.3分,仅略高于及格线。 这比许多一线语文老师预估的“至少能拿到一类文”低了将近10分。

问题出在哪?AI的“完美”反成硬伤

“最大的问题是‘没有灵魂’。”参与评分的省重点中学语文教研组长李老师指出,AI作文结构完整、语言流畅、逻辑严密,甚至找不出一个错别字,但恰恰是这种“完美”暴露了机器写作的本质。“高考作文要求真情实感,AI却无法真正‘体验’人际交往中的犹豫、尴尬、温暖。它只能堆砌关于坦诚交流的名言和案例,却写不出一个真实的内心挣扎。”

评审组发现:所有AI都没有使用第一人称“我”来讲述个人经历,通篇是“有人说”“研究表明”。而按照评分标准,缺少个人体验的议论文在“内容充实”一项最高只能得16分。更致命的是,AI在论证时出现了典型的“AI体”——“综上所述”“正如前述”等表达,被阅卷老师诟病为“套话过重”。

但出人意料的是,当要求AI修改时,它们能立刻理解问题并生成针对性调整。例如ChatGPT-4o在被告知“加入个人经历”后,15秒内写出了一段关于转学后不敢与同学交流的虚构故事,情感真挚程度远超初稿。这不禁让人思考:如果考生利用AI反复润色,是否可能突破评分限制?

教育专家:AI是工具而非枪手

对此,中国教育科学研究院研究员王教授表示:“测试说明AI目前尚不能取代人类在创造性写作中的独特性,但作为辅助工具,它可以帮助考生拓宽思路、优化语言表达。关键在于,学生是否愿意并能够驾驭它,而不是被它替代思考。”

高考作文考的不是文采本身,而是17岁的年轻人对世界、对人生的真实感悟。这恰恰是机器永远无法替代的——哪怕它拥有整个互联网的知识库,也无法拥有一次心跳加速的青春。

本次测试的结果或许令人意外,但也让人安心:至少在作文这件事上,AI想要拿高分,还差一颗“人心”。