我们找了全网最热门的AI写高考作文，结果出人意料……

高考作文历来是每年全民热议的焦点。今年，当AI写作工具日益普及，一个大胆的念头浮现：如果让最先进的AI来写高考作文，能拿多少分？为此，本报记者选取了当前全网最热门的四款AI写作工具——ChatGPT-4o、文心一言4.0、通义千问2.5以及Kimi——让它们分别完成2024年全国甲卷“人与科技”主题作文，并邀请省级语文教研员和一线语文教师进行匿名打分。

测试过程：模拟真实考场

测试严格按照高考作文规范进行：40分钟内完成800字文章，不得联网搜索，仅依靠模型自身知识库。题目选择全国甲卷“每个人都要学习与他人相处。有时我们为避免冲突而不愿表达自己的想法。其实，坦诚交流才有可能迎来真正的相遇。”要求自选角度、自定立意。

四款AI均在一分钟内完成“构思”并开始输出，最快的Kimi仅用12秒便生成全文。但出人意料的是，所有AI都未能完全遵守“不得出现真实校名、人名”的指令——有两篇作文出现了“正如苏轼所言”“鲁迅先生说过”等引用，这在高考试卷中会被视为“非正常引用”而被扣分。

评分结果：平均分仅42.3分

四位老师按照高考作文分项评分标准（内容25分、表达25分、发展等级10分，总分60分）独立打分，取平均分。结果令人大跌眼镜：

ChatGPT-4o：内容20分，表达22分，发展5分，总分47分（二类上）
文心一言4.0：内容18分，表达20分，发展4分，总分42分（二类中）
通义千问2.5：内容16分，表达19分，发展3分，总分38分（三类上）
Kimi：内容15分，表达18分，发展2分，总分35分（三类下）

平均分42.3分，仅略高于及格线。 这比许多一线语文老师预估的“至少能拿到一类文”低了将近10分。

问题出在哪？AI的“完美”反成硬伤

“最大的问题是‘没有灵魂’。”参与评分的省重点中学语文教研组长李老师指出，AI作文结构完整、语言流畅、逻辑严密，甚至找不出一个错别字，但恰恰是这种“完美”暴露了机器写作的本质。“高考作文要求真情实感，AI却无法真正‘体验’人际交往中的犹豫、尴尬、温暖。它只能堆砌关于坦诚交流的名言和案例，却写不出一个真实的内心挣扎。”

评审组发现：所有AI都没有使用第一人称“我”来讲述个人经历，通篇是“有人说”“研究表明”。而按照评分标准，缺少个人体验的议论文在“内容充实”一项最高只能得16分。更致命的是，AI在论证时出现了典型的“AI体”——“综上所述”“正如前述”等表达，被阅卷老师诟病为“套话过重”。

但出人意料的是，当要求AI修改时，它们能立刻理解问题并生成针对性调整。例如ChatGPT-4o在被告知“加入个人经历”后，15秒内写出了一段关于转学后不敢与同学交流的虚构故事，情感真挚程度远超初稿。这不禁让人思考：如果考生利用AI反复润色，是否可能突破评分限制？

教育专家：AI是工具而非枪手

对此，中国教育科学研究院研究员王教授表示：“测试说明AI目前尚不能取代人类在创造性写作中的独特性，但作为辅助工具，它可以帮助考生拓宽思路、优化语言表达。关键在于，学生是否愿意并能够驾驭它，而不是被它替代思考。”

高考作文考的不是文采本身，而是17岁的年轻人对世界、对人生的真实感悟。这恰恰是机器永远无法替代的——哪怕它拥有整个互联网的知识库，也无法拥有一次心跳加速的青春。

本次测试的结果或许令人意外，但也让人安心：至少在作文这件事上，AI想要拿高分，还差一颗“人心”。

测试过程：模拟真实考场

评分结果：平均分仅42.3分

问题出在哪？AI的“完美”反成硬伤

教育专家：AI是工具而非枪手

相关阅读