在人工智能生成内容日渐同质化的今天,一项另类的技术实验引发了业界关注——通过微调大语言模型(LLM),使其输出的文档风格完全“穿越”回1995年。这项名为“Fine-tuning an LLM to write docs like it's 1995”的项目,由一支独立研究团队完成,旨在探索模型对特定历史时期语言习惯的还原能力,并重新审视技术写作的演变轨迹。

1995年的文档长什么样?

1995年,Windows 95刚刚发布,互联网尚处于拨号时代,技术文档以纸质手册、帮助文件(.hlp)和纯文本README为主。当时的写作风格与今天截然不同:句子冗长而正式,大量使用被动语态,常见“Please refer to the following instructions”之类的客套话;术语密集,极少使用图表或链接;排版依赖于固定宽度的字体和空格对齐。更重要的是,当时的作者更倾向于描述“用户应该做什么”,而非“用户为什么要这样做”。

而今天的AI生成文档,受训于海量现代语料,天然倾向于简洁、口语化、交互性强的表达,甚至不自觉地使用表情符号或网络用语。这种风格“代沟”正是研究团队希望利用微调技术加以模拟的。

技术路线:从数据集到策略微调

项目的核心难度在于数据集构建。1995年的数字化文档并不充裕,团队从Archive.org、旧版软件光盘镜像以及大学技术资料库中,搜集了约50万页的英文技术文档,涵盖软件用户指南、硬件说明书、编程参考以及FTP站点的README文件。之后,他们进行OCR清洗、格式统一,并去除1996年之后的样本,确保时间维度严格锁定在1995年前后。

在此基础上,团队使用LoRA(低秩适配)方法对Llama 3 8B模型进行参数高效微调。LoRA在保持模型基础能力的同时,仅更新少量参数来适配目标风格。训练时,他们引入了一个“风格对比损失”——不仅让模型模仿1995年的措辞,还惩罚其使用1995年后才流行的词汇(如“API文档”“移动端”“云端”)。此外,他们手动标注了2000条“典型1995式表述”作为正样本,并请历史学家和退休技术作者参与质量评估。

实验结果:时而精准,时而荒诞

测试阶段,模型接受同一个写作提示:“写一段关于如何安装打印机驱动程序的操作说明。”未经微调的模型会输出“打开系统设置,搜索‘打印机’,点击添加设备即可”;而微调后的版本则写道:“请首先确认打印机与计算机已通过并行端口正确连接。随后,将随附的磁盘插入A驱,运行SETUP.EXE。若系统提示‘文件未找到’,请检查盘片是否损坏。”

团队负责人表示,模型在模仿1995年技术文档的“教条感”上表现突出,但当涉及超出当年认知范畴的概念(如USB、Wi-Fi)时,往往会强行套用上世纪90年代的语言,甚至虚构一些不存在的硬件接口。这表明模型更多是在模仿“风格的外壳”,而非理解技术史逻辑。

意义不止于怀旧

这一实验看似玩票,实则触及了AI训练中容易被忽略的“时间偏见”。当今所有主流LLM的训练语料主要来自近10年的互联网文本,导致模型对更早时期的语言、惯例和知识结构缺乏感知能力。研究团队指出,这种微调技术可用于数字人文研究——自动将现代文档“翻译”成历史文本风格,辅助历史学家分析技术话语的变迁;也可以为游戏开发者生成复古风格的NPC对话或物品说明;甚至在技术写作教学中,帮助学生对比不同时代的写作规范。

当然,也有人质疑:让AI刻意模仿落后的写作风格,是否在倒推技术进步?但更多评论认为,理解历史语境恰恰是避免AI“时空错乱”的关键一步——未来,当AI需要处理历史文献或为老年人设计界面时,这种风格重塑能力或将成为刚需。

下一步:从“像1995”到“像任何一个年代”

目前该模型已作为开源权重发布,社区正在尝试将其扩展至1990年至2005年各时期的文档风格。团队计划引入时间向量嵌入,让用户指定任意年份,模型自动输出该年代的典型技术写作风格。在他们看来,大语言模型不应只活在当下,而应成为穿梭时代的“语言考古学家”。

一次微调实验,带我们回到那个用磁盘安装软件、用纸笔记录故障排查、用一句话写满一整页的1995年。或许,这不只是怀旧,更是对技术写作本质的一次重新追问。