Fine-tuning an LLM to write docs like it's 1995

在人工智能生成内容日渐同质化的今天，一项另类的技术实验引发了业界关注——通过微调大语言模型（LLM），使其输出的文档风格完全“穿越”回1995年。这项名为“Fine-tuning an LLM to write docs like it's 1995”的项目，由一支独立研究团队完成，旨在探索模型对特定历史时期语言习惯的还原能力，并重新审视技术写作的演变轨迹。

1995年的文档长什么样？

1995年，Windows 95刚刚发布，互联网尚处于拨号时代，技术文档以纸质手册、帮助文件（.hlp）和纯文本README为主。当时的写作风格与今天截然不同：句子冗长而正式，大量使用被动语态，常见“Please refer to the following instructions”之类的客套话；术语密集，极少使用图表或链接；排版依赖于固定宽度的字体和空格对齐。更重要的是，当时的作者更倾向于描述“用户应该做什么”，而非“用户为什么要这样做”。

而今天的AI生成文档，受训于海量现代语料，天然倾向于简洁、口语化、交互性强的表达，甚至不自觉地使用表情符号或网络用语。这种风格“代沟”正是研究团队希望利用微调技术加以模拟的。

技术路线：从数据集到策略微调

项目的核心难度在于数据集构建。1995年的数字化文档并不充裕，团队从Archive.org、旧版软件光盘镜像以及大学技术资料库中，搜集了约50万页的英文技术文档，涵盖软件用户指南、硬件说明书、编程参考以及FTP站点的README文件。之后，他们进行OCR清洗、格式统一，并去除1996年之后的样本，确保时间维度严格锁定在1995年前后。

在此基础上，团队使用LoRA（低秩适配）方法对Llama 3 8B模型进行参数高效微调。LoRA在保持模型基础能力的同时，仅更新少量参数来适配目标风格。训练时，他们引入了一个“风格对比损失”——不仅让模型模仿1995年的措辞，还惩罚其使用1995年后才流行的词汇（如“API文档”“移动端”“云端”）。此外，他们手动标注了2000条“典型1995式表述”作为正样本，并请历史学家和退休技术作者参与质量评估。

实验结果：时而精准，时而荒诞

测试阶段，模型接受同一个写作提示：“写一段关于如何安装打印机驱动程序的操作说明。”未经微调的模型会输出“打开系统设置，搜索‘打印机’，点击添加设备即可”；而微调后的版本则写道：“请首先确认打印机与计算机已通过并行端口正确连接。随后，将随附的磁盘插入A驱，运行SETUP.EXE。若系统提示‘文件未找到’，请检查盘片是否损坏。”

团队负责人表示，模型在模仿1995年技术文档的“教条感”上表现突出，但当涉及超出当年认知范畴的概念（如USB、Wi-Fi）时，往往会强行套用上世纪90年代的语言，甚至虚构一些不存在的硬件接口。这表明模型更多是在模仿“风格的外壳”，而非理解技术史逻辑。

意义不止于怀旧

这一实验看似玩票，实则触及了AI训练中容易被忽略的“时间偏见”。当今所有主流LLM的训练语料主要来自近10年的互联网文本，导致模型对更早时期的语言、惯例和知识结构缺乏感知能力。研究团队指出，这种微调技术可用于数字人文研究——自动将现代文档“翻译”成历史文本风格，辅助历史学家分析技术话语的变迁；也可以为游戏开发者生成复古风格的NPC对话或物品说明；甚至在技术写作教学中，帮助学生对比不同时代的写作规范。

当然，也有人质疑：让AI刻意模仿落后的写作风格，是否在倒推技术进步？但更多评论认为，理解历史语境恰恰是避免AI“时空错乱”的关键一步——未来，当AI需要处理历史文献或为老年人设计界面时，这种风格重塑能力或将成为刚需。

下一步：从“像1995”到“像任何一个年代”

目前该模型已作为开源权重发布，社区正在尝试将其扩展至1990年至2005年各时期的文档风格。团队计划引入时间向量嵌入，让用户指定任意年份，模型自动输出该年代的典型技术写作风格。在他们看来，大语言模型不应只活在当下，而应成为穿梭时代的“语言考古学家”。

一次微调实验，带我们回到那个用磁盘安装软件、用纸笔记录故障排查、用一句话写满一整页的1995年。或许，这不只是怀旧，更是对技术写作本质的一次重新追问。

1995年的文档长什么样？

技术路线：从数据集到策略微调

实验结果：时而精准，时而荒诞

意义不止于怀旧

下一步：从“像1995”到“像任何一个年代”

相关阅读