过去几年,人工智能领域的突破性进展令人目不暇接——从GPT-3到GPT-4,从DALL·E到Sora,从AlphaFold到各种大语言模型,每一次迭代都似乎预示着技术奇点的临近。然而,当2024年的日历翻过近一半,业界越来越多的人开始谈论一个令人不安的趋势:AI的进化速度正在明显放缓。

从“暴力美学”到“增长天花板”

数据是最直接的证明。以大型语言模型为例,OpenAI最新的GPT-4相比GPT-3性能提升幅度,远小于GPT-3对GPT-2的碾压式超越。斯坦福大学人工智能指数报告显示,2023年发布的顶级AI模型在基准测试中的平均得分增长率,已从2021年的年增30%下降至不足10%。

“我们正遭遇‘数据墙’。”谷歌研究院资深科学家李明(化名)向本报指出,“互联网上可获取的高质量文本数据几乎被耗尽,模型训练陷入边际收益递减的困境。”据统计,目前主流大模型已使用了约15万亿token的训练数据,而全球可用的非重复英文语料库总量不超过100万亿token,其中大部分质量参差不齐。

算力扩张的物理与财政极限

如果说数据是AI的燃料,那么算力就是引擎。但这座引擎的轰鸣声正在变得沉重。英伟达最新款H100 GPU的算力相比前代提升约4倍,但训练一个GPT-4级别的模型仍需要数月时间和数千万美元的电费。微软、谷歌等巨头2024年的资本开支中,AI基础设施占比超过40%,但回报周期正在拉长。

“摩尔定律在AI算力上已经失效。”麻省理工学院教授尼尔·汤普森曾在《科学》杂志撰文指出,自2018年以来,训练顶尖AI模型所需的计算量每18个月翻一番,但性能增益每9个月就减半。这意味着,要获得同样的进步,需要投入成倍增长的资源。

模型架构的创新瓶颈

除了数据和算力的制约,模型架构本身也陷入了路径依赖。当前主流的Transformer架构自2017年问世以来,虽经多次改良,但底层机制没有根本性突破。2023年多家机构提出的各种“高效注意力”变体,实际效果均未超出原始Transformer 30%的改进上限。

“我们可能正在经历AI发展的‘中场休息’。”中国人工智能学会副秘书长朱晓峰表示,“上一轮由深度学习和Transformer驱动的快速增长已接近饱和。下一轮突破需要理论层面的根本性创新,比如类脑计算或可解释性新框架,但这需要时间和跨学科协作。”

行业反应:从狂热转向务实

面对增速放缓的现实,科技巨头和投资机构正在调整策略。OpenAI开始将重心从“更大的模型”转向“更实用的模型”,近期推出的GPT-4o系列就是通过多模态融合和推理优化来提升实用价值,而非单纯追求参数规模。Meta则开源了规模更小但效率更高的Llama 3系列,试图以社区力量加速微调。

在投资端,红杉资本2024年发布的《AI泡沫报告》直言,AI领域的过度投资已经导致“估值虚高,而实质性进步不足”。一级市场上,初创公司的融资额同比下降了35%,投资者更倾向于支持已有明确应用场景的垂直AI公司,而非纯粹追求通用智能的团队。

放缓不等于停滞:新的曙光正在浮现

然而,放缓并非意味着寒冬。在智能座舱语音助手、医疗影像辅助诊断、代码生成等具体场景中,AI的落地效率反而在提升。Google DeepMind推出的Gemini系列虽然模型规模没有大幅增长,但在数学推理和多步规划上的表现却实现了约20%的提升,这得益于新型“思维链”训练方法。

更值得关注的是,中国团队在AI领域的追赶步伐并未放慢。百度文心一言、阿里通义千问等国产大模型在中文理解和生成任务上已接近国际先进水平。华为盘古大模型在气象预测、药物研发等科学计算领域更是展现出独特优势。

“AI的放缓是结构性的,而非周期性的。”中国科学院自动化研究所研究员张兆翔对记者表示,“我们正在告别‘堆数据、堆算力’的粗放时代,进入‘精耕细作’的精细化阶段。这其实是一件好事——它迫使行业回归理性,思考AI的真正价值。”

结语:理性看待技术的周期性

每一次技术革命都遵循着类似的S型曲线:初期快速爆发,中期遭遇瓶颈,随后在理论突破或工程创新中迎来第二次增长。AI的放缓,或许正是下一轮爆发前的蓄力期。对于行业而言,重要的是避免因短期减速而丧失长期信心;对于公众而言,则需以更务实的态度看待AI的能力边界——它仍将改变世界,但不会在一夜之间完成。

正如黄仁勋在今年GTC大会上所言:“慢下来,是为了走得更远。”