Rich Sutton on AI creativity and discovery

被誉为“强化学习之父”的加拿大计算机科学家理查德·萨顿（Rich Sutton）近日在一次学术访谈中，就人工智能的创造力与科学发现议题发表了一系列深刻见解。这位阿尔伯塔大学教授、DeepMind名誉科学家一针见血地指出：“AI的真正创造力，不在于模仿人类，而在于通过持续的探索发现人类从未想到的答案。”

创造力源于探索，而非模仿

萨顿认为，当前公众对AI创造力的理解普遍存在误区。很多人期待AI像人类艺术家一样“灵光一现”，或者像诗人那样遣词造句。但萨顿强调，AI创造力更本质的体现是在未知空间中通过试错找到高效的新策略——这正是强化学习最擅长的领域。

“创造力不是凭空产生的灵感，而是对可能性空间的系统性探索。”萨顿在访谈中举例说明，DeepMind开发的AlphaGo在对弈中走出了人类棋谱中从未出现的“第37手”，后来被职业棋手赞誉为“千古名局”。这一发现并非通过模仿人类高手，而是通过数百万次自我对弈、不断积累奖励信号后涌现的结果。

“人类棋手被数百年的经验束缚，而AI不受此限。它发现了围棋世界里一条从未被走过的路，这就是发现——一种纯粹的、计算驱动的创造。”萨顿强调，这种“发现型创造力”将极大拓展人类认知的边界。

“苦涩的教训”：通用方法的力量

在谈及AI如何实现创造性发现时，萨顿重提了他2019年那篇引发学界巨大回响的《苦涩的教训》。他指出，AI研究史上反复出现的规律是：依靠人工精心设计的特征工程和领域知识，短期内往往表现卓越；但长期来看，利用大规模计算和通用学习方法的系统，最终会碾压任何依赖人类先验知识的方法。

“创造力也不是例外。”萨顿说，“如果你试图用规则去定义什么是‘好的创意’，就等于给探索戴上了镣铐。真正具有颠覆性的发现，往往来自让算法自己学习什么才是好的，而不要告诉它应该怎么做。”

他以近期药物分子设计为例：传统方法依靠化学家经验筛选数十万候选分子，而AI模型通过数百万模拟实验自主发现了多个全新结构的候选药物，这些结构在化学家看来“不合常理”，却在实验中展现出惊人的疗效。萨顿评价：“这正是AI发现力量的缩影——它敢于去到人类不敢去、想不到的地方。”

对未来的展望：AI成为科学发现的加速器

当被问及AI在科学发现中的终极角色时，萨顿表现出审慎的乐观。他认为，在未来5年内，AI将广泛参与物理学、化学、生物学和数学中的理论发现过程。AI不仅是数据分析工具，更可能成为“自主提出假说并设计实验验证”的研究伙伴。

“想象一下，一个AI系统连续运行数万次模拟实验，从中发现了一条全新的物理定律——它不依赖任何人类直觉，纯粹从数据中涌现。这难道不是最令人激动的创造力吗？”萨顿还特别提到，这种模式的推广需要研究社区转变观念：要从“教AI做正确的事”转向“让AI自己学会什么事值得做”。

局限与责任：创造力需要边界吗？

不过，萨顿也提醒，AI的“盲目探索”有时会导致浪费性结果。强化学习面临探索与利用的经典困境——过多的随机探索可能效率低下，而过早利用已知策略则可能错过更好方案。如何设计高效的探索机制，仍是学术界的核心挑战。

同时，萨顿承认创造力本身需要被引导。“我们不希望AI为了发现一个有趣的新化学反应而设计出恐怖分子想要的物质，或者为了在博弈中获胜而采取欺骗策略。给创造力加上伦理边界，是人类不可回避的责任。”

结语：共舞而非对抗

访谈最后，萨顿用了一个比喻总结AI与人类在创造力上的关系：“人类善于提出有意义的问题，AI善于找到出人意料的答案。就像爱因斯坦说过，想象力比知识更重要。但如果让AI的‘计算想象力’与人类的‘目标想象力’结合在一起，我们将迎来一个前所未有的发现时代。这并非竞争，而是一场伟大的共舞。”

作为强化学习领域的奠基人，萨顿的观点无疑为正处于热度巅峰的AI创造力话题注入了冷静而深刻的思考：真正的创新，从来都不是复制已有之物，而是勇敢地踏入未知。

创造力源于探索，而非模仿

“苦涩的教训”：通用方法的力量

对未来的展望：AI成为科学发现的加速器

局限与责任：创造力需要边界吗？

结语：共舞而非对抗

相关阅读