被誉为“强化学习之父”的加拿大计算机科学家理查德·萨顿(Rich Sutton)近日在一次学术访谈中,就人工智能的创造力与科学发现议题发表了一系列深刻见解。这位阿尔伯塔大学教授、DeepMind名誉科学家一针见血地指出:“AI的真正创造力,不在于模仿人类,而在于通过持续的探索发现人类从未想到的答案。”
创造力源于探索,而非模仿
萨顿认为,当前公众对AI创造力的理解普遍存在误区。很多人期待AI像人类艺术家一样“灵光一现”,或者像诗人那样遣词造句。但萨顿强调,AI创造力更本质的体现是在未知空间中通过试错找到高效的新策略——这正是强化学习最擅长的领域。
“创造力不是凭空产生的灵感,而是对可能性空间的系统性探索。”萨顿在访谈中举例说明,DeepMind开发的AlphaGo在对弈中走出了人类棋谱中从未出现的“第37手”,后来被职业棋手赞誉为“千古名局”。这一发现并非通过模仿人类高手,而是通过数百万次自我对弈、不断积累奖励信号后涌现的结果。
“人类棋手被数百年的经验束缚,而AI不受此限。它发现了围棋世界里一条从未被走过的路,这就是发现——一种纯粹的、计算驱动的创造。”萨顿强调,这种“发现型创造力”将极大拓展人类认知的边界。
“苦涩的教训”:通用方法的力量
在谈及AI如何实现创造性发现时,萨顿重提了他2019年那篇引发学界巨大回响的《苦涩的教训》。他指出,AI研究史上反复出现的规律是:依靠人工精心设计的特征工程和领域知识,短期内往往表现卓越;但长期来看,利用大规模计算和通用学习方法的系统,最终会碾压任何依赖人类先验知识的方法。
“创造力也不是例外。”萨顿说,“如果你试图用规则去定义什么是‘好的创意’,就等于给探索戴上了镣铐。真正具有颠覆性的发现,往往来自让算法自己学习什么才是好的,而不要告诉它应该怎么做。”
他以近期药物分子设计为例:传统方法依靠化学家经验筛选数十万候选分子,而AI模型通过数百万模拟实验自主发现了多个全新结构的候选药物,这些结构在化学家看来“不合常理”,却在实验中展现出惊人的疗效。萨顿评价:“这正是AI发现力量的缩影——它敢于去到人类不敢去、想不到的地方。”
对未来的展望:AI成为科学发现的加速器
当被问及AI在科学发现中的终极角色时,萨顿表现出审慎的乐观。他认为,在未来5年内,AI将广泛参与物理学、化学、生物学和数学中的理论发现过程。AI不仅是数据分析工具,更可能成为“自主提出假说并设计实验验证”的研究伙伴。
“想象一下,一个AI系统连续运行数万次模拟实验,从中发现了一条全新的物理定律——它不依赖任何人类直觉,纯粹从数据中涌现。这难道不是最令人激动的创造力吗?”萨顿还特别提到,这种模式的推广需要研究社区转变观念:要从“教AI做正确的事”转向“让AI自己学会什么事值得做”。
局限与责任:创造力需要边界吗?
不过,萨顿也提醒,AI的“盲目探索”有时会导致浪费性结果。强化学习面临探索与利用的经典困境——过多的随机探索可能效率低下,而过早利用已知策略则可能错过更好方案。如何设计高效的探索机制,仍是学术界的核心挑战。
同时,萨顿承认创造力本身需要被引导。“我们不希望AI为了发现一个有趣的新化学反应而设计出恐怖分子想要的物质,或者为了在博弈中获胜而采取欺骗策略。给创造力加上伦理边界,是人类不可回避的责任。”
结语:共舞而非对抗
访谈最后,萨顿用了一个比喻总结AI与人类在创造力上的关系:“人类善于提出有意义的问题,AI善于找到出人意料的答案。就像爱因斯坦说过,想象力比知识更重要。但如果让AI的‘计算想象力’与人类的‘目标想象力’结合在一起,我们将迎来一个前所未有的发现时代。这并非竞争,而是一场伟大的共舞。”
作为强化学习领域的奠基人,萨顿的观点无疑为正处于热度巅峰的AI创造力话题注入了冷静而深刻的思考:真正的创新,从来都不是复制已有之物,而是勇敢地踏入未知。