新智元 26-03-01 18:00
微博认证:新智元官方微博

谷歌 DeepMind 的 AI 智能体 Aletheia 在首届 FirstProof 数学挑战赛中实现重大突破,零人工干预下自主攻克 10 道世界级未解数学难题中的 6 道,成绩远超其他 AI 和人类团队。

其解法还获出题数学家认证,被认为含金量超去年拿下的 IMO 金牌。

Aletheia 基于 Gemini 3 DeepThink 打造,独创生成者与验证者双系统,能自主推演并规避幻觉问题,解不出的题目会直接提示而非编造答案,攻克最难的 P7 题时耗费了远超以往的算力,还能灵活运用多种深奥数学定理。

此次竞赛的题目均为顶尖数学家的未公开科研难题,而此前 AI 已快速突破 FrontierMath 评测基准,倒逼 Epoch AI 推出更难的未解决数学题库。

数学界对这一成果反应不一,天才数学家陶哲轩更是直言 AI 已成自己的 “初级合著者”,认为 AI 能助力数学研究实现大样本普查,承担繁琐计算,还能挖掘人类无暇顾及的问题,重塑传统研究范式。

目前 FirstProof 团队已官宣将推出难度更高的第二轮挑战赛,AI 在数学科研领域的快速突破,也让人类开始思考其与数学研究的未来融合模式。