Aletheia攻克数学难题

谷歌 DeepMind 的 AI 智能体 Aletheia 在首届 FirstProof 数学挑战赛中实现重大突破，零人工干预下自主攻克 10 道世界级未解数学难题中的 6 道，成绩远超其他 AI 和人类团队。

其解法还获出题数学家认证，被认为含金量超去年拿下的 IMO 金牌。

Aletheia 基于 Gemini 3 DeepThink 打造，独创生成者与验证者双系统，能自主推演并规避幻觉问题，解不出的题目会直接提示而非编造答案，攻克最难的 P7 题时耗费了远超以往的算力，还能灵活运用多种深奥数学定理。

此次竞赛的题目均为顶尖数学家的未公开科研难题，而此前 AI 已快速突破 FrontierMath 评测基准，倒逼 Epoch AI 推出更难的未解决数学题库。

数学界对这一成果反应不一，天才数学家陶哲轩更是直言 AI 已成自己的 “初级合著者”，认为 AI 能助力数学研究实现大样本普查，承担繁琐计算，还能挖掘人类无暇顾及的问题，重塑传统研究范式。

目前 FirstProof 团队已官宣将推出难度更高的第二轮挑战赛，AI 在数学科研领域的快速突破，也让人类开始思考其与数学研究的未来融合模式。