老马自奋蹄
26-06-24 20:59 微博认证:用友集团CIO 副总裁 科技博主

陶哲轩:几周前 AI 已突破数学形式化临界点,正确证明的速度人类来不及审
菲尔兹奖得主陶哲轩公开表示,AI 生成形式化证明的速度已快到人类来不及审核,将这种现象称为"阻抗不匹配"。数学界正被 AI 生成的证明淹没,这一突破将深刻影响数学研究范式与教育模式。

事件核心背景
菲尔兹奖得主陶哲轩近期在社交平台分享了其主导的IEANTN(显式解析数论网络集成)项目的一线实践观察:在最近几周,AI 自动形式化技术突然跨过了关键临界点,数学证明的生成速度与人类消化速度之间出现了显著的 “阻抗不匹配”,这一变化正在深刻改变数学研究的原有节奏。
一、临界点的具体表现:效率从 “数周” 跃升至 “数小时”
陶哲轩的项目目标,是将解析数论领域大量技术性论文转化为 Lean 证明助手可自动校验的形式化代码,这类工作包含大量繁琐的数值验证、参数匹配,曾占据他数论研究至少 70% 的时间成本。
在 AI 介入前的传统模式下:
他会将单个引理拆分为独立任务对外发布,由社区志愿者认领完成;
单个人工形式化任务的完成周期通常需要数周;
人类提交的证明会自然追求简洁、高效与合理的抽象层次,便于审核与复用。
而跨过临界点后:
他发布的几乎每一个形式化任务,AI 都能在数小时内完成正确的形式化证明;
项目中长期存在的待解决任务队列被基本清空;
证明的正确性可由 Lean 等形式化工具自动验证,可靠性有充分保障。
二、“阻抗不匹配”:三环节的速度错位
陶哲轩将数学问题求解拆解为三个环环相扣的环节,AI 的介入让三个环节的效率出现了严重失衡,也就是他所说的 “阻抗失配”:
表格
环节 核心作用 当前效率主体 速度水平
证明生成 将猜想从 “未解决” 推进到 “有解”,产出完整推导过程 AI 大模型主导 极快(小时级)
证明验证 逐行校验逻辑正确性,确保证明无漏洞 形式化工具(Lean/Coq 等)自动完成 快(可全自动执行)
证明消化 理解证明深层结构、提炼可迁移方法论、融入学科知识体系 人类研究者 慢(依赖人类认知,无自动化方案)
AI 带来的核心矛盾不止是 “人类来不及审核”,更在于 AI 生成的证明天然存在 “正确但不优雅” 的特点:
AI 产出的形式化证明通常比人类手写版本长出数百行,存在大量冗余步骤;
很多引理没有被提炼到合适的抽象层级,更像 “能跑通的代码” 而非 “可阅读的数学证明”;
单个证明的臃肿看似影响有限,但累积起来会显著拖慢项目整体构建效率,且无法自动完成全局结构优化。
陶哲轩特别提到,这一现象其实呼应了 17 世纪帕斯卡的观察 —— 生成一份冗长的正确证明,远比生成一份简短的正确证明更容易,而 AI 技术把这个古老矛盾放大到了前所未有的程度。
三、陶哲轩的核心判断:最优自动化率不是 100%
基于一线实践,陶哲轩并未提出 “AI 将取代数学家” 的结论,反而明确了人机协作的边界:
自动化存在最优比例:最佳的自动化水平严格介于 0% 与 100% 之间。在每个研究尺度(单行推导、引理证明、完整定理)上,都需要保留足够的 “人在回路”,让研究者始终把握证明的整体结构。
过度自动化会反噬长期能力:如果完全依赖 AI 完成所有简单任务,研究者会逐渐丧失对证明全局的熟悉度,当遇到中等或高难度问题、AI 开始失效时,人类反而会因为不熟悉底层逻辑而更难排查和修复问题。
印证古德哈特定律:如果只以 “单步形式化速度” 作为衡量标准,过度优化这一指标,最终反而会损害 “构建完整、灵活、可演进的形式化数学体系” 这一长期目标36氪。
四、对数学领域的深层影响
研究范式的不可逆转变
数学家的核心工作将从 “做细节推导” 转向 “定顶层方向、搭证明框架、提炼数学思想”。大量重复性、技术性的逻辑补全与验证工作被 AI 承接,研究者可以将精力集中在猜想提出、理论构建等高价值创造性工作上。
知识生产的新命题
数学界将首次面对 “正确证明的产能远超知识消化能力” 的局面。如何对海量 AI 生成的证明进行精简、抽象、结构化整理,将其转化为可被领域吸收的共识性知识,会成为新的研究刚需。
数学教育的方向调整
以刷题、重复训练证明技巧为核心的传统培养模式价值会持续下降。未来的数学教育会更侧重培养数学直觉、结构思维、工具协作能力,以及 “理解证明为什么成立” 的深度认知,而非 “写出一个证明” 的执行能力。

发布于 北京