菲尔兹奖得主陶哲轩对AI时代数学研究范式的深度反思
---
一、反直觉的科研环境洞察:「孤独扼杀创造力」
陶哲轩在普林斯顿高等研究院(IAS)的无干扰纯研究环境反而导致灵感枯竭,甚至沉迷上网摸鱼。这让他得出反常识结论:
- 数学家恰恰需要生活中的琐事和"低效"的偶然互动(走廊偶遇、咖啡间闲聊、图书馆翻阅时的意外发现)来激发想法
- 完全「日程化」的远程协作看似高效,实则杀死了科研必需的随机性
---
二、科学发现的本质:不是灵光乍现,而是「数据+试错+叙事」
通过开普勒发现行星运动三定律的案例,陶哲轩解构了科学发现的真实过程:
- 假说生成不等于瓶颈:开普勒尝试了柏拉图立体、圆形轨道、椭圆轨道等无数错误理论,LLM完全可以模拟这种试错
- 数据质量决定成败:第谷·布拉赫的高精度数据(误差角分级别)是关键,若数据噪声大,椭圆与圆形的区别会被淹没
- 科学必须会「讲故事」:哥白尼理论最初精度不如托勒密,但简洁性胜出;达尔文的《物种起源》用自然语言说服了世界,而牛顿的拉丁文和保密阻碍了传播。「说服力」是强化学习无法量化的核心能力
---
三、AI对数学的「双面影响」:广度革命 vs 深度瓶颈
1. 当前AI的能力边界(基于埃尔德什问题集实测)
- 已摘完「低垂果实」:AI解决了1100个问题中的50个(几乎无文献积累的问题),通过组合冷门技术实现
- 成功率仅1-2%:对任意给定难题,AI成功率极低,依赖大规模并发尝试后筛选成功案例
- 缺乏「局部进展」能力:AI像「弹跳机器人」——要么成功翻越墙壁,要么失败;但不会抓住支撑点、停在那里、积累局部认知再往上爬
2. 人机协作的新范式
- 互补性:AI擅长广度(并行尝试千种方法),人类擅长深度(系统性累积、识别中间里程碑)
- 论文生产的变化:AI让论文更「丰富」(更多代码、图像、文献综述),但不一定更「深刻」——核心难题的解决速度并未提升
- 形式化证明(Lean)的价值:AI生成的庞大证明可通过Lean拆解,人类/AI可识别关键引理、进行「消融实验」、重构叙事
3. 评估危机
- 生成成本趋近于零,验证成为瓶颈:AI可瞬间生成千种理论,但人类同行评审已不堪重负,期刊被AI投稿淹没
- 需要「天文学家的视角」:建议用数据分析(引用模式、会议提及频率、措辞变化)来识别真正有潜力的论文,而非仅靠专家直觉
---
四、对「AI解决黎曼猜想」的理性预判
- 两种可能:1. 失望型:AI给出类似四色定理的纯计算证明(海量情形枚举),缺乏概念洞见
2. 协作型:通过生成ζ函数的百万变体+AI数据分析,发现跨领域新联系,转化为人类可理解的新数学
- Lean的后处理价值:即使AI给出「汇编代码式」的不可读证明,形式化系统允许人类提取、重构关键构造,转化为可复用的数学洞察
---
五、给下一代科研人的生存策略
- 范式转换:从「深度优先」转向「广度+深度」结合,利用AI处理常规技术验证(已占数学工作的相当比例),人类专注「孤立的硬骨头」
- 保持「狐狸」属性:陶哲轩自认为是「狐狸」(广度型),与「刺猬」(深度型)合作;建议保留跨学科视野,通过写博客记录学习(防止「理解了又失去」)
- 适应性心态:传统数学教育(拿PhD再做前沿)可能被颠覆,高中生借助AI和Lean也能做出实质贡献;既要打牢基础,又要对新范式保持开放
---
六、核心结论
「人类+AI」的混合模式将长期主导数学界,而非AI完全取代人类。数学不会消亡,会像基因组学一样转向新尺度(从个体到生态)。变革不可避免,但科学的「社会属性」(讲故事、说服、建立共识)将始终是属于人类的核心领地。
发布于 四川
