菲尔兹奖得主陶哲轩谈AI数学研究

菲尔兹奖得主陶哲轩对AI时代数学研究范式的深度反思

---

一、反直觉的科研环境洞察：「孤独扼杀创造力」
陶哲轩在普林斯顿高等研究院（IAS）的无干扰纯研究环境反而导致灵感枯竭，甚至沉迷上网摸鱼。这让他得出反常识结论：
- 数学家恰恰需要生活中的琐事和"低效"的偶然互动（走廊偶遇、咖啡间闲聊、图书馆翻阅时的意外发现）来激发想法
- 完全「日程化」的远程协作看似高效，实则杀死了科研必需的随机性

---

二、科学发现的本质：不是灵光乍现，而是「数据+试错+叙事」
通过开普勒发现行星运动三定律的案例，陶哲轩解构了科学发现的真实过程：
- 假说生成不等于瓶颈：开普勒尝试了柏拉图立体、圆形轨道、椭圆轨道等无数错误理论，LLM完全可以模拟这种试错
- 数据质量决定成败：第谷·布拉赫的高精度数据（误差角分级别）是关键，若数据噪声大，椭圆与圆形的区别会被淹没
- 科学必须会「讲故事」：哥白尼理论最初精度不如托勒密，但简洁性胜出；达尔文的《物种起源》用自然语言说服了世界，而牛顿的拉丁文和保密阻碍了传播。「说服力」是强化学习无法量化的核心能力

---

三、AI对数学的「双面影响」：广度革命 vs 深度瓶颈
1. 当前AI的能力边界（基于埃尔德什问题集实测）
- 已摘完「低垂果实」：AI解决了1100个问题中的50个（几乎无文献积累的问题），通过组合冷门技术实现
- 成功率仅1-2%：对任意给定难题，AI成功率极低，依赖大规模并发尝试后筛选成功案例
- 缺乏「局部进展」能力：AI像「弹跳机器人」——要么成功翻越墙壁，要么失败；但不会抓住支撑点、停在那里、积累局部认知再往上爬
2. 人机协作的新范式
- 互补性：AI擅长广度（并行尝试千种方法），人类擅长深度（系统性累积、识别中间里程碑）
- 论文生产的变化：AI让论文更「丰富」（更多代码、图像、文献综述），但不一定更「深刻」——核心难题的解决速度并未提升
- 形式化证明（Lean）的价值：AI生成的庞大证明可通过Lean拆解，人类/AI可识别关键引理、进行「消融实验」、重构叙事
3. 评估危机
- 生成成本趋近于零，验证成为瓶颈：AI可瞬间生成千种理论，但人类同行评审已不堪重负，期刊被AI投稿淹没
- 需要「天文学家的视角」：建议用数据分析（引用模式、会议提及频率、措辞变化）来识别真正有潜力的论文，而非仅靠专家直觉

---

四、对「AI解决黎曼猜想」的理性预判
- 两种可能：1. 失望型：AI给出类似四色定理的纯计算证明（海量情形枚举），缺乏概念洞见
2. 协作型：通过生成ζ函数的百万变体+AI数据分析，发现跨领域新联系，转化为人类可理解的新数学
- Lean的后处理价值：即使AI给出「汇编代码式」的不可读证明，形式化系统允许人类提取、重构关键构造，转化为可复用的数学洞察

---

五、给下一代科研人的生存策略
- 范式转换：从「深度优先」转向「广度+深度」结合，利用AI处理常规技术验证（已占数学工作的相当比例），人类专注「孤立的硬骨头」
- 保持「狐狸」属性：陶哲轩自认为是「狐狸」（广度型），与「刺猬」（深度型）合作；建议保留跨学科视野，通过写博客记录学习（防止「理解了又失去」）
- 适应性心态：传统数学教育（拿PhD再做前沿）可能被颠覆，高中生借助AI和Lean也能做出实质贡献；既要打牢基础，又要对新范式保持开放

---

六、核心结论
「人类+AI」的混合模式将长期主导数学界，而非AI完全取代人类。数学不会消亡，会像基因组学一样转向新尺度（从个体到生态）。变革不可避免，但科学的「社会属性」（讲故事、说服、建立共识）将始终是属于人类的核心领地。

发布于四川