陶哲轩用AI五步法

同样用 AI，有人越用越像被它牵着走，陶哲轩却能借 AI 工具和一群协作者一起，把一个拖了几十年的数学难题往前推。差别不在模型，在他给 AI 派的活和事后那道工序。

陶哲轩是谁不用多说，菲尔兹奖得主，公认在世最强的几个数学家之一。这两年他成了用 AI 做研究最积极的人之一，博客里一篇篇记自己怎么把 AI 接进数学工作。我最近在系统记录这个领域里大佬们的分享，翻到他这些，最大的感受不是「连他都用 AI 了」，而是他用 AI 的方式，恰恰跟大多数人相反。

大多数人是把 AI 当一个更聪明的答案机：问它要结论，它给得顺，就信了。陶哲轩不是。他对 AI 的判断很冷静，早先他把 OpenAI 的 o1 模型比作「一个平庸但不至于完全不行的研究生」。你想想，让你带一个这样的研究生，你会把活全交给他、看都不看就署名发出去吗？不会吧。陶哲轩就是这么用 AI 的：派活给它，但每一步都自己把着关。

他用得好，不是因为他的 AI 比你的强。用的就是同一批模型。他用得好，是因为他从来不真信 AI，事后那道验证工序一道都不省。

这套做法，我把它拆成五步（其实就是五道关卡，每道都是人在把关），普通人做研究、写方案、做任何需要严谨的推理，都能照着学。说白了，就是怎么让 AI 当一个靠谱的副驾。它帮你看路、帮你算、帮你提醒，但方向盘始终在你手里，车往哪开、最后踩不踩刹车，你说了算。

第一步，让 AI 提猜想、给方向、干那些又长又机械的活。

这是 AI 最该被用上的地方，也是陶哲轩用得最狠的地方。一个思路值不值得深入，他先让 AI 去测一下、跑个模拟、做一段又长又枯燥的计算，自己不急着上手。他还说过一句让做研究的人很有共鸣的话：以前一次文献检索，翻数据库、翻图书馆，要花几个小时甚至几个礼拜；现在一句提示词，几分钟就能拿到一张相关论文的地图。

落到你身上也一样。写方案前，先让 AI 帮你列出可能的几条路子、把背景资料扒一遍、把零散数据先算成表。这一步它干得又快又不嫌烦。关键是你要清楚，这一步它给的是「线索」，不是「结论」。

第二步反着来，主动让它找反例，让它来推翻你。

这条是大多数人完全没想到的。我们用 AI，几乎都是让它支持自己：帮我论证这个观点、帮我把这个方案写得更有说服力。但顺着数学家这套验证的思路，可以反过来用 AI：不是让它帮你站台，而是让它来推翻你——去挑漏洞，去找那个能把结论顶翻的反例和边界情形。做数学的人都知道，一个猜想真不真，往往不是看你举了多少正面例子，而是看它扛不扛得住一个反例。

这个思路对普通人太有用了。你写完一份方案，别只让 AI 夸它好，要让它当对手：这个方案最可能在哪一步崩？有没有一种情况会让结论完全反过来？竞争对手会怎么挑它的毛病？你以为 AI 只会顺着你说，其实你让它当反方，它一样很能挑刺，就看你敢不敢让它挑你自己。

第三条最硬，把关键结论逼成「可以机械验证」的东西，别要一段读着顺的文字。

这是整套做法里最硬的一条。AI 有个毛病，陶哲轩说得很准：它能产出看上去很漂亮、却藏着薄弱推理的论证。读着特别顺，环环相扣，但中间某一步其实是糊弄过去的，你光读是读不出来的。

他的办法是用 Lean。Lean 是一个证明验证工具，会一行一行地检查一个数学证明，逻辑上有半点不严的地方就过不去，用他的说法，这能「让 AI 老实」。他和 ChatGPT 一起，把一个反例证明在 Lean 里完整形式化，前后摊在两天里、他说自己实际花进去的注意力也就两三个小时，当时生成的 Lean 证明他说约1125行。他把这叫一份「靠感觉拼出来」的证明，里头不少篇幅是在证一些本该一句话带过的琐碎东西，可只要 Lean 验过了，就意味着每一步逻辑都对，一步都没赖。

我得说句实话，Lean 这种东西普通人学不来，那是专业数学家的工具。但这一步的内核，普通人完全能搬：别让 AI 给你一段「听着对」的文字，要让它给你「能逐条核对」的东西。让它把推理拆成一步步、每步可以单独检查的清单；让它写能直接跑、跑出来对不对一目了然的代码；让它给出处，给到你能回去查的那一条。把「读着顺」换成「能验」，AI 糊弄的空间一下就小了。

第四步最费人，逐条查定义、查出处，每个名词、每条引用都回原文核一遍。

陶哲轩攻一道难题时，AI 帮他把零散结果拼成了一份看起来连贯的证明，他没有就这么收下。他自己回头把别人那几篇关键论文的论证独立重做了一遍，数据也是自己一点点整理、反复试，才看出里头的规律。AI 拼出来的东西，他当线索，不当定论。

普通人这一步最容易偷懒。AI 引了一篇研究、抛了一个数据、用了一个听着很专业的概念，我们常常就照单全收了。但 AI 编起出处来脸不红心不跳——一个根本不存在的论文标题、一个凑出来的数字，它能写得跟真的一样。所以凡是要拿去做判断、做决定的关键信息，名词回去查清楚是什么意思，引用回去核到底有没有这回事。越要紧的，越得自己过一遍眼。

最后一步也是底线，拍板的一定是人。

这是前面四条的总开关。陶哲轩讲过 AI 和研究生一个最关键的区别：研究生会学习。你纠正一个研究生，他记住了，下次就改了；AI 被你纠正，当下好像也调整了，过一会儿又退回老路去。它不会真的成长，每次基本都是从头开始。再加上它本来就会一本正经地胡说。所以结论这一步，绝不能交给它。

他还有句话我觉得说到了根上：AI 擅长把数十亿条数据收敛成一个好答案，而人擅长从十个观察里做出一个真正有灵感的猜测。这两件事不是一回事。AI 替你把海量的活干了，但那个「拍板」的判断、那个「我觉得就是这样」的直觉，是你的事，也只能是你的事。

这套心法跟用哪家模型没关系。你手边是 DeepSeek、Kimi、豆包还是通义，照样能用——它针对的是「人怎么跟 AI 配合做严谨的事」，不是哪个模型的独门用法。

回头看陶哲轩，他现在的判断是，AI 在数学上「省下的时间，比浪费的时间多」。注意，是「省下的多」，不是「全交给它」。他敢这么用，前提正是那五道工序一道没落。

很多人学他，只学了前半句「陶哲轩都在用 AI」，把活痛快地甩出去；没学后半句——他事后把每一步都自己验了一遍。可恰恰是后半句，才是他用得好的原因。

AI 再强，也是个副驾。开车的，还得是你。

#马力的AI知识分享#
#马力在记录AI领域500位大佬的分享#

发布于北京