马力AI和商业思维
26-06-29 09:12 微博认证:知群 CEO 微博新知博主

同样用 AI,有人越用越像被它牵着走,陶哲轩却能借 AI 工具和一群协作者一起,把一个拖了几十年的数学难题往前推。差别不在模型,在他给 AI 派的活和事后那道工序。

陶哲轩是谁不用多说,菲尔兹奖得主,公认在世最强的几个数学家之一。这两年他成了用 AI 做研究最积极的人之一,博客里一篇篇记自己怎么把 AI 接进数学工作。我最近在系统记录这个领域里大佬们的分享,翻到他这些,最大的感受不是「连他都用 AI 了」,而是他用 AI 的方式,恰恰跟大多数人相反。

大多数人是把 AI 当一个更聪明的答案机:问它要结论,它给得顺,就信了。陶哲轩不是。他对 AI 的判断很冷静,早先他把 OpenAI 的 o1 模型比作「一个平庸但不至于完全不行的研究生」。你想想,让你带一个这样的研究生,你会把活全交给他、看都不看就署名发出去吗?不会吧。陶哲轩就是这么用 AI 的:派活给它,但每一步都自己把着关。

他用得好,不是因为他的 AI 比你的强。用的就是同一批模型。他用得好,是因为他从来不真信 AI,事后那道验证工序一道都不省。

这套做法,我把它拆成五步(其实就是五道关卡,每道都是人在把关),普通人做研究、写方案、做任何需要严谨的推理,都能照着学。说白了,就是怎么让 AI 当一个靠谱的副驾。它帮你看路、帮你算、帮你提醒,但方向盘始终在你手里,车往哪开、最后踩不踩刹车,你说了算。

第一步,让 AI 提猜想、给方向、干那些又长又机械的活。

这是 AI 最该被用上的地方,也是陶哲轩用得最狠的地方。一个思路值不值得深入,他先让 AI 去测一下、跑个模拟、做一段又长又枯燥的计算,自己不急着上手。他还说过一句让做研究的人很有共鸣的话:以前一次文献检索,翻数据库、翻图书馆,要花几个小时甚至几个礼拜;现在一句提示词,几分钟就能拿到一张相关论文的地图。

落到你身上也一样。写方案前,先让 AI 帮你列出可能的几条路子、把背景资料扒一遍、把零散数据先算成表。这一步它干得又快又不嫌烦。关键是你要清楚,这一步它给的是「线索」,不是「结论」。

第二步反着来,主动让它找反例,让它来推翻你。

这条是大多数人完全没想到的。我们用 AI,几乎都是让它支持自己:帮我论证这个观点、帮我把这个方案写得更有说服力。但顺着数学家这套验证的思路,可以反过来用 AI:不是让它帮你站台,而是让它来推翻你——去挑漏洞,去找那个能把结论顶翻的反例和边界情形。做数学的人都知道,一个猜想真不真,往往不是看你举了多少正面例子,而是看它扛不扛得住一个反例。

这个思路对普通人太有用了。你写完一份方案,别只让 AI 夸它好,要让它当对手:这个方案最可能在哪一步崩?有没有一种情况会让结论完全反过来?竞争对手会怎么挑它的毛病?你以为 AI 只会顺着你说,其实你让它当反方,它一样很能挑刺,就看你敢不敢让它挑你自己。

第三条最硬,把关键结论逼成「可以机械验证」的东西,别要一段读着顺的文字。

这是整套做法里最硬的一条。AI 有个毛病,陶哲轩说得很准:它能产出看上去很漂亮、却藏着薄弱推理的论证。读着特别顺,环环相扣,但中间某一步其实是糊弄过去的,你光读是读不出来的。

他的办法是用 Lean。Lean 是一个证明验证工具,会一行一行地检查一个数学证明,逻辑上有半点不严的地方就过不去,用他的说法,这能「让 AI 老实」。他和 ChatGPT 一起,把一个反例证明在 Lean 里完整形式化,前后摊在两天里、他说自己实际花进去的注意力也就两三个小时,当时生成的 Lean 证明他说约1125行。他把这叫一份「靠感觉拼出来」的证明,里头不少篇幅是在证一些本该一句话带过的琐碎东西,可只要 Lean 验过了,就意味着每一步逻辑都对,一步都没赖。

我得说句实话,Lean 这种东西普通人学不来,那是专业数学家的工具。但这一步的内核,普通人完全能搬:别让 AI 给你一段「听着对」的文字,要让它给你「能逐条核对」的东西。让它把推理拆成一步步、每步可以单独检查的清单;让它写能直接跑、跑出来对不对一目了然的代码;让它给出处,给到你能回去查的那一条。把「读着顺」换成「能验」,AI 糊弄的空间一下就小了。

第四步最费人,逐条查定义、查出处,每个名词、每条引用都回原文核一遍。

陶哲轩攻一道难题时,AI 帮他把零散结果拼成了一份看起来连贯的证明,他没有就这么收下。他自己回头把别人那几篇关键论文的论证独立重做了一遍,数据也是自己一点点整理、反复试,才看出里头的规律。AI 拼出来的东西,他当线索,不当定论。

普通人这一步最容易偷懒。AI 引了一篇研究、抛了一个数据、用了一个听着很专业的概念,我们常常就照单全收了。但 AI 编起出处来脸不红心不跳——一个根本不存在的论文标题、一个凑出来的数字,它能写得跟真的一样。所以凡是要拿去做判断、做决定的关键信息,名词回去查清楚是什么意思,引用回去核到底有没有这回事。越要紧的,越得自己过一遍眼。

最后一步也是底线,拍板的一定是人。

这是前面四条的总开关。陶哲轩讲过 AI 和研究生一个最关键的区别:研究生会学习。你纠正一个研究生,他记住了,下次就改了;AI 被你纠正,当下好像也调整了,过一会儿又退回老路去。它不会真的成长,每次基本都是从头开始。再加上它本来就会一本正经地胡说。所以结论这一步,绝不能交给它。

他还有句话我觉得说到了根上:AI 擅长把数十亿条数据收敛成一个好答案,而人擅长从十个观察里做出一个真正有灵感的猜测。这两件事不是一回事。AI 替你把海量的活干了,但那个「拍板」的判断、那个「我觉得就是这样」的直觉,是你的事,也只能是你的事。

这套心法跟用哪家模型没关系。你手边是 DeepSeek、Kimi、豆包还是通义,照样能用——它针对的是「人怎么跟 AI 配合做严谨的事」,不是哪个模型的独门用法。

回头看陶哲轩,他现在的判断是,AI 在数学上「省下的时间,比浪费的时间多」。注意,是「省下的多」,不是「全交给它」。他敢这么用,前提正是那五道工序一道没落。

很多人学他,只学了前半句「陶哲轩都在用 AI」,把活痛快地甩出去;没学后半句——他事后把每一步都自己验了一遍。可恰恰是后半句,才是他用得好的原因。

AI 再强,也是个副驾。开车的,还得是你。

#马力的AI知识分享#
#马力在记录AI领域500位大佬的分享#

发布于 北京