让 AI 自己改真实代码,2023年底它只能搞定2%的题,两年半后做到了93.9%。
就是这条曲线,让 Anthropic 的联合创始人 Jack Clark 下了一个连他自己都不太情愿的判断。
我最近在把 AI 圈这些大佬的公开观点一个个过一遍,过到 Clark 这一篇,停了一会儿。他不是那种张口就喊「要变天了」的加速派,他是 Anthropic 管政策的人,再往前是 OpenAI 的政策总监,平时写一份叫 Import AI 的周刊,订阅的人很多。说话一向谨慎。
就是这么个谨慎的人,在5月初的周刊里写下了一句:到2028年底,有60%以上的概率,会出现「无人参与的 AI 研发」。
说人话,就是出现一个强到这个地步的 AI——你对它说「造一个比你更强的版本出来」,它真的就自己跑去把下一代 AI 给造出来了,全程不用人插手。如果非要他给2027年一个数,他说30%。
他自己加了一句:这是一个我不情愿持有的判断,因为它的含义太大了。还有一句,我不确定社会准备好了。
很多人看到这种话第一反应是,又来了,大佬卖焦虑。但真正值得停下来的,不是这个吓人的结论,是他凭什么这么说。
他给的不是哲学,不是「我有种预感」,是一条一条的曲线。
这里得先说清楚一个词,叫基准(benchmark)。说白了就是给 AI 出的一套标准化考题,固定题目、固定打分,谁来考都用同一张卷子,不同的模型之间才比得出高下。
Clark 拿出来最硬的一张卷子,叫 SWE-Bench。
这套题不是脑筋急转弯,是真活儿。它从 GitHub 上扒了一堆真实的程序 bug,把整个项目的代码丢给 AI,告诉它「这儿有个问题,你去改」。AI 得读懂这一大坨代码,跨好几个文件去理解、去改,最后改完还得能跑通项目原本就写好的那些测试,才算这道题做对了。这是程序员每天在干的事,不是写个一百行的小程序那么简单。
2023年底这套题刚出来的时候,当时最好的模型,做对约2%。
到2026年4月,最强的模型,做对93.9%。
两年半,从2%到将近94%。这张卷子基本被做满了。
不只这一张。AI 能一口气干完的活,从原来的几十秒,涨到现在的十几个小时;让 AI 去复现一篇学术论文的实验,从头跑通别人写的研究,这种题的得分从21.5%涨到了95.5%。
注意,这几条都不是聊天、写文案这种花活,全是「做出 AI 的人每天在干的工程活」——写代码、跑实验、调模型。AI 越来越会干的,恰恰是造它自己的那门手艺。这才是 Clark 那个判断的地基:当一个东西越来越擅长制造它自己,那个临界点就不远了。
Clark 老实,他也指出了 AI 还不行的地方。比如让 AI 自己去微调、训练出一个模型来,这件事它现在只能做到人类水平的一半左右。还差着。这一点我反而更信他了——一个只报喜的人不可信,一个连「这块我还没做到」都摊开给你看的人,才值得多听两句。
重点来了。
把一张卷子做满,听起来是好事,其实是个危险信号。
为什么?因为一套考题是有满分上限的。当一个模型逼近天花板,这张卷子就废了,它再也分不出谁比谁更强。不是 AI 的能力到顶了,是我们的尺子用尽了。我们手里那把用来量它的尺子,不够长了。
Clark 举了个特别能说明问题的例子。有个老牌的图像识别基准叫 ImageNet,里面大概6%的标注本身就是错的、或者有歧义。所以任何模型在那张卷子上,都不可能真的超过约94%,剩下那点分,是卷子自己的毛病,不是 AI 不行。
你品品这个意思。我们能造出来的最难的考题,被它做满了。它再往上走,我们看不见了,量不出来了。
我打个不太严谨的比方。这就像你带一个徒弟。一开始你出题考他,慢慢地,你能想到的题他全会了。再往后,你已经没本事出一道能难住他的题了。那个时候,问题就不是「他还会不会更强」,而是「他到底强到哪儿了,你已经不知道了」。
Clark 真正担心的那一层,比这还深一点。他说,今天我们用来管住 AI、让它别跑偏的那套技术(行话叫对齐),很可能在「AI 自己造 AI」这种递归式的自我升级里失效。原因很简单:被监督的那个,变得比监督它的人和系统聪明得多。徒弟比师父强太多了,师父这时候还怎么教、怎么管呢?
这就是「无人参与的 AI 研发」真正让人后背发凉的地方。不是 AI 会写代码这件事本身,是这个圈一旦闭上,人就被甩在外面了。
这个老话题其实有个名字,叫「智能大跃升」(英文里叫 intelligence explosion),几十年前就有人聊过。但过去都是科幻和哲学层面的空想。这回不一样的地方在于,是一家前沿大厂的联合创始人,拿着公开的真实数据,给它标了个概率、画了条时间线。所以圈里反应特别大,有人当成「快了快了」的实锤,有人当成内部人难得的一次说真话,也有安全派直接激烈反驳的。吵得挺凶。
说回 Clark 这个人。我对他的判断是这样:他读曲线的功夫,值得信;他给的那个具体数字,我留个心眼。
为什么留心眼。Anthropic 这家公司整套的故事就是——AI 又强又危险,所以你得把它交给我们这种最在乎安全的人来造。这个叙事本身,跟「AI 强到能自己造自己」是同一个方向的。后来 Anthropic 又被报道在推进上市,时间上凑得挺巧,外头就有人嘀咕,这话里有没有给自家品牌站台的成分。
他对、还是质疑的人对,我都不替谁打包票,这种事本来也没人能打包票。我只说一句:信他读硬证据的方法,别照单全收他报出来的那个60%。一个屁股决定脑袋的位置,和一条两年半从2%涨到94%的真实曲线,是两回事。
往后再刷到「AI 几年内要怎样怎样」的预测,别急着信、也别急着骂,先看一眼它拿什么来撑:是「要变天了」「彻底改写一切」这种形容词堆出来的,还是像 Clark 这样,给你具体的卷子、具体的数字、具体的年份,还顺带告诉你哪块他自己也没把握。前者听个响就行,后者值得你认真对待。
再顺手多看一眼:说这话的人,站在什么位置上,他这么说对他有没有好处。
把这两条捏在手里,你看 AI 新闻的眼光,跟以前就不太一样了。
到2028年底,「AI 自己造出下一代 AI」这事,你觉得真会发生吗?你站 Clark 这60%,还是觉得他想多了?评论里聊聊。
#马力的AI知识分享#
#马力在记录AI领域500位大佬的分享#
发布于 北京
