Anthropic预测AI自造

让 AI 自己改真实代码，2023年底它只能搞定2%的题，两年半后做到了93.9%。

就是这条曲线，让 Anthropic 的联合创始人 Jack Clark 下了一个连他自己都不太情愿的判断。

我最近在把 AI 圈这些大佬的公开观点一个个过一遍，过到 Clark 这一篇，停了一会儿。他不是那种张口就喊「要变天了」的加速派，他是 Anthropic 管政策的人，再往前是 OpenAI 的政策总监，平时写一份叫 Import AI 的周刊，订阅的人很多。说话一向谨慎。

就是这么个谨慎的人，在5月初的周刊里写下了一句：到2028年底，有60%以上的概率，会出现「无人参与的 AI 研发」。

说人话，就是出现一个强到这个地步的 AI——你对它说「造一个比你更强的版本出来」，它真的就自己跑去把下一代 AI 给造出来了，全程不用人插手。如果非要他给2027年一个数，他说30%。

他自己加了一句：这是一个我不情愿持有的判断，因为它的含义太大了。还有一句，我不确定社会准备好了。

很多人看到这种话第一反应是，又来了，大佬卖焦虑。但真正值得停下来的，不是这个吓人的结论，是他凭什么这么说。

他给的不是哲学，不是「我有种预感」，是一条一条的曲线。

这里得先说清楚一个词，叫基准（benchmark）。说白了就是给 AI 出的一套标准化考题，固定题目、固定打分，谁来考都用同一张卷子，不同的模型之间才比得出高下。

Clark 拿出来最硬的一张卷子，叫 SWE-Bench。

这套题不是脑筋急转弯，是真活儿。它从 GitHub 上扒了一堆真实的程序 bug，把整个项目的代码丢给 AI，告诉它「这儿有个问题，你去改」。AI 得读懂这一大坨代码，跨好几个文件去理解、去改，最后改完还得能跑通项目原本就写好的那些测试，才算这道题做对了。这是程序员每天在干的事，不是写个一百行的小程序那么简单。

2023年底这套题刚出来的时候，当时最好的模型，做对约2%。

到2026年4月，最强的模型，做对93.9%。

两年半，从2%到将近94%。这张卷子基本被做满了。

不只这一张。AI 能一口气干完的活，从原来的几十秒，涨到现在的十几个小时；让 AI 去复现一篇学术论文的实验，从头跑通别人写的研究，这种题的得分从21.5%涨到了95.5%。

注意，这几条都不是聊天、写文案这种花活，全是「做出 AI 的人每天在干的工程活」——写代码、跑实验、调模型。AI 越来越会干的，恰恰是造它自己的那门手艺。这才是 Clark 那个判断的地基：当一个东西越来越擅长制造它自己，那个临界点就不远了。

Clark 老实，他也指出了 AI 还不行的地方。比如让 AI 自己去微调、训练出一个模型来，这件事它现在只能做到人类水平的一半左右。还差着。这一点我反而更信他了——一个只报喜的人不可信，一个连「这块我还没做到」都摊开给你看的人，才值得多听两句。

重点来了。

把一张卷子做满，听起来是好事，其实是个危险信号。

为什么？因为一套考题是有满分上限的。当一个模型逼近天花板，这张卷子就废了，它再也分不出谁比谁更强。不是 AI 的能力到顶了，是我们的尺子用尽了。我们手里那把用来量它的尺子，不够长了。

Clark 举了个特别能说明问题的例子。有个老牌的图像识别基准叫 ImageNet，里面大概6%的标注本身就是错的、或者有歧义。所以任何模型在那张卷子上，都不可能真的超过约94%，剩下那点分，是卷子自己的毛病，不是 AI 不行。

你品品这个意思。我们能造出来的最难的考题，被它做满了。它再往上走，我们看不见了，量不出来了。

我打个不太严谨的比方。这就像你带一个徒弟。一开始你出题考他，慢慢地，你能想到的题他全会了。再往后，你已经没本事出一道能难住他的题了。那个时候，问题就不是「他还会不会更强」，而是「他到底强到哪儿了，你已经不知道了」。

Clark 真正担心的那一层，比这还深一点。他说，今天我们用来管住 AI、让它别跑偏的那套技术（行话叫对齐），很可能在「AI 自己造 AI」这种递归式的自我升级里失效。原因很简单：被监督的那个，变得比监督它的人和系统聪明得多。徒弟比师父强太多了，师父这时候还怎么教、怎么管呢？

这就是「无人参与的 AI 研发」真正让人后背发凉的地方。不是 AI 会写代码这件事本身，是这个圈一旦闭上，人就被甩在外面了。

这个老话题其实有个名字，叫「智能大跃升」（英文里叫 intelligence explosion），几十年前就有人聊过。但过去都是科幻和哲学层面的空想。这回不一样的地方在于，是一家前沿大厂的联合创始人，拿着公开的真实数据，给它标了个概率、画了条时间线。所以圈里反应特别大，有人当成「快了快了」的实锤，有人当成内部人难得的一次说真话，也有安全派直接激烈反驳的。吵得挺凶。

说回 Clark 这个人。我对他的判断是这样：他读曲线的功夫，值得信；他给的那个具体数字，我留个心眼。

为什么留心眼。Anthropic 这家公司整套的故事就是——AI 又强又危险，所以你得把它交给我们这种最在乎安全的人来造。这个叙事本身，跟「AI 强到能自己造自己」是同一个方向的。后来 Anthropic 又被报道在推进上市，时间上凑得挺巧，外头就有人嘀咕，这话里有没有给自家品牌站台的成分。

他对、还是质疑的人对，我都不替谁打包票，这种事本来也没人能打包票。我只说一句：信他读硬证据的方法，别照单全收他报出来的那个60%。一个屁股决定脑袋的位置，和一条两年半从2%涨到94%的真实曲线，是两回事。

往后再刷到「AI 几年内要怎样怎样」的预测，别急着信、也别急着骂，先看一眼它拿什么来撑：是「要变天了」「彻底改写一切」这种形容词堆出来的，还是像 Clark 这样，给你具体的卷子、具体的数字、具体的年份，还顺带告诉你哪块他自己也没把握。前者听个响就行，后者值得你认真对待。

再顺手多看一眼：说这话的人，站在什么位置上，他这么说对他有没有好处。

把这两条捏在手里，你看 AI 新闻的眼光，跟以前就不太一样了。

到2028年底，「AI 自己造出下一代 AI」这事，你觉得真会发生吗？你站 Clark 这60%，还是觉得他想多了？评论里聊聊。

#马力的AI知识分享#
#马力在记录AI领域500位大佬的分享#

发布于北京