机器开始制造机器

孤独大脑：“机器开始制造机器：从自我改善到递归进化”

Anthropic 在报告中说：截至今年五月，其八成以上代码已由 AI 编写；人类工程师当下的代码产出量，约为两年前的八倍。这意味着，机器已开始制造机器。

报告还发现，Claude 的“研究判断”能力，比想象中更接近人类——而这一直被视为人类独有的能力。

由此引出当前 AI 的两个核心命题。

一、AI 的自我改进

即人类利用 AI 将 AI 打造得更强。模型可以飞速编写底层训练脚本、生成海量数据，甚至自动修复代码缺陷。这就像一位铁匠用手中的锤子，打出一把更称手的新锤子，次日打铁的效率显著提升——但决定权还在人类铁匠手中。

二、AI 的递归自我改进

想象一下，那把锤子开始自作主张，自行调控炉温、修改桌上的图纸，再开动机器锻造出一把“更擅长修改图纸”的锤子。下一把锤子诞生后立刻接管工坊，越改越快。当新一代模型接管、重投循环，改进者同时也成了被改进者。

二者的根本区别在于：演化的目标，究竟由谁设定？

其中的鸿沟，在于一种被称为“研究品味”与“大局观”的抽象特质。

从底层机制看，递归改进缺一个即时且可信的裁判。代码飞轮之所以转得动，是因为有廉价而密集的“可验证奖励”——代码敲下，编译运行，对错当场分明。

但“研究判断”没有这种信号：一条技术路径是否值得走，答案往往要等数月甚至数年。一旦失去外部真实的对错反馈，AI 的自我训练便会空转——自己出题、自己批卷、自己打满分，账面分数极高，能力却急剧退化。这叫“模型崩溃”。

更需警惕的是：一旦启动彻底的递归，一个极其微小的错置目标，经由代代相传，偏差会以指数级放大。

通往递归的路不像攀爬缓坡，更像在炉火上烧水：长久不见波澜，积累到某一临界温度，整壶水骤然沸腾。此谓“相变”。

Jack Clark 预测，2028 年底前出现完全自主递归的概率约有六成。这既需要底层算法的突破，也取决于人类是否“允许”。

一旦实现，未来的最强模型不再由人类心智写就，而是机器自我演化的产物。人类将无法读懂其内部的神经运作，只能观察其行为，推断其习性，为其划定边界。

那时，人类心智的价值将向两端收敛：一是追问意义的源头，二是在不确定的路口，凭直觉与大局观押下方向。其余的，交付机器。

机器正在飞速学习如何制造机器。

人类要守住的，是决定这个世界究竟该制造什么。

至于普通人会如何，这是个谜。

发布于上海