投行泰山
26-06-16 07:04 微博认证:财经博主

孤独大脑:“机器开始制造机器:从自我改善到递归进化”

Anthropic 在报告中说:截至今年五月,其八成以上代码已由 AI 编写;人类工程师当下的代码产出量,约为两年前的八倍。这意味着,机器已开始制造机器。

报告还发现,Claude 的“研究判断”能力,比想象中更接近人类——而这一直被视为人类独有的能力。

由此引出当前 AI 的两个核心命题。

一、AI 的自我改进

即人类利用 AI 将 AI 打造得更强。模型可以飞速编写底层训练脚本、生成海量数据,甚至自动修复代码缺陷。这就像一位铁匠用手中的锤子,打出一把更称手的新锤子,次日打铁的效率显著提升——但决定权还在人类铁匠手中。

二、AI 的递归自我改进

想象一下,那把锤子开始自作主张,自行调控炉温、修改桌上的图纸,再开动机器锻造出一把“更擅长修改图纸”的锤子。下一把锤子诞生后立刻接管工坊,越改越快。当新一代模型接管、重投循环,改进者同时也成了被改进者。

二者的根本区别在于:演化的目标,究竟由谁设定?

其中的鸿沟,在于一种被称为“研究品味”与“大局观”的抽象特质。

从底层机制看,递归改进缺一个即时且可信的裁判。代码飞轮之所以转得动,是因为有廉价而密集的“可验证奖励”——代码敲下,编译运行,对错当场分明。

但“研究判断”没有这种信号:一条技术路径是否值得走,答案往往要等数月甚至数年。一旦失去外部真实的对错反馈,AI 的自我训练便会空转——自己出题、自己批卷、自己打满分,账面分数极高,能力却急剧退化。这叫“模型崩溃”。

更需警惕的是:一旦启动彻底的递归,一个极其微小的错置目标,经由代代相传,偏差会以指数级放大。

通往递归的路不像攀爬缓坡,更像在炉火上烧水:长久不见波澜,积累到某一临界温度,整壶水骤然沸腾。此谓“相变”。

Jack Clark 预测,2028 年底前出现完全自主递归的概率约有六成。这既需要底层算法的突破,也取决于人类是否“允许”。

一旦实现,未来的最强模型不再由人类心智写就,而是机器自我演化的产物。人类将无法读懂其内部的神经运作,只能观察其行为,推断其习性,为其划定边界。

那时,人类心智的价值将向两端收敛:一是追问意义的源头,二是在不确定的路口,凭直觉与大局观押下方向。其余的,交付机器。

机器正在飞速学习如何制造机器。

人类要守住的,是决定这个世界究竟该制造什么。

至于普通人会如何,这是个谜。

发布于 上海