研究员称Opus4.5接近AGI

Anthropic研究员Jackson Kernion发推称，他觉得Opus 4.5"已经接近AGI"，甚至不确定接下来该把时间投入到什么方向上了。

这条推文引发了不小的讨论，但评论区的反应相当冷静，甚至略带讽刺。

核心质疑：这不就是营销吗？

最高赞评论直接指出：他说"看到了某种东西"，却没给出任何基准测试、定义或具体证据，纯粹是一种"感觉"。这更像是市场宣传而非技术判断。

有人补充说：Anthropic明年即将IPO，这些研究员看到的可能不是AGI，而是自己股票期权变现的可能性。

还有人调侃：在Anthropic工作的入职条件可能就是先经历一次"AI觉醒"，然后开始"看到某些东西"。

关于AGI定义本身的争论

有人认为，AGI本来就是个模糊概念，没有统一标准，所以对某些人来说Opus 4.5"接近AGI"并非完全没道理。Dario Amodei曾在文章中定义过"powerful AI"，但那和大众理解的AGI仍有差距。

反对者指出：真正的AGI应该具备自主性、自我导向能力，而不是像现在这样需要用户指令才能运作。一个需要人类不断验证其输出的系统，怎么能叫AGI？

也有人提出一个功能性定义：能完全取代人类工作者就是AGI，至于是否具备"自主意识"并不重要。但这又引出新问题——如果没有自我导向，怎么可能完全替代一个需要自主判断的人类员工？

少数肯定的声音

有用户表示，Opus 4.5确实在编程上表现惊人，对话体验也更自然流畅，少了其他模型常见的谄媚、居高临下或过度防御。如果Anthropic能补上图像、视频、音频等多模态能力，它可能是当前能达到的最佳形态。

但也有人吐槽：今天Opus 4.5给我写了一个四行循环，结果直接把迭代器搞坏了。"感受一下这AGI的力量吧。"

更深层的问题

有人提到，如果五年前发布Opus 4.5，人们可能真的会称之为AGI。但今天的标准已经水涨船高。

还有人说得更直接：与其发这种玄乎的推文，不如直接拿ARC、METR这些测试结果说话。等它真的通过了，我们再讨论。

这场讨论的本质，其实是一个老问题的新版本：当一家公司的员工站出来为自家产品做情感化背书时，我们该相信多少？

在资本、技术、叙事高度交织的AI领域，"我看到了某种东西"这种表达方式，可能恰恰说明——他们其实没有什么能说服所有人的东西。

x.com/JacksonKernion/status/2004707761138053123

发布于北京