爱可可-爱生活 25-12-29 16:46
微博认证:AI博主 2025微博新锐新知博主

Anthropic研究员Jackson Kernion发推称,他觉得Opus 4.5"已经接近AGI",甚至不确定接下来该把时间投入到什么方向上了。

这条推文引发了不小的讨论,但评论区的反应相当冷静,甚至略带讽刺。

核心质疑:这不就是营销吗?

最高赞评论直接指出:他说"看到了某种东西",却没给出任何基准测试、定义或具体证据,纯粹是一种"感觉"。这更像是市场宣传而非技术判断。

有人补充说:Anthropic明年即将IPO,这些研究员看到的可能不是AGI,而是自己股票期权变现的可能性。

还有人调侃:在Anthropic工作的入职条件可能就是先经历一次"AI觉醒",然后开始"看到某些东西"。

关于AGI定义本身的争论

有人认为,AGI本来就是个模糊概念,没有统一标准,所以对某些人来说Opus 4.5"接近AGI"并非完全没道理。Dario Amodei曾在文章中定义过"powerful AI",但那和大众理解的AGI仍有差距。

反对者指出:真正的AGI应该具备自主性、自我导向能力,而不是像现在这样需要用户指令才能运作。一个需要人类不断验证其输出的系统,怎么能叫AGI?

也有人提出一个功能性定义:能完全取代人类工作者就是AGI,至于是否具备"自主意识"并不重要。但这又引出新问题——如果没有自我导向,怎么可能完全替代一个需要自主判断的人类员工?

少数肯定的声音

有用户表示,Opus 4.5确实在编程上表现惊人,对话体验也更自然流畅,少了其他模型常见的谄媚、居高临下或过度防御。如果Anthropic能补上图像、视频、音频等多模态能力,它可能是当前能达到的最佳形态。

但也有人吐槽:今天Opus 4.5给我写了一个四行循环,结果直接把迭代器搞坏了。"感受一下这AGI的力量吧。"

更深层的问题

有人提到,如果五年前发布Opus 4.5,人们可能真的会称之为AGI。但今天的标准已经水涨船高。

还有人说得更直接:与其发这种玄乎的推文,不如直接拿ARC、METR这些测试结果说话。等它真的通过了,我们再讨论。

这场讨论的本质,其实是一个老问题的新版本:当一家公司的员工站出来为自家产品做情感化背书时,我们该相信多少?

在资本、技术、叙事高度交织的AI领域,"我看到了某种东西"这种表达方式,可能恰恰说明——他们其实没有什么能说服所有人的东西。

x.com/JacksonKernion/status/2004707761138053123

发布于 北京