新智元 25-11-25 09:08
微博认证:新智元官方微博

#Anthropic深夜放出ClaudeOpus4.5#,堪称全球最顶尖的模型。

它不仅编程强,而且智能体和计算机使用(computer use)能力也是一流。

Opus 4.5的诞生,标志着AI能力再一次飞跃,更将在未来彻底变革工作的方式。

基准测试中,Opus 4.5的编码、工具调用、计算机使用的成绩刷新SOTA,比Sonnet 4.5、Opus 4.1领先一大截。

不仅如此,就连发布不过一周的Gemini 3 Pro、GPT-5.1惨遭降维打击。

SWE-bench Verified一张图,直接证明了Opus 4.5强大实力,80.9%的准确率,世界第一。(图1)

同时,在ARC-AGI-2评估中,Opus 4.5(64k)拿下了37.6%的高分。(图2)

Opus 4.5这版厉害之处:在无需人工干预的情况下,就能处理模糊信息,还会权衡利弊。

即便是遇到复杂的多系统漏洞,也能够找出修复方法。

总之,用起来就一个感觉——「一点就透」。

内部评估中,Opus 4.5+Claude Code联动使用,平均生产效率暴增220%。

目前,Opus 4.5已在APP、Claude API和三大主流云平台中上线。

价格方面,相较以往暴降不少,输入5美元/百万token,输出25美元/百万token。(图4)

Gemini 3 Pro干翻了GPT-5.1,但如今,就编码性能,Opus 4.5全面碾压前两者。

不过一周的时间,AI圈真正闭环了。#科技先锋官#