微博科技 26-02-06 09:51
微博认证:微博科技官方微博

【#ClaudeOpus4.6上线#】
Claude Opus 4.6横空出世,一夜成为全球最强编程AI,「无模」能敌。

它在前一代Opus 4.5的基础上,大幅提升了编码技能。

Claude Opus 4.6的规划更缜密,能更持久地执行AI Agent任务,在超大规模代码库中运行也更加可靠。

最重要的是,它还具备更强自我纠错能力,比如精准的代码审查、调试。

它也是Anthropic首款在beta阶段,上下文支持100万token的Opus级模型。

在多项基准测试中,Claude Opus 4.6编程实力几乎全方位领先,Gemini 3 Pro、GPT-5.2望尘莫及。

在ARC-AGI-2上,Opus 4.6拿下68.8%高分,超过GPT-5.2-xhigh

不仅如此,Opus 4.6一经上线,就开始革命办公了!

今天,这款新模型同时在Excel、PPT中的Claude,以及Claude Code、API中同步上线。

比如奥运长跑鞋供应链数据,和自己预测的不一样,好几个季度数据不能一眼过完,可以紧急向Opus 4.6求救。

它会遍历文件夹下所有Excel表,直接抓出差错的地方,还能同步绘制出折线图。

同样在PPT中,也能实时调用Opus 4.6了,从布局、字体到母板,Claude都能确保内容符合品牌规范。

从今天起,Claude Opus 4.6可以在Claude网页端、开发者平台,以及各大平台直接可上手。

硅谷今晚的火药味,恐怕要冲破屏幕了......

Opus 4.6发布后没几分钟,OpenAI紧急掏出GPT-5.3-Codex。

眼瞧着奥特曼发了预告,Anthropic立刻火速亮剑。只能说,起了个大早赶了个晚集

「编程新王」深夜炸场,革命全球打工人

Claude Opus 4.6的官宣,可以说是Anthropic一次重大转折。

负责人Alex Albert是这么说的,「Claude在2025颠覆了编程,在2026年将彻底重塑知识型工作」!

Opus 4.6绝不仅是一次简单的模型升级,而是AI真正成为人类「职场合伙人」的分水岭——

尤其是对于那些每天泡在表格、PPT和长文档里的打工人。正是这类工作,支撑起了金融和咨询等核心产业。

在真实的金融任务测试中,Opus 4.6比几个月前业界顶尖的Sonnet 4.5,足足提升了23%以上。

在这个时代,「几个月前」听起来就像上个世纪。

而且这些测试一点都不抽象,全是实打实的硬活:建财务模型、做路演 PPT、搞并购分析。以前分析师得忙活好几周的工作,现在眨眼间就能完成。

在日常工作任务中,Opus 4.6将成为最强助力——

运行财务分析、进行深度研究,以及使用和创建Word、Excel、PPT,全都可以调用。

值得一提的是,据不完全统计,全球约有15亿人都在Office全家桶上办公,Opus 4.6正在引发一场深层的办公效率变革。

不仅如此,在Claude Cowork中,Opus 4.6可以直接成为「牛马」手替,完成以上一切复杂任务。

在输出质量上,Opus 4.6也有了质的飞跃。

以前的模型可能需要反复修改好几轮,甚至根本搞不定;但现在,第一版出来的东西往往就能直接用了。

Cowork让你丢进一整个文件夹就能同时启动多项分析;
Excel里的Claude 处理起多表财务模型来得心应手,绝不跑偏;
PowerPoint里的Claude,让你能直接在软件里生成和修改。
正如AI抹平了开发的门槛,它也将重塑每一位知识工作者的能力边界。

一场生产力的范式转移已箭在弦上,序幕才刚刚开启。(新智元)

发布于 北京