【火拼升级!OpenAI、Anthropic同日发布新模型,一个能替你写代码,一个能替公司管流程】
凌晨,#Anthropic# 和#OpenAI# 同时上线了新模型Claude Opus 4.6和GPT-5.3-Codex,给两家企业本就在为超级碗广告互呛的激烈气氛又添了一把柴火。当全美观众还在为它俩斥资数百万美元投放的互怼广告津津乐道时,它们已经杀到了同日发新模型这样的正面交锋战场上。
Anthropic发布Claude Opus 4.6:搭载处于Beta阶段的1M上下文窗口 Anthropic发布了Claude Opus 4.6,其并非仅仅是参数量的增加,而是在多个关键维度上实现了实质性的更聪明和更可用。一个值得关注的亮点是它那处于Beta阶段的1M上下文窗口。
过去的模型在处理极长文本时,经常出现上下文腐化的问题,即模型性能随着文本长度增加而显著下降,导致它忘记或者混淆较早之前的信息。 而Claude Opus 4.6在著名的大海捞针基准测试MRCR v2上,成绩达到了76%,远超前代Sonnet 4.5的18.5%,这证明它能够真正有效地利用超长下文,在海量文档中精准定位并提取被深埋的关键信息,从而胜任大型代码库分析、多篇论文综述、跨会话长程任务规划等场景。
在推理能力和编码能力上,Claude Opus 4.6在多项权威基准测试中确立了行业领先地位,特别是在需要自主规划和多步执行的智能体编码任务上。比如,在Terminal-Bench 2.0中它的测试成绩排名第一。
戳链接查看详情:http://t.cn/AX5Je2ue
