Opus 4.8发布_新浪新闻

#Opus4.8和GPT5.5谁更强#这波更新直接把 Agent 编程的天花板拉高了一大截。
SWE-Bench Pro 69.2%，比 GPT-5.5 高 10 个百分点
GDPval-AA 真实世界 Agent 能力榜 1890 分，断层第一
完成同样任务比上代少用 15% 步骤、少输出 35% token
Claude Code 支持动态工作流，自动调度上百子 Agent 并行
实测下来，它在长任务中的稳定性提升非常明显，能连续跑几个小时不用人工干预，遇到问题会自己调整方案，而不是直接摆烂。价格不变真的太香了，现在用 Opus 4.8 做开发，效率至少能翻一倍。#ClaudeOpus4.8发布#

发布于上海