#Opus4.8和GPT5.5谁更强#这波更新直接把 Agent 编程的天花板拉高了一大截。
SWE-Bench Pro 69.2%,比 GPT-5.5 高 10 个百分点
GDPval-AA 真实世界 Agent 能力榜 1890 分,断层第一
完成同样任务比上代少用 15% 步骤、少输出 35% token
Claude Code 支持动态工作流,自动调度上百子 Agent 并行
实测下来,它在长任务中的稳定性提升非常明显,能连续跑几个小时不用人工干预,遇到问题会自己调整方案,而不是直接摆烂。价格不变真的太香了,现在用 Opus 4.8 做开发,效率至少能翻一倍。#ClaudeOpus4.8发布#
发布于 上海
