刚刚，Anthropic 正式发布了其下一代人工智能模型——Claude Opus 4 和 Claude Sonnet 4。在 Claude 3 系列的基础上，这两个新模型在编程、高级推理和 AI 智能体功能方面达到了前所未有的基准。主要特点与能力- 编程能力：Claude Opus 4 暂时领先，成为最强大的编程模型，能够自主处理复杂的编码任

刚刚，Anthropic 正式发布了其下一代人工智能模型——Claude Opus 4 和 Claude Sonnet 4。在 Claude 3 系列的基础上，这两个新模型在编程、高级推理和 AI 智能体功能方面达到了前所未有的基准。

主要特点与能力

- 编程能力：Claude Opus 4 暂时领先，成为最强大的编程模型，能够自主处理复杂的编码任务，并持续工作数小时。在演示中，它在一个复杂的开源项目上独立编码近七小时。
- 高级推理：Opus 4 和 Sonnet 4 均展现出卓越的推理能力，能够以比以往模型更高的准确性和深度处理复杂的解决问题场景。
- 长期任务管理：Claude Opus 4 能够稳定地管理复杂任务和智能体工作流程，显著扩展了 AI 智能体的潜在应用领域。
- 增强控制：Claude Sonnet 4 在实现变化的控制方面得到了改进，为用户提供了更精细的 AI 行为和输出管理能力。

模型特定优势

- Claude Opus 4：作为旗舰模型，Opus 4 在处理最苛刻的编程和推理任务方面处于领先地位。其在复杂项目上持续工作的能力使其成为企业级应用和尖端 AI 研究的理想选择。
- Claude Sonnet 4：作为 Claude Sonnet 3.7 的重大升级，该模型在高性能与效率之间取得了平衡，适用于需要兼顾速度和高级能力的广泛应用场景。

性能基准

Claude 4 模型在 SWE-bench Verified（一个评估模型解决现实世界软件问题的严格基准）上取得了最先进的结果。这一表现凸显了它们在实际编程场景中相较于其他领先模型（包括 OpenAI 的 GPT-4）的优越性。

对 AI 领域的影响

Claude 4 的发布代表了 AI 能力的一次范式转变，特别是在编程和AI智能体领域。通过在某些编码任务中超越人类水平，并提供前所未有的长期任务管理能力，Claude 4 有潜力彻底改变软件开发、AI 研究以及依赖复杂问题解决的各个行业。

附图是跑分结果。

发布于广东