Claude Sonnet 4.6对比4.5

⁉️Claude Sonnet 4.6 比4.5 强在哪？
Arena 发布了 Claude Sonnet 4.6 和 4.5 的对比分析结果。
Sonnet 4.6 在 Code Arena 排第三名， 4.5 之前排第二十二名。分数提高了一百三十多分。它在 WebDev 类别中排第三名。
文本领域 Sonnet 4.6 排第十三名， 4.5 排第十六名。分数达到一千四百五十七。
数学类别它排第四名，指令跟随排第五名，英语类别提升五个名次，困难提示词也提升五个名次。
软件和 IT 服务类别排第八名，写作文学和语言排第七名，商业管理和金融操作排第十名。
雷达图显示 4.6 在多数位置更好，但是多轮对话 4.5 领先三个点，较长查询 4.5 领先两个点，这些数据用了风格控制来计算。
Anthropic 在 2 月 17 日发布了 Claude Sonnet 4.6，升级了编码和长上下文能力，并且有一百万 token 的上下文窗口，是目前 Sonnet 系列中最强的模型。

#claude[超话]##AI工具##AI编程#

发布于江西