⁉️Claude Sonnet 4.6 比4.5 强在哪?
Arena 发布了 Claude Sonnet 4.6 和 4.5 的对比分析结果。
Sonnet 4.6 在 Code Arena 排第三名, 4.5 之前排第二十二名。 分数提高了一百三十多分。 它在 WebDev 类别中排第三名。
文本领域 Sonnet 4.6 排第十三名, 4.5 排第十六名。 分数达到 一千四百五十七。
数学类别它排第四名, 指令跟随排第五名, 英语类别提升五个名次, 困难提示词也提升五个名次。
软件和 IT 服务类别排第八名, 写作文学和语言排第七名, 商业管理和金融操作排第十名。
雷达图显示 4.6 在多数位置更好,但是多轮对话 4.5 领先三个点, 较长查询 4.5 领先两个点,这些数据用了风格控制来计算。
Anthropic 在 2 月 17 日发布了 Claude Sonnet 4.6,升级了编码和长上下文能力,并且有 一百万 token 的上下文窗口,是目前 Sonnet 系列中最强的模型。
#claude[超话]##AI工具##AI编程#
发布于 江西
