Anthropic推出新一代AI模型Claude Sonnet 4.5:9月29日,Anthropic公司推出了名为Claude Sonnet 4.5的新一代AI模型。该模型在编码基准测试中展现出顶尖性能,能构建可投入生产使用的应用程序,在网络安全、金融、科研等专业领域表现突出。依据SWE - bench Verified等行业基准,Claude Sonnet 4.5堪称“全球最佳编码模型”。
除了在编码基准测试中表现出色,Claude Sonnet 4.5还有以下特点:
性能全面提升:在智能体构建、计算机使用、推理和数学能力上都有显著突破。例如在OSWorld基准测试中,其成绩从四个月前Sonnet 4的42.2%提升至61.4%,位居首位。在推理与数学方面,在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
-全新功能与产品升级:Claude Code新增“检查点”功能,可随时保存进度并一键回滚到早先状态,还更新了终端界面,并推出了原生VS Code插件。Claude API增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。Claude apps现已支持在对话中直接执行代码、生成文件。此外,还推出了Claude Agent SDK,开放了驱动Claude Code的底层基础设施,为开发者打造智能体提供基础能力。
- 安全性增强:Claude Sonnet 4.5是迄今为止对齐性最好的Claude模型,通过改进的能力和广泛的安全训练,在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效,还加强了对提示注入攻击的防御。该模型按照AI Safety Level 3(ASL - 3)框架发布,包含一系列防护措施,如针对化学、生物、放射和核相关内容的分类器过滤机制,误报率较Sonnet 4降低了十倍。 http://t.cn/AX7oAsli
发布于 福建
