Kimi K2.6发布_新浪新闻

Kimi K2.6 发布 [震惊]
Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升，其中在博士级难度的完整版人类最后的考试（Humanity's Last Exam）、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩，持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro等闭源模型。
Kimi K2.6 是我们迄今最强的代码模型，其长程编码能力也得到显著提升，在测试中可以不间断编码 13 小时，编写或修改超过 4000 行代码，完成复杂系统的开发和优化。通过将代码与视觉能力的深度融合，K2.6 将代码驱动的设计能力提升到了新高度，可以交付极具设计创意的专业级 Web 应用。
Kimi K2.6 大幅增强了 Agent 自主化执行能力，帮助我们进一步扩展 Agent 的能力范围：由 K2.6 模型驱动的「Agent 集群」架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤，实现更大规模的并行化，同时任务完成度和交付质量相比于 K2.5 有显著提升；针对 OpenClaw、Hermes Agent 等主动式 Agent 框架，K2.6 展现出极强的自动化任务处理能力，支持长达 5 天的持续自主运行。

发布于广东