白天画好架构草图,睡前交给GLM-5.1。早上醒来——它已经跑了整整8小时、1200多步,产出了一套功能完善的Linux桌面系统,外加50多个APP。
睡一觉,收获一个完整系统。这就是长程任务时代的开发方式。
今天,我们正式发布GLM-5.1,这是我们迄今最智能的旗舰模型,也是当前全球最强的开源模型。
在三大最硬代码基准(SWE-Bench Pro / Terminal-Bench 2.0 / NL2Repo),GLM-5.1综合平均:全球第三,国产第一,开源第一。
在最接近真实开发的SWE-Bench Pro上,GLM-5.1刷新全球最佳,超过GPT-5.4和Claude Opus 4.6。
从3分钟的Vibe Coding,30分钟的Agentic Engineering,现在是8小时的Long Horizon Task——GLM-5.1再次刷新边界。
#智谱##How I AI##How I AI# http://t.cn/AXML5tS3
发布于 北京
