智谱今日正式公开GLM-5的技术细节。官方介绍,GLM-5在Artificial Analysis Intelligence Index v4.0中得到50分,成为新的开源SOTA模型,较GLM-4.7提升8分,这一提升源于Agent性能及知识/幻觉方面的全面改进。
平均而言,GLM-5相比4.7提升约 20%,与Claude Opus 4.5和GPT-5.2(xhigh相当,并优于Gemini 3 Pro。
GLM-5 能够实现性能的大幅跃升,主要得益于四大技术创新:
第一,引入DSA稀疏注意力机制(DeepSeek Sparse Attention, DSA),极大降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,智谱将模型参数规模扩展至 744B,同时将训练Token规模提升至28.5T。
第二,构建全新的异步RL基础设施。基于GLM-4.5时期 slime 框架“训练与推理解耦”的设计,智谱的新基建进一步实现了“生成与训练”的深度解耦,将GPU利用率推向极致。系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。
第三,提出全新的异步Agent RL算法。该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。
第四,全面拥抱国产算力生态。从模型发布伊始,GLM-5就原生适配了中国GPU生态。智谱已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。
#人工智能##人工智能[超话]##处理器##华为[超话]##DeepSeek[超话]#
