唐杰THU 26-02-18 18:02
微博认证:清华大学教授,AMiner创始人 唐杰

发了GLM-5的技术报告,希望对大家有用,http://t.cn/AXt87HsG
希望对家有用:
-架构与规模:采用 DSA 架构,拥有 750B (7500亿) 总参数量(其中 40B 为激活参数),并在 30T (30万亿) 数据上进行了训练。
-工具套件:发布了 Slime RL(强化学习)工具包。
-强化学习突破:引入了异步智能体强化学习 (Asynchronous Agentic RL),效果显著(在多个主流基准测试中提升了 3 个百分点)。
-硬件适配:已适配 7 款国产芯片。

主要结果:
-Artificial Analysis (AA):排名第一的开源模型。
-Text Arena & Code Arena:排名第一的开源模型。
-Vending Bench & Design Bench:排名第一的开源模型。

todo:
-基础设施 (Infra) 仍需持续优化。
-需要更多的 GPU 算力支持。

发布于 北京