智谱发布 GLM-5V-Turbo 多模态编程基座模型
智谱发布多模态 Coding 基座模型 GLM-5V-Turbo,主打在编程场景中同时理解视觉与文本输入。官方称,该模型可识别设计稿、截图、网页界面、文档版面等内容,并据此生成可运行代码,还支持截图、画框、读网页等多模态工具调用,上下文扩展到 200k。
智谱表示,该模型在多模态编程、工具调用、GUI Agent 等评测中表现领先,同时保持了纯文本编程和推理能力,并已与 Claude Code、OpenClaw 等 Agent 场景深度适配。
