AIGCLINK 25-12-23 10:35
微博认证:AI博主

智谱刚刚开源了最新模型:GLM-4.7,工具调用能力超Claude Sonnet 4.5

在BrowseComp网页任务评测中67.5分;在τ²-Bench交互式工具调用评测中87.4分,超Claude Sonnet 4.5

在HLE中获得42.8%,较GLM-4.6提升41%,超GPT-5.1
在Code Arena中超GPT-5.2

GLM-4.7的能力体现在编程、推理、智能体三个层面

编程能力在包括前/后端以及指令遵循上,在真实项目盲测100个任务中,能力比4.6显著提升

并提升了在多语言编程和在终端智能体中的效果,在Claude Code等编程框架中可以做到“先思考再行动”

长程任务规划+工具调用稳,其把思考做成可缓存的隐状态,复杂需求自动拆步、调用搜索/终端/文件系统/浏览器,出错回滚,在τ²-Bench上87.4,也就是说多步工具链很少跑飞

z ai全栈开发模式中上线了Skills模块,支持多模态任务统一调度

GitHub:http://t.cn/A6F5n9EL
Hugging Face:huggingface.co/zai-org/GLM-4.7
魔搭社区:http://t.cn/AX4hMwlM

#智谱GLM-4.7##大模型##LLM#

发布于 山西