#马斯克称Grok新模型打败Gemini3##最强工具调用模型来了#
马斯克兴奋宣布:Grok 4.1 Fask打败了Gemini 3!【图1】
什么?Gemini 3不是刚发吗,怎么这么快就被超越了。
仔细一看,原来是刚刚发布的Grok 4.1 Fast,其“智能体工具调用能力”打败了Gemini 3。
Grok 4.1 Fast主打“能真正干活”。【视频2】模拟了一个酒店预订场景。用户只是随口说了句“我想把现在的预订升级到行政套房”,屏幕左侧,它瞬间生成了一个“行动计划(Plan of action)”:识别访客、检查可用性、升级预订。
右侧开始秀操作:连续调用不同的工具,先是用客户端工具(Client Tool)通过邮件查到了用户ID,紧接着同时开启“双线程”,一边运行服务器代码(Server Code)获取具体订单详情,一边联网搜索(Web Search)查看12月的房源情况。确认有房后,再次调用工具直接在后台修改了订单。
整个过程没有一句废话,这就是Grok4.1Fast主打的“工具调用”能力,配合新出的Agent Tools API,它能把联网搜索、运行代码、查阅内部文档这些动作串联起来解决复杂问题。
其工具调用(Tool Calling)拥有200万token的上下文窗口,幻觉率比上一代降低了一半,而且反应速度极快。
官方称它在模拟环境里进行了大量强化训练,特别适合客服、金融这些需要严谨操作的场景。
目前xAI和OpenRouter合作,接下来的两周内,这个新模型和工具API都是免费开放的。想折腾AI智能体(Agent)的朋友来说,可以关注一波。
