零重力瓦力 26-01-06 09:52
微博认证:AI博主

陈天桥和戴季峰的 MiroMind团队,昨天发布了他们最新的智能体模型MiroThinker 1.5,性能非常亮眼。

235B 的版本在几个主流基准上都刷新了记录(图1、图2),其中 BrowseComp-ZH 达到 71.5%,GAIA-Val-165更是到了80.8%。较小的 30B 版本,在中文搜索任务上竟然超过了Kimi-K2-Thinking,而参数量只有后者的三十分之一。。

MiroThinker 核心亮点在于 "交互式扩展"(图3)。传统大模型往往缺乏外部校验,推理链条一长,就容易 “一本正经地胡说八道”。MiroThinke 采用了新的方法,遇到不确定的问题,它会主动搜索,用查到的结果来验证自己的想法。团队把这个过程比作科学家做,不仅要推理,还要勤于验证、善于纠错。

模型支持256K上下文,单次任务最多能执行 400 次工具调用,采用 MIT 开源协议。目前的短板是中文能力。因为训练数据主要是英文,团队说下个版本会补上。

简单实测,模型在进行深度研究的过程中,的确会对自己的搜索结果进行检验和修正。(图7、图8、图9)

平时,分析、研究工作比较多的,可以关注这款模型。

使用地址:dr.miromind.ai
HuggingFace: huggingface.co

#AI技术[超话]##智能体##MiroThinker##科技先锋官# #AI创造营#

发布于 上海