量子位 26-03-16 14:54
微博认证:量子位官方微博

#陈天桥##MiroThinker-1.7发布#
一睁眼!陈天桥带队的大模型黑马MiroMind再度满血归来——

正式发布新一代重型推理智能体:MiroThinker-1.7和MiroThinker-H1。

何为重型?延续V1.5的深度推理基因,但任务更复杂、结果更精确。

眼见为实,以基准测试为例。

MiroThinker-1.7系列发布即霸榜多项深度研究任务测试,其中MiroThinker-H1刷新SOTA,超越Gemini-3.1-Pro、GPT-5.4-Thinking、Claude-4.6-Opus等一众行业顶尖闭源模型:

*BrowseComp(网页检索类大模型基准测试):88.2%
*BrowseComp-ZH(BrowseComp的中文适配版本):84.4%
*GAIA-Val-165(GAIA基准测试验证集):88.5%
*HLE-Text(人类终极测试):47.7%

另外开源模型MiroThinker-1.7(235B)和小尺寸的MiroThinker-1.7-mini(30B)也在效率与性能之间达到了最优平衡。

换言之,针对差异化的复杂推理需求,MiroMind已经为开发者们准备好了各式精准匹配的模型方案,致力于将算力用在刀刃上。

此外,新模型不仅通用任务强,在科技金融等专业领域同样表现亮眼,它跳出了传统LLM聊天交互的范畴,转而能够承担起真实的长链条智力任务。

而这是以牺牲模型推理速度为代价的,所以u1s1,MiroMind真的很大胆。

当其它大模型厂商都在卷速度,MiroThinker系列专为复杂长期任务而生,结果V1.5大获全胜、V1.7再度突破。http://t.cn/AXfPEe6w