通义实验室 25-09-17 18:22
微博认证:通义大模型官方微博

不止SOTA!通义DeepResearch模型、框架、方案全开源!

我们激动地宣布通义DeepResearch现已全面开源 !它以仅仅30B(激活参数3B)的规模,实现了与OpenAI Deep Research相媲美的卓越性能 。
✨ 硬核性能,刷新SOTA
在多个权威基准测试中,我们的智能体表现优异:
在学术推理任务Humanity's Last Exam (HLE)上得分32.9;在极端复杂的信息检索任务BrowseComp和BrowseComp-ZH上,分别得分43.4和46.7;并在以用户为中心的xbench-DeepSearch基准测试中获得75分,系统性地超越了所有现有的闭源及开源Deep Research智能体。
💡 揭秘背后的技术创新
如此高效的性能,得益于我们独特的技术路径:
自动化数据策略:我们构建了一套新颖的、多阶段自动化数据策略,无需昂贵的人工标注,即可生成海量、高质量的智能体训练数据 。
端到端训练路径:我们设计了全新的 Agentic CPT → Agentic SFT → Agentic RL 训练路径。其中的关键突破在于采用了on-policy强化学习(RL),让智能体在高度稳定的定制化模拟环境中通过“试错”进行学习,确保了模型的鲁棒性 。
🌍 已在真实世界大展身手
通义DeepResearch不仅限于实验,其技术已为真实应用提供支持:
高德地图“高德智驾”:作为AI助手,为用户规划复杂的多日行程 。
通义法睿:作为法律研究智能体,能够分析判例法和法规,为专业人士提供可验证的引文 。
🛠️ 全面开源,邀您共建
我们深信开源的力量。通义DeepResearch的模型、框架和完整解决方案完全开源,赋能社区,将信息转化为深刻洞见。
🔗 项目主页: tongyi-agent.github.io
🔗 Blog原文: tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
🔗 模型文件: 魔搭社区、HF
🔗 仓库: github.com/Alibaba-NLP/DeepResearch
#通义#

发布于 浙江