不止SOTA！通义DeepResearch模型、框架、方案全开源！我们激动地宣布通义DeepResearch现已全面开源！它以仅仅30B（激活参数3B）的规模，实现了与OpenAI Deep Research相媲美的卓越性能。✨ 硬核性能，刷新SOTA在多个权威基准测试中，我们的智能体表现优异：在学术推理任务Humanity's Last Exam

不止SOTA！通义DeepResearch模型、框架、方案全开源！

我们激动地宣布通义DeepResearch现已全面开源！它以仅仅30B（激活参数3B）的规模，实现了与OpenAI Deep Research相媲美的卓越性能。
✨ 硬核性能，刷新SOTA
在多个权威基准测试中，我们的智能体表现优异：
在学术推理任务Humanity's Last Exam (HLE)上得分32.9；在极端复杂的信息检索任务BrowseComp和BrowseComp-ZH上，分别得分43.4和46.7；并在以用户为中心的xbench-DeepSearch基准测试中获得75分，系统性地超越了所有现有的闭源及开源Deep Research智能体。
💡 揭秘背后的技术创新
如此高效的性能，得益于我们独特的技术路径：
自动化数据策略：我们构建了一套新颖的、多阶段自动化数据策略，无需昂贵的人工标注，即可生成海量、高质量的智能体训练数据。
端到端训练路径：我们设计了全新的 Agentic CPT → Agentic SFT → Agentic RL 训练路径。其中的关键突破在于采用了on-policy强化学习（RL），让智能体在高度稳定的定制化模拟环境中通过“试错”进行学习，确保了模型的鲁棒性。
🌍 已在真实世界大展身手
通义DeepResearch不仅限于实验，其技术已为真实应用提供支持：
高德地图“高德智驾”：作为AI助手，为用户规划复杂的多日行程。
通义法睿：作为法律研究智能体，能够分析判例法和法规，为专业人士提供可验证的引文。
🛠️ 全面开源，邀您共建
我们深信开源的力量。通义DeepResearch的模型、框架和完整解决方案完全开源，赋能社区，将信息转化为深刻洞见。
🔗 项目主页: tongyi-agent.github.io
🔗 Blog原文: tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
🔗 模型文件: 魔搭社区、HF
🔗 仓库: github.com/Alibaba-NLP/DeepResearch
#通义#

发布于浙江