谷歌最新版「深度研究」反击GPT-5.2
而在GPT-5.2发布前一个多小时,谷歌就率先推出全新版Gemini Deep Research Agent。
谷歌对Gemini深度研究进行了重新构想,使其比以往任何时候都更加强大。
新版Deep Research Agent基于Gemini 3 Pro构建;
通过多步强化学习训练,提高准确性并减少幻觉;
它能够处理海量上下文,并提供引用来源验证提出的每一个观点。
除了Deep Research Agent功能更新,还放出了另外两项全新能力:
开源新网络研究Agent基准DeepSearchQA,验证智能体在网络研究任务中的全面性;
推出全新交互API(Interactions API)。
虽然GPT-5.2刚刚发布无法对比,但谷歌DeepMind产品经理路Lukas Haas在社交平台X上透露:
最新版Gemini Deep Research Agent在谷歌新基准测试上得分46.4%,在BrowseComp上与GPT-5 Pro相当,价格却低了一个数量级。
深度研究,更「深度」了
Gemini Deep Research是一款专为长时间上下文收集与综合任务优化的智能体。
该智能体的推理核心采用迄今为止最具事实准确性的Gemini 3 Pro模型,并经过专门训练,以在复杂任务中减少幻觉生成并最大化报告质量。
通过扩展多步强化学习在搜索中的应用,该智能体能够以高精度自主驾驭复杂的信息环境。
Gemini Deep Research在完整Humanity's Last Exam(HLE)测试集中达到46.4%的领先水平,在DeepSearchQA上取得66.1%的优异成绩,并在BrowseComp测试中获得59.2%的高分表现。
DeepResearch采用迭代式研究规划机制——它会制定查询、阅读结果、识别知识缺口并再次搜索。
本次版本大幅改进了网络搜索功能,使其能够深入网站获取特定数据。
该智能体经过优化,能够以更低成本生成经过充分研究的报告。
不同于传统的聊天机器人(Chatbot),Deep Research被设计为一个长时程运行的系统,其核心竞争力在于处理「非即时性」的复杂任务。
