谷歌发布GEMINI-3

AI产业跟踪：谷歌发布GEMINI-3 能力全面进阶关注多模态与应用商业化落地

长江证券股份有限公司研究员：宗建树/刘思缘日期：2025-11-20

　　事件描述

　　11 月19 日凌晨，谷歌发布gemini-3-pro-preview，稀疏MoE 架构，输入支持最高约100 万tokens，最大输出64K tokens。Android Studio、Firebase、Gemini CLI 全部接入，200k 以内，每百万token 的输入/输出价格为$2/$12，大于200k 时为$4/$18。

　　事件评论

　　Gemini 3 Pro：最先进的推理模型，再次定义SOTA。在几乎所有主流AI 基准测试中均显著超越前代Gemini 2.5 Pro，全面压制Claude Sonnet 4.5 、GPT-5.1。（1）领先的智能：以1501Elo 的突破性高分登顶LMArena，在HLE（无工具达到37.5%）和GPQADiamond（91.9%）上获得最高分，展示博士级推理能力。在Math Arena Apex 得分23.4%拿下最新SOTA。（2）多模态推理的上限：MMMU-Pro 和Video-MMMU 上分别斩获了81%和87.6%的高分，无论解析复杂的科学图表还是理解动态视频流都游刃有余。（3）强大且可靠：在Simple QAVerified 上取得了72.1%的成绩，显示出在事实准确性上的巨大进步。（4）长时间跨度的规划能力遥遥领先：Google 将CoT 做了产品化封装，引入DeepThink 模式，Thought Signatures（思维签名），API 返回中包含加密的“思维过程”，模型输出前会多步推理、反思、验证；Thinking Levels（思考等级）：开发者在API 中配置模型“想多久”。对于简单任务选择快速响应，对于复杂逻辑选择深度思考。

　　ARC-AGI-2 的断层胜出与MathArena Apex 翻倍提升，背后或许是Google 找到了现有Transformer 框架之上的“加速路径”：新的思维链机制、更有效的 Agent 调度结构与更深层的工具调用优化（如主动规划而非被动响应）。我们认为这意味着AI 正在从“语言理解+知识压缩”的旧范式，向“自主推理+多模态执行”的新阶段进化。

　　发布日同步接入谷歌搜索，Generative UI 深化搜索即应用。AI 生成式搜索结果将直接覆盖数十亿次搜索请求。同时，Gemini 3 不仅能写出功能正确的代码，更重要的是，它能够理解审美。这种审美智能的来源部分是训练数据。根据Gemini 3 的Model Card 披露，Gemini 3 的训练数据包括大量的图像、视频和网页数据，这说明模型不仅学会了如何编码，还学会了什么样的界面是好看的，布局优质的。在多轮对话中，Gemini 3 能够理解你的审美偏好、编码风格，甚至是你没有明说的设计原则，有望改变人机交互的范式。

　　全新的「智能体优先」开发体验。（1）Google Antigravity 定位Agent 时代的IDE，为“人+Agent”设计，将AI 辅助从开发者工具箱中的一个工具转变为积极的合作伙伴。（2）更新的Gemini CLI，自然语言转Shell+系统级操作。

　　当前通过越来越强的工具调用能力和模型规划能力，基础模型变得越来越像Agent，行业也从“比模型”转向“比应用”。后续展望来看，关注AI 产品发布超预期情况与AI Agent落地进展。继续看好国产AI 链、国产算力链以及国内AI 出海，持续重点推荐铲子股和卡位优势显著的巨头本身。

　　风险提示

　　1、AI 技术发展不及预期；

　　2、下游应用需求不及预期。

发布于广东