55168-上市公司调研 25-11-21 13:32

AI产业跟踪:谷歌发布GEMINI-3 能力全面进阶 关注多模态与应用商业化落地

长江证券股份有限公司 研究员:宗建树/刘思缘 日期:2025-11-20

  事件描述

  11 月19 日凌晨,谷歌发布gemini-3-pro-preview,稀疏MoE 架构,输入支持最高约100 万tokens,最大输出64K tokens。Android Studio、Firebase、Gemini CLI 全部接入,200k 以内,每百万token 的输入/输出价格为$2/$12,大于200k 时为$4/$18。

  事件评论

  Gemini 3 Pro:最先进的推理模型,再次定义SOTA。在几乎所有主流AI 基准测试中均显著超越前代Gemini 2.5 Pro,全面压制Claude Sonnet 4.5 、GPT-5.1。(1)领先的智能:以1501Elo 的突破性高分登顶LMArena,在HLE(无工具达到37.5%)和GPQADiamond(91.9%)上获得最高分,展示博士级推理能力。在Math Arena Apex 得分23.4%拿下最新SOTA。(2)多模态推理的上限:MMMU-Pro 和Video-MMMU 上分别斩获了81%和87.6%的高分,无论解析复杂的科学图表还是理解动态视频流都游刃有余。(3)强大且可靠:在Simple QAVerified 上取得了72.1%的成绩,显示出在事实准确性上的巨大进步。(4)长时间跨度的规划能力遥遥领先:Google 将CoT 做了产品化封装,引入DeepThink 模式,Thought Signatures(思维签名),API 返回中包含加密的“思维过程”,模型输出前会多步推理、反思、验证;Thinking Levels(思考等级):开发者在API 中配置模型“想多久”。对于简单任务选择快速响应,对于复杂逻辑选择深度思考。

  ARC-AGI-2 的断层胜出与MathArena Apex 翻倍提升,背后或许是Google 找到了现有Transformer 框架之上的“加速路径”:新的思维链机制、更有效的 Agent 调度结构与更深层的工具调用优化(如主动规划而非被动响应)。我们认为这意味着AI 正在从“语言理解+知识压缩”的旧范式,向“自主推理+多模态执行”的新阶段进化。

  发布日同步接入谷歌搜索,Generative UI 深化搜索即应用。AI 生成式搜索结果将直接覆盖数十亿次搜索请求。同时,Gemini 3 不仅能写出功能正确的代码,更重要的是,它能够理解审美。这种审美智能的来源部分是训练数据。根据Gemini 3 的Model Card 披露,Gemini 3 的训练数据包括大量的图像、视频和网页数据,这说明模型不仅学会了如何编码,还学会了什么样的界面是好看的,布局优质的。在多轮对话中,Gemini 3 能够理解你的审美偏好、编码风格,甚至是你没有明说的设计原则,有望改变人机交互的范式。

  全新的「智能体优先」开发体验。(1)Google Antigravity 定位Agent 时代的IDE,为“人+Agent”设计,将AI 辅助从开发者工具箱中的一个工具转变为积极的合作伙伴。(2)更新的Gemini CLI,自然语言转Shell+系统级操作。

  当前通过越来越强的工具调用能力和模型规划能力,基础模型变得越来越像Agent,行业也从“比模型”转向“比应用”。后续展望来看,关注AI 产品发布超预期情况与AI Agent落地进展。继续看好国产AI 链、国产算力链以及国内AI 出海,持续重点推荐铲子股和卡位优势显著的巨头本身。

  风险提示

  1、AI 技术发展不及预期;

  2、下游应用需求不及预期。

发布于 广东