程贵锋gui
26-05-20 23:20 微博认证:中国电信广州研究院 终端研发中心 副总经理 头条文章作者

Google I/O 2026 核心结论(5 月 20 日)
主题:全面进入「Agentic Gemini 时代」—— 把 AI 智能体塞进搜索、浏览器、手机、眼镜与办公全链路,让 Gemini 成为谷歌生态的统一智能层。
AI已从“回答问题”进化为“主动行动”,AGI近在咫尺,而Google正以基础设施、模型、应用三位一体的策略引领这场变革。

一、战略与数据:AI 已成核心引擎
官宣:Agentic Gemini Era,AI 从 “问答” 转向 “自主跨应用执行任务”。
规模:月处理3.2 千万亿 Token(同比 + 7 倍);Gemini App 月活 9 亿(一年翻倍)。
定位:Gemini = 谷歌生态默认 AI 层,覆盖搜索、Android、Workspace、YouTube、Chrome。

二、大模型:Gemini 3.5 + Omni(世界模型)
1)Gemini 3.5 Flash(主力,全球开放)
性能:超上一代 Pro,推理速度289 token/s(≈竞品 4 倍)、成本减半。
能力:长文本、多步骤推理、工具调用、代码生成全面强化。
落地:搜索 AI Mode、Gemini App、开发者工具默认模型。
2)Gemini Omni(世界模型,多模态生成)
Omni Flash:文 / 图 / 音 / 视频混合输入→生成可编辑视频,支持镜头 / 角度指定36氪。
用途:内容创作、游戏原型、仿真数据;将接入 Gemini App 与 Google Flow36氪。
3)Gemini 3.5 Pro(内测,6 月发布)
更强长程任务、深度推理、多智能体协同;面向企业 / 高级用户。

三、智能体(Agent):Gemini Spark + Antigravity 2.0
1)Gemini Spark(个人 AI 管家,重磅)
定位:7×24 小时云端常驻 Agent,设备关机仍运行。
能力:打通 Gmail/Docs/Sheets/Calendar,自动生成日报 / 简报、管理日程、追踪订阅、监控邮件。
安全:全程可看 “思考轨迹”,敏感操作需确认,随时可打断。
节奏:Beta 向美国 AI Ultra 用户推送,后续全球开放。
2)Antigravity 2.0(开发者平台)
统一工具链:桌面端 + CLI+SDK,替代旧 Gemini CLI。
核心:多 Agent 编排、长任务管理、MCP 协议(第三方接入)。
场景:代码生成、App 构建、企业流程自动化;对标 Claude Code36氪。

四、搜索:25 年来最大改版(AI 优先)
新搜索框:动态扩展、多模态输入(文本 / 图片 / 视频 / 文件 / Chrome 标签)。
AI Mode(默认):** 信息智能体(Information Agents)** 持续追踪主题、自动汇总更新。
Universal Cart:统一购物车打通搜索 / YouTube/Gmail,Nike/Walmart 首批接入。

五、硬件与终端:Android XR 眼镜 + Pixel
1)Android XR(Project Aura)智能眼镜
升级:Gemini 实时翻译、导航、语音助手;合作 Warby Parker/Gentle Monster。
形态:轻量、时尚化,面向消费级。
2)Pixel 10/9a
内置Gemini 离线能力、实时翻译、AI 修图、通话摘要。

六、Workspace 与 Chrome:全链路 AI 化
Gmail Live:语音对话式搜索邮件,直接回答问题。
Docs/Sheets:AI 自动生成报告、分析数据、可视化。
Chrome:Agentic 扩展,跨网页操作、自动填表、内容摘要。
Ask YouTube:AI 视频搜索,直接跳转关键片段并回答问题。

七、开发者生态:AI 原生开发
Android CLI 1.0:纯命令行 + AI构建 / 测试 / 发布 Android 应用。
AI 水印:内容溯源,AI 生成内容自动嵌入不可见水印。

八、核心观点
谷歌:以搜索为底盘,AI 智能体渗透全生态,强调 “无处不在的 Agent”。
阿里云:以云为底盘,自研芯片 + 大模型 + 推理全栈,强调 “中国 AI 工厂”。
共识:Agent 是下一代交互核心,从 “模型竞争” 转向 “生态 + 算力 + 应用落地” 竞争。

发布于 广东