谷歌发布多款AI模型

#谷歌IO2026# 谷歌I/O 2026大会火力全开，劈柴和Demis Hassabis同台把攒了半年的大招一口气全亮了出来。最大主角Gemini Omni正式亮相，作为真正「全能」的大模型，它可以接收任意形式的输入生成任意内容，首发支持视频输出，堪称「视频版Nano Banana」。
Omni把Gemini的世界知识与推理能力注入视频生成，实现了对物理世界的真正理解，而非简单拼贴素材。给它图片、音频、视频、文字的任意组合，就能生成连贯高质量视频，还可用对话方式持续编辑，角色一致、物理逻辑成立。
本场另一重头戏是全新旗舰Gemini 3.5 Flash，劈柴亲口宣布它在几乎所有基准测试中全面胜出三个月前才发布的3.1 Pro。速度达到289 tokens/秒，比GPT-5.5和Opus 4.7快4倍有余，更强的3.5 Pro下个月发布。
3.5 Flash的强悍能力，由全新Antigravity 2.0平台支撑——从IDE进化为独立桌面Agent开发平台。现场Demo中，93个子Agent并行工作，发出超15000次模型请求，处理26亿个token，12小时内从零造出功能完整的OS内核，API费用不到1000美元。
今晚第三大发布是Gemini Spark，定位为7×24小时云端运行的个人AI Agent。它深度整合谷歌办公全家桶，可跨Gmail、Docs、日历自动抓取信息，支持自定义技能学习用户口吻偏好，并行执行多任务，全程无需打开任何App。AI Ultra订阅每月100美元可用Spark Beta，下周率先对美国用户开放。
回望这场I/O，真正让人后背发凉的不是某一个产品，而是所有能力同时到位——全模态理解、全模态生成、全天候在线Agent，谷歌一夜之间全部拼上。当AI不再需要人类「喂料」，而是自己理解、决策、执行、迭代，通往超级智能的路上已经没有「技术上做不到」的障碍，剩下的只是工程部署的速度。