#谷歌IO2026# 谷歌I/O 2026大会火力全开,劈柴和Demis Hassabis同台把攒了半年的大招一口气全亮了出来。最大主角Gemini Omni正式亮相,作为真正「全能」的大模型,它可以接收任意形式的输入生成任意内容,首发支持视频输出,堪称「视频版Nano Banana」。
Omni把Gemini的世界知识与推理能力注入视频生成,实现了对物理世界的真正理解,而非简单拼贴素材。给它图片、音频、视频、文字的任意组合,就能生成连贯高质量视频,还可用对话方式持续编辑,角色一致、物理逻辑成立。
本场另一重头戏是全新旗舰Gemini 3.5 Flash,劈柴亲口宣布它在几乎所有基准测试中全面胜出三个月前才发布的3.1 Pro。速度达到289 tokens/秒,比GPT-5.5和Opus 4.7快4倍有余,更强的3.5 Pro下个月发布。
3.5 Flash的强悍能力,由全新Antigravity 2.0平台支撑——从IDE进化为独立桌面Agent开发平台。现场Demo中,93个子Agent并行工作,发出超15000次模型请求,处理26亿个token,12小时内从零造出功能完整的OS内核,API费用不到1000美元。
今晚第三大发布是Gemini Spark,定位为7×24小时云端运行的个人AI Agent。它深度整合谷歌办公全家桶,可跨Gmail、Docs、日历自动抓取信息,支持自定义技能学习用户口吻偏好,并行执行多任务,全程无需打开任何App。AI Ultra订阅每月100美元可用Spark Beta,下周率先对美国用户开放。
回望这场I/O,真正让人后背发凉的不是某一个产品,而是所有能力同时到位——全模态理解、全模态生成、全天候在线Agent,谷歌一夜之间全部拼上。当AI不再需要人类「喂料」,而是自己理解、决策、执行、迭代,通往超级智能的路上已经没有「技术上做不到」的障碍,剩下的只是工程部署的速度。
