谷歌这次是两条线一起推:一个让 AI 更会“干活”,一个让 AI 更会“剪视频”。
先是 Gemini 3.5 Flash 全球上线,主打智能体能力,重点放在编程、多步骤工作流和长程任务处理。谷歌给出的说法很直接:相比同类模型,输出速度提升 4 倍,成本也大幅降低。更强的 Gemini 3.5 Pro 则会在下个月推出。
另一边,谷歌还发布了 Gemini Omni,这是面向视频生成和编辑的多模态模型。用户可以把图像、音频和文字混在一起输入,然后像聊天一样改视频:调物理效果、换角色、改镜头角度,都能用自然语言完成。
首个版本 Gemini Omni Flash 已经向 Google AI Plus、Pro 和 Ultra 用户开放,还接入了 Gemini 应用、Google Flow、YouTube Shorts 和 YouTube Create App。
更关键的是,它强调对重力、流体力学等物理规律的理解,还能在多次编辑里保持角色一致。所有生成视频也会嵌入 SynthID 数字水印。
谷歌这波更新的信号很明显:AI 不只是回答问题了,它正在接管工作流,也正在进入内容生产的最后一公里。
发布于 广东
