谷歌推出Veo 3.1视频生成模型

【谷歌Veo 3.1来了，但来得似乎有点仓促】

当地时间 10 月 15 日，就在 #OpenAI# 于上月底推出全新的 Sora 2 后不到三周，谷歌也端出了自家#视频生成模型# 的最新版本——Veo 3.1。

根据#谷歌# 官方博客公布的信息，Veo 3.1 作为今年 5 月推出的 Veo 3 的迭代更新，主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台，包括面向普通创作者的 Flow 影视制作工具、供开发者使用的 Gemini API 以及企业级的 Vertex AI 平台。

从技术规格上看，Veo 3.1 延续了前代的基础架构，支持 720p 和 1080p 两种分辨率输出，帧率固定在 24fps。单次生成可以选择 4 秒、6 秒或 8 秒三种时长，通过“Extend”延展功能，用户理论上可以将视频延长至 148 秒。

音频能力的提升是 Veo 3.1 此次更新的重点之一。在之前的版本中，诸如“Frames to Video”（首尾帧插值）、“Ingredients to Video”（多图像合成）和“Extend”（场景延展）等功能都不支持原生音频生成，用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道，可以根据画面内容自动生成对应的环境音、对话和音效。

戳链接查看详情：http://t.cn/AXwvr6W0