麻省理工科技评论 25-10-16 19:08
微博认证:《麻省理工科技评论》杂志官方微博

【谷歌Veo 3.1来了,但来得似乎有点仓促】

当地时间 10 月 15 日,就在 #OpenAI# 于上月底推出全新的 Sora 2 后不到三周,谷歌也端出了自家#视频生成模型# 的最新版本——Veo 3.1。

根据#谷歌# 官方博客公布的信息,Veo 3.1 作为今年 5 月推出的 Veo 3 的迭代更新,主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台,包括面向普通创作者的 Flow 影视制作工具、供开发者使用的 Gemini API 以及企业级的 Vertex AI 平台。

从技术规格上看,Veo 3.1 延续了前代的基础架构,支持 720p 和 1080p 两种分辨率输出,帧率固定在 24fps。单次生成可以选择 4 秒、6 秒或 8 秒三种时长,通过“Extend”延展功能,用户理论上可以将视频延长至 148 秒。

音频能力的提升是 Veo 3.1 此次更新的重点之一。在之前的版本中,诸如“Frames to Video”(首尾帧插值)、“Ingredients to Video”(多图像合成)和“Extend”(场景延展)等功能都不支持原生音频生成,用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道,可以根据画面内容自动生成对应的环境音、对话和音效。

戳链接查看详情:http://t.cn/AXwvr6W0