Google Veo 3.1 发布核心信息总结
1. 发布背景与定位:2025年10月16日Google DeepMind推出Veo 3.1,虽为小版本迭代,但重新定义AI视频生成天花板,重点提升叙事理解与音频生成能力,终结AI视频“默片”时代。
2. 四大核心能力
◦ 多素材融合:通过“Ingredients to Video”功能,整合多张含不同人物、物体的参考图生成完整场景,且自带音效。
◦ 场景延展:“Scene Extension”功能可生成超一分钟连续视频,基于前一帧保持故事、背景与人物的连贯性,解决AI视频连贯性难题。
◦ 首尾帧过渡:“From A to B”功能凭首尾帧生成中间完整过渡动画,适合打造史诗级转场。
◦ 精准编辑:支持在Flow中添加新元素(AI自动处理阴影光照),即将推出移除物体功能(无缝重建背景)。
3. 与Sora 2对比:两者各有千秋,Veo 3.1在动作连贯性和物理真实感上更具优势,部分网友仍偏爱Sora 2。
4. 使用方式:提供4种使用途径,分别是面向普通用户的Flow平台(http://flow.google/)与Gemini应用(http://t.cn/AXz1s9GR)、面向开发者的Gemini API(http://t.cn/A6rNN5wO)、面向企业客户的Vertex AI(http://t.cn/AXzBU1F3);且Flow平台发布五个月已生成超2.75亿个视频。
发布于 广东
