量子位 25-05-21 17:18
微博认证:量子位官方微博

#AI视频告别默剧时代##谷歌首次实现AI音画同步#

谷歌最强视频生成模型Veo 3鲨疯了!

这一次,谷歌从真正意义上,实现了“音画同步”。

请看VCR(花式演绎“We can talk!”)。【视频1】

还能搞定大段rap——

视频中的Flow只需简单一句话就能搞定,比如“让老人谈论宇宙”。【视频2】

谷歌DeepMind CEO哈萨比斯就激动宣布:我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。

通过官方demo,我们也看到了Veo 3电影级的音视频能力:【视频3】

脑洞大开的网友们则开始搞起了抽象……

两个松饼表情丰富地开始了对话,连口型都能完美对上。【视频4】

还复古了上世纪80年代的烹饪节目,并带来全新互动方式:【视频5】

还有我们熟悉的洗脑神曲,连弹舌这种技术活儿都不在话下。(⊙o⊙)【视频6】

当然,除了这些好玩的,更有古希腊数学家毕达哥拉斯开展新式教学(连小蜜蜂都有)。【视频7】

也能直接用来花式营销,一遍又一遍强调同一个概念,主打一个洗脑。【视频8】

而另一边,谷歌首席创意技术专家也透露了一些玩法细节。

他测试了一把Veo 3连续生成长视频的能力。

使用首尾帧功能,他最终制作了下面这个1分钟左右的视频:【视频9】

虽然这里的背景音乐不是由Veo 3生成的,但男主角的自白和各种音效确实有电影内味儿了。

目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放,企业用户可以在Vertex AI平台调用。http://t.cn/A6g0SOmh