机智的娜娜
26-05-29 20:41 微博认证:汽车博主

你米AI又发新东西了?!

开源可控视频音效生成模型 ControlFoley

我靠咧,最近密度太大我有点学习不过来了。

我先简单瞅瞅……统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音。
哦我知道了,之前AI生成的视频有很多说话是乱套的,俗称AI语
再有就是给视频配声音,比如下雨声、踏步声、击剑声等等

你很难想象下面这段视频的声音,全都是ControlFoley 猜着生成的
其实也不能算“猜”,其实就是足够强大的画面理解能力,和足够强大的声音生成能力,根据画面“脑补”声音而已

发布于 辽宁