油管搞了一个AI配音。
因为油管有大约25%的是跨语言的观看者。
以前的配音和字幕,那个观感太差了,很生硬,是机械式的。
现在AI可以做到,音色和up主的一样,然后语言换成其它语言,连语音里面的情感也能模仿。
比如说一个英文up主,AI配音就好像他本人学会了中文一样。
B站也搞了一个文本转语音的模型,叫IndexTTS。
以前发布了1.0,1.5,这次发布了2.0版本。
连情感也能模拟,我听了效果不错。
这个模型不大,应该是消费级显卡就能部署。
项目地址:huggingface.co/IndexTeam/IndexTTS-2
发布于 江苏
