不吃西梅的林娜 26-05-08 23:41
微博认证:数码博主

小米AI实验室推出OmniVoice,这是业内首个覆盖600+语种的语音克隆TTS模型,它能实现语音克隆和多语言文本转语音功能。

市面上现有的同类工具,大多只支持十几种主流语言,OmniVoice不一样,它能覆盖646种语言,包括不少平时少见的小语种。

简单来说,你提供一段参考音频,它能模仿出说话人的音色,用对应的语言生成语音。

除了多语言支持,还可以直接描述想要的音色,比如“年轻女声、带点方言口音”,就能生成对应的声音;也能在文本里插入笑声、叹气,让合成的语音像真人一样有情绪;多音字读错了,也能手动纠正。
http://t.cn/AXJezZCY
#小米[超话]##小米#

发布于 广东