互联网的那点事
25-01-25 17:26 微博认证:微博互联网观察家

这个语音克隆模型有点牛P 哈哈哈

使用了 250,000 小时的中英双语语音数据训练

只需15秒的声音就能完美克隆声音,保持音色和情感

Llasa-3B 可以通过输入一个带有情感特征的语音提示(Prompt),在生成目标语音时保留提示语音中的情感特征。

基于 LLaMA 语言模型( 1B、3B 和 8B 参数规模),通过整合 XCodec2 的语音 token 提供语音生成功能。

详细:http://t.cn/A63iCsYN

在线体验:http://t.cn/A63JJwDN http://t.cn/A63iNzw0

发布于 日本