歸藏的AI工具箱 25-01-14 01:06
微博认证:AI博主

Kokoro 82M 这个 TTS 模型也太好了#AI创造营##ai#

模型大小只有不到 300M,生成的音频质量很高

在 T4 上,只需要 4.5 秒就能生成 2 分 25 秒的语音

可惜的是只支持英文,不过可以按他们的架构训练其他语言,只需要不到 100 小时的音频数据

模型下载:huggingface.co/hexgrad/Kokoro-82M
模型演示:huggingface.co/spaces/hexgrad/Kokoro-TTS http://t.cn/A6u1KvkJ

发布于 北京