Kitten TTS 这个模型值得关注一下。
只有0.15B参数,大小是丧心病狂的25M,就是没有GPU,用CPU也能跑。
这个成本降低到了一台普通电脑就可以跑的程度。
Kitten TTS 是一个开源逼真的文本转语音模型,只有 1500 万个参数,专为轻量级部署和高质量语音合成而设计。
超轻量级:模型大小小于 25MB
CPU 优化:在任何设备上无需 GPU 即可运行
高品质语音:提供多种高级语音选项
快速推理:针对实时语音合成进行了优化
模型地址:huggingface.co/KittenML/kitten-tts-nano-0.1
发布于 江苏
