爱可可-爱生活 25-08-06 06:43
微博认证:AI博主 2025微博新锐新知博主

Kitten TTS:革命性的超轻量级文本转语音模型,参数仅1500万,模型体积小于25MB,支持无GPU运行,适配低端设备,提供多款高质量声音选项,实现实时快速语音合成。

• 极致轻量:模型小于25MB,适合边缘设备离线部署,无需依赖云端。
• 高性能:CPU优化,支持多种设备,Mac M2实测速度媲美EdgeTTS。
• 多声音选择:现有多款男女声音,未来将支持更多声音和更大文本输入。
• 开发者友好:Python安装简单,未来计划发布移动端SDK及自定义声音微调功能。
• 开源透明:Apache-2.0许可,代码及模型权重均公开,社区活跃持续迭代。

未来规划包括:发布完整训练代码、移动端SDK、Web版本及更丰富的音色和语言支持。小模型革命已来,Kitten TTS为边缘AI语音应用提供了理想解决方案。

体验及源码👇
github.com/KittenML/KittenTTS
huggingface.co/KittenML/kitten-tts-nano-0.1

#文本转语音##轻量级AI##边缘计算##开源模型##实时语音合成# http://t.cn/A6F3kXEw

发布于 日本