爱可可-爱生活 25-09-02 12:05
微博认证:AI博主 2025微博新锐新知博主

GENIE:轻量级 GPT-SoVITS TTS 推理引擎,实现近乎瞬时的 CPU 语音合成体验

• 基于开源 GPT-SoVITS,集成 TTS 推理、ONNX 模型转换及 API 服务,兼顾性能与便捷性
• 支持 GPT-SoVITS V2 模型,默认日语合成,Python 3.9+ 兼容
• CPU 优化显著,首次推理延迟仅1.13秒,远优于官方 PyTorch(1.35s)和 ONNX(3.57s)版本,适配主流 i7-13620H CPU
• 模型轻量,运行时约200MB,便于部署和快速加载,无需 GPU 即可获得极佳体验
• 内置预设角色,免模型文件即可快速试用,支持自定义音色加载及参考音频进行情感、语调克隆
• 提供 ONNX 转换工具,方便将 .pth/.ckpt 模型转为高效推理格式(仅限 V2 模型)
• 搭载 FastAPI 轻量服务器,支持多线程并发请求,配套命令行客户端方便测试和交互
• 计划扩展中文、英语支持,兼容更多模型版本,推出 Docker 镜像及跨平台安装包,持续提升易用性和覆盖面

GENIE 通过极致的 CPU 性能优化与实用工具链,将语音合成推理从 GPU 限制中解放,适合需要高效部署且对响应时长敏感的应用场景。真正做到了轻量级、快速且高度灵活。

🔗 github.com/High-Logic/Genie

#语音合成# #TTS# #ONNX# #机器学习# #轻量推理# #GPT-SoVITS#

发布于 北京