想给视频做多语言配音,或者克隆特定声音,市面上的商业工具动不动就按字符收费,长期下来成本实在太高。
最近关注到 Voice-Pro 这个项目,原本是付费软件,后来开发者宣布彻底开源免费,直接把“视频翻译+语音克隆”的门槛打了下来。
整合了从 YouTube 视频下载、人声分离、语音识别到翻译配音的全流程,支持使用 WhisperX 进行高精度字幕生成,更能通过 F5-TTS 和 CosyVoice 实现零样本声音克隆。
GitHub:github.com/abus-aikorea/voice-pro
目前主要支持 Windows 系统搭配 NVIDIA 显卡使用,提供了一键安装脚本自动配置环境,无需复杂的 Python 设置即可运行。
相当于在本地部署了一个免费版的 ElevenLabs,对于有视频出海需求或想做多语言内容的朋友,这绝对是省钱利器。
发布于 广东
