蚁工厂 25-08-26 08:46
微博认证:科技博主

微软刚开源了VibeVoice文本转语音模型
github.com/microsoft/VibeVoice
这是个面向播客等长时段、多说话人对话场景的文本转语音(TTS)模型,解决传统 TTS 的可扩展性、说话人一致性与自然轮换问题。支持中英两种语言。可合成最长约 90 分钟语音、最多 4 名说话人(超过常见 1–2 人限制)。
#AI创造营##微博兴趣创作计划#

发布于 山东