微软刚开源了VibeVoice文本转语音模型github.com/microsoft/VibeVoice这是个面向播客等长时段、多说话人对话场景的文本转语音（TTS）模型，解决传统 TTS 的可扩展性、说话人一致性与自然轮换问题。支持中英两种语言。可合成最长约 90 分钟语音、最多 4 名说话人（超过常见 1–2 人限制）。#AI创造营

微软刚开源了VibeVoice文本转语音模型
github.com/microsoft/VibeVoice
这是个面向播客等长时段、多说话人对话场景的文本转语音（TTS）模型，解决传统 TTS 的可扩展性、说话人一致性与自然轮换问题。支持中英两种语言。可合成最长约 90 分钟语音、最多 4 名说话人（超过常见 1–2 人限制）。
#AI创造营##微博兴趣创作计划#

发布于山东