开源 TTS 模型实力新秀!OmniVoice 音色迁移 + 语音设计全体验~
上期聊到 LongCat-AudioDiT 是表现突出的开源 TTS,这期带来新惊喜!刚开源的 OmniVoice 实力亮眼,支持 600 + 语言与石家庄方言,RTF 低至 0.025,显存仅需 5G。
本期完整实测:音色迁移、语音属性修改、拼音声调微调、多人对话生成,对比 LongCat-AudioDiT 效果与速度,还附上 ComfyUI 工作流教程,轻松实现高质量 TTS 生成,后续也会作为 OpenClaw 语音聊天的主力模型。
#openclaw##how i ai##comfyui##aigc##ai# http://t.cn/AXM43yZF
发布于 浙江
