阿里昨晚放出了最新款TTS:Qwen3-TTS,秒级克隆、一句话设计新音色、实时流式输出,0.6B
可跨语种多语,中文克隆后直接说英日韩德法俄西葡意+ 四川话、北京话等方言,音色不变
Dual-Track双轨架构,输入1个字就能出首包音频,端到端延迟97 ms,可以做直播、实时翻译、AI客服了
用它做有声书,可以一人分饰多角,情绪、方言全有了
有1.7B和0.6B两个尺寸,1.7B性能最优,具备控制能力,0.6B均衡性能与效率
github:http://t.cn/AXGFmajy
模型:http://t.cn/AXGFmajL
#tts##Qwen3TTS##HOW I AI# http://t.cn/AXGFmNZK
发布于 山西
