【阿里通义实验室发布两款语音大模型,一句话即可自由生成个性化语音】
2026年3月2日,阿里通义实验室正式发布 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 两款语音模型,支持通过自然语言指令直接控制语音生成,告别固定情绪标签!
🎙️ Fun-CosyVoice3.5:在 Instruct-TTS 方向实现能力升级,复刻下支持 FreeStyle 指令控制生成效果,一句话自由生成语音。
🎧 Fun-AudioGen-VD:端到端声音设计系统,支持根据自然语言描述,生成目标音色、情绪表达和完整听觉场景,实现“人物 + 场景”的一体化声音生成。
从"选标签"到"说人话",语音生成进入 FreeStyle 自由创作时代。
