阶跃开源了一个统治级 130B 的超大语音模型!!!
业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统
- 支持多语言对话(中文,英文,日语)
- 语音情感(开心,悲伤)
- 方言(粤语,四川话)
- 可控制语速及韵律风格
- 支持RAP和哼唱等
- 语音克隆
太强了,这下真的一步到位了#AI创造营##ai#
项目地址:github.com/stepfun-ai/Step-Audio/tree/main http://t.cn/A615Dy7j
发布于 北京
阶跃开源了一个统治级 130B 的超大语音模型!!!
业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统
- 支持多语言对话(中文,英文,日语)
- 语音情感(开心,悲伤)
- 方言(粤语,四川话)
- 可控制语速及韵律风格
- 支持RAP和哼唱等
- 语音克隆
太强了,这下真的一步到位了#AI创造营##ai#
项目地址:github.com/stepfun-ai/Step-Audio/tree/main http://t.cn/A615Dy7j