阿里发布PrismAudio音效模型

阿里刚刚放出来了一款环境音/音效模型：PrismAudio，5.18亿参数，生成9秒音频只需0.63秒

它把强化学习和思维链结合，先思考，再生成匹配的声音
声画同步、以及音质上的清晰度丰富度感觉还可以

权重：
http://t.cn/AXfEXrNS
http://t.cn/AXfEXrNa

#音效模型##PrismAudio##无声视频配音#

发布于山西