阿里刚刚放出来了一款环境音/音效模型:PrismAudio,5.18亿参数,生成9秒音频只需0.63秒
它把强化学习和思维链结合,先思考,再生成匹配的声音
声画同步、以及音质上的清晰度丰富度感觉还可以
权重:
http://t.cn/AXfEXrNS
http://t.cn/AXfEXrNa
#音效模型##PrismAudio##无声视频配音#
发布于 山西
阿里刚刚放出来了一款环境音/音效模型:PrismAudio,5.18亿参数,生成9秒音频只需0.63秒
它把强化学习和思维链结合,先思考,再生成匹配的声音
声画同步、以及音质上的清晰度丰富度感觉还可以
权重:
http://t.cn/AXfEXrNS
http://t.cn/AXfEXrNa
#音效模型##PrismAudio##无声视频配音#