【FlowSep:基于语言查询的声音分离模型,用一句话概括核心价值——通过语言描述分离音频中的特定声音,让音频处理变得从未如此智能!亮点:1. 利用Rectified Flow Matching技术,实现从噪声到目标声音的高效生成;2. 在多个基准测试中超越现有最佳模型;3. 提供简单易用的推理代码,支持自定义音频和文本查询】
'FlowSep: Language-Queried Sound Separation with Rectified Flow Matching'
GitHub: github.com/Audio-AGI/FlowSep
#音频分离# #语言模型# #深度学习# #AI创造营#
发布于 广东
