爱可可-爱生活 25-03-06 13:19
微博认证:AI博主 2025微博新锐新知博主

【[43星]Audio-Reasoner:首个能深度思考的大型音频语言模型,用大规模音频推理数据训练而成。亮点:1. 实现音频领域的深度推理和结构化思维;2. 构建了120万推理丰富的高质量数据集CoTA;3. 在MMAU-mini和AIR-Bench-Chat基准测试中性能大幅提升】
'Audio-Reasoner: The first Large Audio Language Model that enables native in-depth thinking, which is trained on large-scale audio Chain-of-Thought data.'
GitHub: github.com/xzf-thu/Audio-Reasoner
#音频语言模型# #深度推理# #多模态理解# #AI创造营#

发布于 北京