【[43星]Audio-Reasoner:首个能深度思考的大型音频语言模型,用大规模音频推理数据训练而成。亮点:1. 实现音频领域的深度推理和结构化思维;2. 构建了120万推理丰富的高质量数据集CoTA;3. 在MMAU-mini和AIR-Bench-Chat基准测试中性能大幅提升】
'Audio-Reasoner: The first Large Audio Language Model that enables native in-depth thinking, which is trained on large-scale audio Chain-of-Thought data.'
GitHub: github.com/xzf-thu/Audio-Reasoner
#音频语言模型# #深度推理# #多模态理解# #AI创造营#
发布于 北京
