张铭PKUCS
25-07-31 02:39 微博认证:北京大学计算机系 张铭教授

斩获ACL最佳论文!组里硕转博同学袁境阳领衔,跟Deepseek合作,论文2025年2月16日一经发布就引起了国内外学界和业界的广泛关注。论文所提出的稀疏注意力NSA模型的算法,从一般任务到严苛的长下文任务,特别是在推理和代码任务都有非常卓越的表现,将长文本处理速度提高了最多11倍,而性能超过了全注意力模型。NSA是一个专为硬件优化的系统,打破了性能与成本之间的权衡取舍,推动高效大型语言模型的下一个前沿领域。

NSA把AI行业的焦点从“模型规模竞赛”拉向“算力效率竞赛”,堪称2025年上半年最具杠杆效应的底层技术突破之一。

感谢论文合作者和ACL社区同行师生们的大力支持!
未来是稀疏的,NSA 为下一代长上下文语言模型提供了高效的基石。

PS. 今年ACL有8200多篇投稿,共1700篇被接受为长文,其中4篇被评为最佳论文。

1. 境阳的获奖感言视频 http://t.cn/A6F6P0P3
2. NSA 论文全文http://t.cn/A6F6P0Pu
3. 2025年5月19日新智源报道“北大DeepSeek论文或预定ACL Best Paper!梁文锋署名”http://t.cn/A6gazPns

发布于 西班牙