爱可可-爱生活 25-06-28 14:09
微博认证:AI博主 2025微博新锐新知博主

【[73星] nsa-impl:高效实现原生稀疏注意力机制的PyTorch项目。亮点:1. 结合压缩、选择和滑动窗口注意力机制,大幅提升效率;2. 支持单次和两次反向传播变体,灵活适应不同需求;3. 高吞吐量的Triton内核,优化性能表现】
'NSA: Native Sparse Attention'
GitHub: github.com/tilde-research/nsa-impl
#稀疏注意力# #PyTorch# #高性能计算# #人工智能# #ai兴趣创作计划#

发布于 北京