最近正好实验室要做一个年终总结,讲一下 2025 年相关方向的新工作,于是也借此机会顺便写了篇 Blog 来作为整个 2025 的结束。接下来可能我对我关注的方向各选一到两个工作来介绍(太多了可能介绍不过来)。
- Linear Attention(线性注意力)
- Sparse Attention(稀疏注意力)
- DeepSeek-V3.2
- MegaKernel(巨型内核)
- Deep Learning Compiler(深度学习编译器)
- RL(强化学习)
- 计算-通信重叠
阅读原文:http://t.cn/AXqTKetv
#青稞社区##How I AI##人工智能[超话]#
发布于 河北
