蚁工厂 26-04-23 20:03
微博认证:科技博主

DeepSeek发新项目了!但不是v4[捂嘴哭]
地址:github.com/deepseek-ai/TileKernels
TileKernels: 为 LLM 操作优化的 GPU 内核,基于 TileLang 构建。TileLang 是一种领域专用语言,用 Python 表达高性能 GPU 内核,具备易于迁移、开发敏捷和自动优化等特点。

这个项目中的大多数内核,在计算强度和内存带宽方面都接近硬件性能上限。其中一部分已经用于内部训练和推理场景。不过,这些实现还不代表最佳实践,我们也在持续改进代码质量和文档。

从DeepSeek到前几天的Kimi,都还在不断做优化,还是缺卡啊。[捂嘴哭]
#AI创造营##How I AI#

发布于 山东