#DeepSeek新模型曝光# DeepSeek-R1发布一周年之际,核心算法库惊现MODEL1,是V4还是R2?
2025年1月20日,DeepSeek-R1正式发布。从此,国产大模型第一次走到了全球舞台的核心位置,开启了开源时代。
而就在今天深夜,开发者社区沸腾了:DeepSeek的一个存储库进行更新,引用了一个全新的「model 1」模型。
DeepSeek-R1一年了,但DeepSeek-R2还没来。
而这个被爆出的MODEL1,极有可能就是R2!
在DeepSeek的开源项目FlashMLA库代码片段明确引用了「MODEL1」,并且伴随针对KV缓存的新优化,和576B步幅的稀疏FP8解码支持。
FlashMLA是DeepSeek的优化注意力内核库,为DeepSeek-V3和DeepSeek-V3.2-Exp模型提供支持。
github:http://t.cn/A636aiMk
