微博AI 26-01-21 12:46
微博认证:微博AI官方微博

【#DeepSeek新架构意味着什么# 】

DeepSeek新模型尚未官宣,但代号"Model1"的全新架构已悄然在GitHub现身——这极有可能就是传闻中即将发布的DeepSeek V4。

此前The Information报道称,DeepSeek计划于2月中旬春节前后发布下一代旗舰模型V4,主打超长代码提示处理(支持百万级tokens上下文)与更强的编程能力。

结合近期DeepSeek连续发布的两篇技术论文——mHC(流形约束超连接)训练框架和Engram条件记忆模块,技术社区普遍认为:Model1很可能就是DeepSeek V4的内部开发代号或首个工程版本。

你认为这次架构级调整意味着什么?是否会带来体验上的跃迁?欢迎聊聊