DeepSeek新模型V4曝光

#微博声浪计划##听见微博# DeepSeek新模型曝光，其新一代旗舰模型V4核心架构MODEL1因GitHub代码更新意外公开。该架构在KV缓存、FP8量化等方面革新，支持百万Token上下文，推理成本仅为GPT-4 Turbo的1/70，预计2026年春节发布，或推动国产大模型效率革命。 http://t.cn/AXGDAOkl

发布于河北