DeepSeek V4发布_新浪新闻

DeepSeek V4姗姗来迟，但是王者依然是王者！

2026年4月24日，国产开源大模型标杆DeepSeek V4携Pro与Flash双版本正式登场并开源。历经多轮延期，这款被业界寄予厚望的模型虽姗姗来迟，依然有颠覆性技术突破，再次引起轰动。

1、DeepSeek V4最具里程碑意义的一步，是全球首发适配华为昇腾AI芯片，实现从训练到推理的全栈深度协同，中国AI生态自闭环。华为昇腾超节点全系列产品全面支持V4，昇腾950与A3超节点通过融合内核、多流并行及量化算法，为V4-Pro带来20ms低时延推理与4700TPS单卡吞吐，为V4-Flash实现10ms时延与1600TPS吞吐的高性能部署。
这一组合彻底摆脱对英伟达CUDA生态的依赖，构建起中国自主可控的AI算力-模型闭环。英伟达CEO黄仁勋受访怒喷美国限制出口，说DeepSeek V4深度适配华为芯片首发，对美国AI产业是"灾难性"的，因为它意味着全球顶尖AI模型不再受限于美国算力生态，独立生态的崛起将直接冲击英伟达的垄断地位。

2、长上下文处理一直是大模型的核心壁垒，而DeepSeek V4实现了从128K到1M Token的近10倍跨越，可一次性处理约75万字内容，相当于完整容纳《三体》三部曲全文或者一部红楼梦。

支撑这一突破的是三大核心技术创新：KV Cache滑窗和压缩算法。首创CSA（压缩稀疏注意力）与HCA（重度压缩注意力）混合架构，将KV缓存占用降至V3.2的10%（V4-Pro）与7%（V4-Flash），大幅减少Attention计算与访存开销。
稀疏注意力优化，自研DSA稀疏注意力机制，区分信息轻重、强关联精读、弱关联跳过，让百万上下文处理效率实现质的飞跃。估计后续会被效仿。
场景化架构升级，主要针对Agent智能体与Coding编程场景深度优化，V4-Pro在Agentic Coding评测中达到开源模型最佳水平，复杂任务处理能力比肩顶级闭源模型。

3、极致性能与低成本算力的双向突破，是这次V4特点。DeepSeek V4双版本精准覆盖不同场景：

V4-Pro（旗舰版），1.6万亿总参数、49B激活参数，在推理性能、世界知识与Agent能力上全面对标顶级闭源模型。
V4-Flash（高效版），284B总参数、13B激活参数，以更低算力需求实现接近Pro版的能力，API调用成本低至每百万Token仅0.2元（缓存命中）。
能效比更是实现跨越式提升，在1M上下文场景下，V4-Pro单Token推理算力仅为V3.2的27%，V4-Flash更是低至10%，相当于用巧劲替代算力堆砌了，重新定义高效能大模型标准，这在token价格战会有巨大优势。

更重要的是，DeepSeek在V3.2的稀疏注意力、现在V4的混合注意力与KV压缩，其技术思路被全球众多模型借鉴，成为行业公认的创新标杆。
在全球AI竞争格局中，DeepSeek V4的到来，不仅是中国AI的里程碑，更是全球AI开源多元化发展的新起点，进一步打破美国垄断。

发布于广东