DeepSeek V4发布_新浪新闻

【国金计算机&科技】DeepSeek V4发布，国产算力加速

本周观点：

DeepSeek-V4 重磅发布——百万上下文普惠时代正式启幕
摘要：2026年4月24日，DeepSeek正式上线并开源DeepSeek-V4预览版，同步发布完整技术报告，推出DeepSeek-V4-Pro与DeepSeek-V4-Flash两个版本，分别具备1.6万亿总参数（49B激活参数）与2840亿总参数（13B激活参数）。该系列模型通过架构创新，将最大上下文长度提升至100万Token，大幅降低计算与内存成本，其中V4-Pro、V4-Flash在百万Token场景下的单Token推理FLOPs及KV Cache占用较V3.2大幅下降。同时，V4-Pro-Max模式在Agent能力、世界知识、推理性能上表现优异，接近世界顶级闭源模型水平，当前已应用于公司内部Agentic Coding场景；成本方面官方预计下半年昇腾950超节点批量上市后将大幅下调价格推动技术普惠。
架构革新赋能效率跃升——从算法到基建的全链路创新
DeepSeek-V4的高效能得益于多项架构创新，形成从算法到底层基建的全链路优化体系。算法层面，采用CSA与HCA融合的混合注意力机制，搭配流形约束超连接（mHC）与Muon优化器，既提升长上下文运算效率，又强化模型建模能力、加快训练收敛速度。底层基建方面，通过MoE模块一体化融合内核、领域专用语言TileLang、FP4量化感知训练等多项优化，实现计算、通信与内存访问的高效协同，降低内存占用与计算开销；训练与推理框架层面，通过自动微分模块拓展、异构KV缓存架构设计等策略，全方位提升训练与推理效率。这些创新不仅支撑了DeepSeek-V4的性能突破，其开源特性也为国内其他国产模型提供了可借鉴的技术范式，助力国内大模型整体水平提升。
国产算力协同适配——Day 0双首发，助力产业自主可控
DeepSeek-V4发布当日即实现寒武纪、华为昇腾两大国产芯片的Day 0适配，彰显了国产大模型与国产算力的深度协同能力。寒武纪基于vLLM推理框架完成适配并开源代码，通过自研融合算子库、高性能编程语言及多维度推理框架优化，深度挖掘硬件特性，充分释放模型推理潜能。华为昇腾超节点全系列产品全面支持该模型，昇腾950通过融合kernel、多流并行等技术及底层架构升级，实现高吞吐、低时延部署；昇腾A3超节点也完成适配并提供训练参考实现。体现了DeepSeek与国产芯片厂商在技术预研、软硬协同上的深入合作，对推动国内大模型软硬件产业协同发展、加速AI算力生态自主可控具有重要意义。

相关标的
国内算力：寒武纪、海光信息、东阳光、利通电子、协创数据、浪潮信息、华勤技术、网宿科技、盈峰环境、芯原股份、华丰科技、晶科科技、亿田智能、豫能控股、星环科技、首都在线、神州数码、百度集团、中芯国际、华虹半导体、中科曙光、润泽科技、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。

海外算力/存储：工业富联、胜宏科技、东山精密、中际旭创、天孚通信、天岳先进、中钨高新、新易盛、兆易创新、沪电股份、大普微、源杰科技、欧科亿、景旺电子、英维克、唯科科技、领益智造等；Lumentum、闪迪、博通、marvell、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。

CPU：海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。

AI应用：1）大模型&自定义Agent：智谱、Minimax、腾讯控股、阿里巴巴、科大讯飞。2）星环科技、德才股份、美年健康、真爱美家、中控技术、金蝶国际、迪普科技、云知声、多点数智、聚水潭、迈富时、阜博集团、范式智能、汇量科技等AI INFRA&高景气&高壁垒。其他：空天时代、具身智能等。

风险提示

行业竞争加剧的风险；技术研发进度不及预期的风险；特定行业下游资本开支周期性波动的风险。

发布于上海