【国金计算机&科技】DeepSeek V4发布,国产算力加速
本周观点:
DeepSeek-V4 重磅发布——百万上下文普惠时代正式启幕
摘要:2026年4月24日,DeepSeek正式上线并开源DeepSeek-V4预览版,同步发布完整技术报告,推出DeepSeek-V4-Pro与DeepSeek-V4-Flash两个版本,分别具备1.6万亿总参数(49B激活参数)与2840亿总参数(13B激活参数)。该系列模型通过架构创新,将最大上下文长度提升至100万Token,大幅降低计算与内存成本,其中V4-Pro、V4-Flash在百万Token场景下的单Token推理FLOPs及KV Cache占用较V3.2大幅下降。同时,V4-Pro-Max模式在Agent能力、世界知识、推理性能上表现优异,接近世界顶级闭源模型水平,当前已应用于公司内部Agentic Coding场景;成本方面官方预计下半年昇腾950超节点批量上市后将大幅下调价格推动技术普惠。
架构革新赋能效率跃升——从算法到基建的全链路创新
DeepSeek-V4的高效能得益于多项架构创新,形成从算法到底层基建的全链路优化体系。算法层面,采用CSA与HCA融合的混合注意力机制,搭配流形约束超连接(mHC)与Muon优化器,既提升长上下文运算效率,又强化模型建模能力、加快训练收敛速度。底层基建方面,通过MoE模块一体化融合内核、领域专用语言TileLang、FP4量化感知训练等多项优化,实现计算、通信与内存访问的高效协同,降低内存占用与计算开销;训练与推理框架层面,通过自动微分模块拓展、异构KV缓存架构设计等策略,全方位提升训练与推理效率。这些创新不仅支撑了DeepSeek-V4的性能突破,其开源特性也为国内其他国产模型提供了可借鉴的技术范式,助力国内大模型整体水平提升。
国产算力协同适配——Day 0双首发,助力产业自主可控
DeepSeek-V4发布当日即实现寒武纪、华为昇腾两大国产芯片的Day 0适配,彰显了国产大模型与国产算力的深度协同能力。寒武纪基于vLLM推理框架完成适配并开源代码,通过自研融合算子库、高性能编程语言及多维度推理框架优化,深度挖掘硬件特性,充分释放模型推理潜能。华为昇腾超节点全系列产品全面支持该模型,昇腾950通过融合kernel、多流并行等技术及底层架构升级,实现高吞吐、低时延部署;昇腾A3超节点也完成适配并提供训练参考实现。体现了DeepSeek与国产芯片厂商在技术预研、软硬协同上的深入合作,对推动国内大模型软硬件产业协同发展、加速AI算力生态自主可控具有重要意义。
相关标的
国内算力:寒武纪、海光信息、东阳光、利通电子、协创数据、浪潮信息、华勤技术、网宿科技、盈峰环境、芯原股份、华丰科技、晶科科技、亿田智能、豫能控股、星环科技、首都在线、神州数码、百度集团、中芯国际、华虹半导体、中科曙光、润泽科技、大位科技、润建股份、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。
海外算力/存储:工业富联、胜宏科技、东山精密、中际旭创、天孚通信、天岳先进、中钨高新、新易盛、兆易创新、沪电股份、大普微、源杰科技、欧科亿、景旺电子、英维克、唯科科技、领益智造等;Lumentum、闪迪、博通、marvell、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。
CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。
AI应用:1)大模型&自定义Agent:智谱、Minimax、腾讯控股、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、真爱美家、中控技术、金蝶国际、迪普科技、云知声、多点数智、聚水潭、迈富时、阜博集团、范式智能、汇量科技等AI INFRA&高景气&高壁垒。其他:空天时代、具身智能等。
风险提示
行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。
发布于 上海
