AI存储芯片行业分析

AI存储芯片行业观点更新

1、AI存储行业发展现状与核心逻辑
a. 价格拉动：相较于2025年年中未涨价时的水平，当前存储价格已经翻3~4倍；
b. 量增路径：量的层面核心通过提升机动、稼动率实现增长，年化提升幅度约百分之十几；
c. 利润弹性：存储属于重资产行业，营收覆盖固定成本后，新产生的涨价红利扣除个税后基本全部转化为净利润，因此净利增速远超营收增速。
·AI行业商业化落地进展：
a. AI价值链构成：AI价值链可划分为硬件、云服务厂商、大模型厂商以及具体商业化落地四大环节；
b. 行业认知变化：2025年上半年市场对AI产业的讨论仍以泡沫论为主，进入2026年Q1后，随着Agent工具如Cloud Code、Open Cloud等陆续落地，市场对AI商业化的信心持续提升；
c. 商业化验证迹象：当前大模型厂商推出的订阅制、卖token的商业化方案销量表现优异，阿里、智谱的coding plan均处于持续售罄状态，同时算力租赁价格持续上涨，对上游相关产品价格形成了明显支撑，AI商业化跑通的发展方向愈发明确。
·存储环节盈利与竞争格局：a. 价值量占比趋势：AI硬件板块中，算力芯片、光模块、液冷服务器整机的竞争格局相对稳固，而内存在AI硬件中的价值量占比呈现明显提升趋势，对应的毛利、净利水平也在不断攀升；
b. 盈利水平变化：从过去十年的行业数据来看，存储与硬盘行业的平均毛利率约为30%，平均净利润约为10%，而根据美光最新季度的经营数据，其毛利率已经攀升至70%-80%，净利润达到50%-60%，盈利水平实现了大幅跃升；
c. 竞争格局情况：存储行业的竞争格局十分优异，细分赛道集中度极高，其中DRAM领域仅3家厂商布局，NAND领域仅5家厂商布局。
2、存储分级与AI芯片架构拆解
·存储分类与分级逻辑：存储分为内存与硬盘两类，内存包括GPU对应的GDDR、CPU对应的DDR，硬盘包括NAND Flash组成的SSD以及传统机械硬盘HDD。厂商格局方面，内存核心厂商为三星、海力士、美光三家，三星与海力士市占率基本持平，美光稍低；硬盘厂商在前三家基础上新增铠侠、闪迪共五家，两类存储的CR3、CR5均在90%以上，竞争格局集中。存储可按数据热度分为三级：冷数据对应柜外HDD/SSD，特性为容量大、价格低；温数据对传输速度有一定要求，对应柜内SSD，速度与价格适中；热数据为训练、推理阶段即时调用的数据，存放于DRAM（含HBM、DDR），传输速度要求高、带宽高、速度快但价格高。各级存储的特性由物理结构决定：DRAM采用etc结构存储，容量小、读取速度快；NAND类存储采用浮栅晶体管结构，单单元可存1-4比特数据，容量大但速度相对较慢。
·英伟达GB200存储配置拆解：英伟达GB200的单计算单元包含2个GPU、1个CPU，GPU与HBM、LPDDR的配比稳定，单GPU旁搭配8片HBM，对应8个LP点，因此单计算单元共配置16片HBM、16个LPDDR。各存储的具体参数如下：单HBM容量为24GB，通过CoWoS封装工艺与GPU集成，单GPU对应HBM总容量达192GB；单GPU搭配的LPDDR容量为256GB；SSD层面，单个计算托盘标配4块3.84TB SSD，最多可扩展8个接口，单盘最高可扩容至7.68TB，因此单GPU对应的SSD容量范围为3.84TB-15.36TB。HBM与LPDDR均为DRAM类内存，容量相近但带宽差距达十几倍，核心差异源于物理定位带来的位宽差距。功能定位上，HBM属于核心计算层存储，推理与训练阶段主要存放模型参数、KV Cache，容量不足时将数据下放到LPDDR；LPDDR作为HBM的备用空间，主要存放低频KV Cache；LPDDR容量不足时数据再下放到SSD，SSD还可存放训练阶段的Checkpoint、推理阶段的模型适配器，HDD则存放训练原始数据、推理日志与长尾归档数据。
·Rubin架构存储配置变化：Rubin架构的整体Pod由多类机柜构成，中间为计算机柜，计算机柜上下层为计算托盘，中间为负责scale-up的NVSwitch交互托盘；左侧为柜内SSD机柜，以及负责连接其他数据中心的机柜；右侧为4个负责机柜间互联的NV Spectrum平台，承担scale-out功能。计算托盘的基础配置与GB200相近，单个计算托盘含2块板，每块板上搭载2个GPU、1个CPU。与GB200架构相比，Rubin架构的存储用量有明显提升，其中单GPU对应的FP16用量翻倍、容量提升1.5倍，综合来看，HBM用量提升1.5倍，LPDDR用量提升3倍。
·各级存储参数与瓶颈分析：以GB200为例，各级存储的核心参数呈现明显分层特征：a. SRAM为GPU片上存储，单GPU对应容量为233MB，属于最热层数据存储，直接服务于GPU运算；b. HBM为CoWoS封装的片外DRAM，带宽达8TB/s，容量192GB；c. LPDDR为PCB板上的DRAM，带宽为546GB/s，容量256GB，带宽较HBM低十几倍；d. SSD位于计算托盘外，带宽较LPDDR慢约30倍，容量为3.84TB-15.36TB，整体符合“层级越靠近GPU，容量越小、带宽越快”的规律。瓶颈方面，单GPU的FP16精度算力约为10TB/s，远高于HBM的8TB/s带宽，虽可通过算法优化缓解部分问题，但本质上GPU运算效率仍受存储环节制约，存储容量墙、带宽墙是当前GPU运算效率提升的核心瓶颈。
3、存储供需格局与需求驱动因素
·存储供需格局测算：全球存储晶圆产能方面，DRAM月产能180万片，NAND月产能200万片，HBM月产能32.6万片。GPU供给受台积电产能限制，年度增量有限，2025年全球总产能970万片，2026年预期达1200万片，供给以英伟达为主，谷歌TPU、华为等厂商产品均纳入统计。经测算，单GPU对应NAND需求约16TB，AI领域NAND需求规模较大，叠加云端额外存储配置需求，GPU对应的存储配比仍有弹性空间。DRAM方面，单晶圆可产出3~5TB DRAM，2026年1200万片GPU对应的DRAM需求约为86.4亿GB，叠加消费电子、PC、手机、汽车、工业等其他领域的DRAM需求，AI领域存储需求占比已从2024-2025年的10%以上提升至2026年的30%左右，后续仍有较大提升空间。此外，Robin系列产品较GB系列对DRAM、HBM、NAND的需求均有明显提升，2026年各存储产品供需缺口均在10%以上，且存储厂商扩产节奏较慢，供需缺口将持续存在。
·大模型存储需求核心原理：大语言模型基于Transformer架构设计，存储需求核心驱动来源于KV Cache的存储要求：输入文本经token化处理后，转换为维度可达数万个的语义向量，部分维度可被人类理解，部分为抽象维度；向量经线性投影生成Q、K、V值，由于大模型输出每个token时均需依赖前序token的计算结果，因此KV Cache需要长期保存在内存中，直接推高存储容量与带宽需求。大模型训练与推理阶段数据流转路径清晰，各级存储承担不同功能：训练阶段，模型权重先从SSD预热加载，经CPU完成token化处理后回传，再传输至HBM后传入GPU计算，结果回传CPU处理后，模型Checkpoint写入SSD存储。推理阶段，首先通过交换机接收用户请求，经CPU处理并完成token化后传输至GPU，计算完成后将结果回传交换机返回用户；模型加载同样通过SSD完成，温数据也存储在SSD中。
·存储需求多维度驱动因素：大模型参数量与上下文长度的持续增长对存储需求形成指数级拉动，算法优化无法抵消需求增长，核心驱动因素包括：
a. 量化压缩已达技术极值：谷歌TurboQuant算法将模型精度从原有的FP16、FP32压缩至3比特，存储效率提升6~8倍。此前量化压缩已实现4比特压缩，此次降至3比特已达技术极值，后续无进一步压缩空间，存储需求端潜在利空已完全释放；且3比特相对4比特的边际改善十分有限，完全无法抵消模型参数量、上下文长度十倍乃至百倍提升带来的需求增长。
b. 大模型迭代与架构创新：Scaling Law持续生效，更大参数量的模型需要更大显存存放参数，同时需要更多SSD空间存放原始数据；MoE架构作为带宽不足的工程解决方案，万亿级模型每次仅激活1000亿参数以降低带宽压力，但全量模型仍需全部存储在HBM中，存储容量需求依然高企。
c. 长上下文与多模态升级：GPT-3上下文长度仅2000token，GPT-4已提升至44万token，当前主流厂商已可支持百万token级上下文，更长上下文窗口需要更多KV Cache存储在HBM中；多模态模型处理图片、音频、视频数据时，存储需求较文本呈指数级增长。
d. 推理端技术优化：推理端RAG、CoT等技术应用广泛，尤其是CoT产生的大量中间推理token，会进一步占用KV Cache空间，提升对HBM带宽与容量的要求。
4、存储核心厂商分析与风险提示
·核心存储厂商业务情况：美股存储标的方面，美光是美股唯一同时覆盖DRAM和NAND的标的，当前在HBM领域正奋起直追，拥有千亿规模HBM扩产计划，但产能落地及进入英伟达供应链节奏偏缓，长期增长确定性较强，业绩弹性主要来自HBM业务释放。闪迪是美股唯一纯NAND标的，核心业务为NAND Flash制造，同时拥有HBM相关业务作为额外增长期权，其中HBF是介于DRAM和SSD之间的产品，通过多个NAND Flash堆叠实现带宽增长。相较于HBM、DRAM，NAND的需求弹性更高：HBM与DRAM在GPU中的配比较为固定，单GPU通常配备对应1:8或1:16 FP点的HBM/DRAM容量，需求稳定易测算；而NAND可根据云厂商、大型企业训练及推理阶段的额外存储需求灵活扩容，单GPU对应的NAND配置量增长空间更大，因此弹性更高。韩系厂商海力士、三星业务结构与美光相近，DRAM、NAND业务占比约8:2，其中海力士是英伟达HBM第一供应商，充分受益于HBM行业高成长；三星拥有HBM底层逻辑芯片产能，未来增长空间充足。价端方面，美光26财年Q3（对应自然年2025年12月-2026年2月）产品综合涨价约70%，其中DRAM涨幅超60%，NAND涨幅超70%，对应2026年Q1营收涨幅预计约90%，符合预期，同期三星盈利表现同样亮眼。
·存储厂商估值水平：从估值维度来看，当前全球核心存储厂商估值处于相对低位，具备充足的上行修复空间。其中三星、海力士、美光三家覆盖多品类存储芯片的主流厂商，以当前股价测算，未来四个季度的PE预计可降至3倍左右；主打NAND业务的闪迪与铠侠两家厂商，当前对应的PE水平约为4倍。若存储行业景气度持续上行，市场给予行业的合理目标PE区间抬升至6-8倍，上述核心存储标的股价尚有一倍左右的上行空间。
·行业风险因素：存储行业当前主要面临三类核心风险：
a. 下游资本开支（capex）不及预期；
b. 存储原厂产能持续扩张导致竞争格局恶化；
c. 新技术研发遭遇瓶颈、良率爬升不及预期。

发布于北京