朱新宝2026 26-04-23 06:41

AI存储芯片行业观点更新

1、AI存储行业发展现状与核心逻辑
a. 价格拉动:相较于2025年年中未涨价时的水平,当前存储价格已经翻3~4倍;
b. 量增路径:量的层面核心通过提升机动、稼动率实现增长,年化提升幅度约百分之十几;
c. 利润弹性:存储属于重资产行业,营收覆盖固定成本后,新产生的涨价红利扣除个税后基本全部转化为净利润,因此净利增速远超营收增速。
·AI行业商业化落地进展:
a. AI价值链构成:AI价值链可划分为硬件、云服务厂商、大模型厂商以及具体商业化落地四大环节;
b. 行业认知变化:2025年上半年市场对AI产业的讨论仍以泡沫论为主,进入2026年Q1后,随着Agent工具如Cloud Code、Open Cloud等陆续落地,市场对AI商业化的信心持续提升;
c. 商业化验证迹象:当前大模型厂商推出的订阅制、卖token的商业化方案销量表现优异,阿里、智谱的coding plan均处于持续售罄状态,同时算力租赁价格持续上涨,对上游相关产品价格形成了明显支撑,AI商业化跑通的发展方向愈发明确。
·存储环节盈利与竞争格局:a. 价值量占比趋势:AI硬件板块中,算力芯片、光模块、液冷服务器整机的竞争格局相对稳固,而内存在AI硬件中的价值量占比呈现明显提升趋势,对应的毛利、净利水平也在不断攀升;
b. 盈利水平变化:从过去十年的行业数据来看,存储与硬盘行业的平均毛利率约为30%,平均净利润约为10%,而根据美光最新季度的经营数据,其毛利率已经攀升至70%-80%,净利润达到50%-60%,盈利水平实现了大幅跃升;
c. 竞争格局情况:存储行业的竞争格局十分优异,细分赛道集中度极高,其中DRAM领域仅3家厂商布局,NAND领域仅5家厂商布局。
2、存储分级与AI芯片架构拆解
·存储分类与分级逻辑:存储分为内存与硬盘两类,内存包括GPU对应的GDDR、CPU对应的DDR,硬盘包括NAND Flash组成的SSD以及传统机械硬盘HDD。厂商格局方面,内存核心厂商为三星、海力士、美光三家,三星与海力士市占率基本持平,美光稍低;硬盘厂商在前三家基础上新增铠侠、闪迪共五家,两类存储的CR3、CR5均在90%以上,竞争格局集中。存储可按数据热度分为三级:冷数据对应柜外HDD/SSD,特性为容量大、价格低;温数据对传输速度有一定要求,对应柜内SSD,速度与价格适中;热数据为训练、推理阶段即时调用的数据,存放于DRAM(含HBM、DDR),传输速度要求高、带宽高、速度快但价格高。各级存储的特性由物理结构决定:DRAM采用etc结构存储,容量小、读取速度快;NAND类存储采用浮栅晶体管结构,单单元可存1-4比特数据,容量大但速度相对较慢。
·英伟达GB200存储配置拆解:英伟达GB200的单计算单元包含2个GPU、1个CPU,GPU与HBM、LPDDR的配比稳定,单GPU旁搭配8片HBM,对应8个LP点,因此单计算单元共配置16片HBM、16个LPDDR。各存储的具体参数如下:单HBM容量为24GB,通过CoWoS封装工艺与GPU集成,单GPU对应HBM总容量达192GB;单GPU搭配的LPDDR容量为256GB;SSD层面,单个计算托盘标配4块3.84TB SSD,最多可扩展8个接口,单盘最高可扩容至7.68TB,因此单GPU对应的SSD容量范围为3.84TB-15.36TB。HBM与LPDDR均为DRAM类内存,容量相近但带宽差距达十几倍,核心差异源于物理定位带来的位宽差距。功能定位上,HBM属于核心计算层存储,推理与训练阶段主要存放模型参数、KV Cache,容量不足时将数据下放到LPDDR;LPDDR作为HBM的备用空间,主要存放低频KV Cache;LPDDR容量不足时数据再下放到SSD,SSD还可存放训练阶段的Checkpoint、推理阶段的模型适配器,HDD则存放训练原始数据、推理日志与长尾归档数据。
·Rubin架构存储配置变化:Rubin架构的整体Pod由多类机柜构成,中间为计算机柜,计算机柜上下层为计算托盘,中间为负责scale-up的NVSwitch交互托盘;左侧为柜内SSD机柜,以及负责连接其他数据中心的机柜;右侧为4个负责机柜间互联的NV Spectrum平台,承担scale-out功能。计算托盘的基础配置与GB200相近,单个计算托盘含2块板,每块板上搭载2个GPU、1个CPU。与GB200架构相比,Rubin架构的存储用量有明显提升,其中单GPU对应的FP16用量翻倍、容量提升1.5倍,综合来看,HBM用量提升1.5倍,LPDDR用量提升3倍。
·各级存储参数与瓶颈分析:以GB200为例,各级存储的核心参数呈现明显分层特征:a. SRAM为GPU片上存储,单GPU对应容量为233MB,属于最热层数据存储,直接服务于GPU运算;b. HBM为CoWoS封装的片外DRAM,带宽达8TB/s,容量192GB;c. LPDDR为PCB板上的DRAM,带宽为546GB/s,容量256GB,带宽较HBM低十几倍;d. SSD位于计算托盘外,带宽较LPDDR慢约30倍,容量为3.84TB-15.36TB,整体符合“层级越靠近GPU,容量越小、带宽越快”的规律。瓶颈方面,单GPU的FP16精度算力约为10TB/s,远高于HBM的8TB/s带宽,虽可通过算法优化缓解部分问题,但本质上GPU运算效率仍受存储环节制约,存储容量墙、带宽墙是当前GPU运算效率提升的核心瓶颈。
3、存储供需格局与需求驱动因素
·存储供需格局测算:全球存储晶圆产能方面,DRAM月产能180万片,NAND月产能200万片,HBM月产能32.6万片。GPU供给受台积电产能限制,年度增量有限,2025年全球总产能970万片,2026年预期达1200万片,供给以英伟达为主,谷歌TPU、华为等厂商产品均纳入统计。经测算,单GPU对应NAND需求约16TB,AI领域NAND需求规模较大,叠加云端额外存储配置需求,GPU对应的存储配比仍有弹性空间。DRAM方面,单晶圆可产出3~5TB DRAM,2026年1200万片GPU对应的DRAM需求约为86.4亿GB,叠加消费电子、PC、手机、汽车、工业等其他领域的DRAM需求,AI领域存储需求占比已从2024-2025年的10%以上提升至2026年的30%左右,后续仍有较大提升空间。此外,Robin系列产品较GB系列对DRAM、HBM、NAND的需求均有明显提升,2026年各存储产品供需缺口均在10%以上,且存储厂商扩产节奏较慢,供需缺口将持续存在。
·大模型存储需求核心原理:大语言模型基于Transformer架构设计,存储需求核心驱动来源于KV Cache的存储要求:输入文本经token化处理后,转换为维度可达数万个的语义向量,部分维度可被人类理解,部分为抽象维度;向量经线性投影生成Q、K、V值,由于大模型输出每个token时均需依赖前序token的计算结果,因此KV Cache需要长期保存在内存中,直接推高存储容量与带宽需求。大模型训练与推理阶段数据流转路径清晰,各级存储承担不同功能:训练阶段,模型权重先从SSD预热加载,经CPU完成token化处理后回传,再传输至HBM后传入GPU计算,结果回传CPU处理后,模型Checkpoint写入SSD存储。推理阶段,首先通过交换机接收用户请求,经CPU处理并完成token化后传输至GPU,计算完成后将结果回传交换机返回用户;模型加载同样通过SSD完成,温数据也存储在SSD中。
·存储需求多维度驱动因素:大模型参数量与上下文长度的持续增长对存储需求形成指数级拉动,算法优化无法抵消需求增长,核心驱动因素包括:
a. 量化压缩已达技术极值:谷歌TurboQuant算法将模型精度从原有的FP16、FP32压缩至3比特,存储效率提升6~8倍。此前量化压缩已实现4比特压缩,此次降至3比特已达技术极值,后续无进一步压缩空间,存储需求端潜在利空已完全释放;且3比特相对4比特的边际改善十分有限,完全无法抵消模型参数量、上下文长度十倍乃至百倍提升带来的需求增长。
b. 大模型迭代与架构创新:Scaling Law持续生效,更大参数量的模型需要更大显存存放参数,同时需要更多SSD空间存放原始数据;MoE架构作为带宽不足的工程解决方案,万亿级模型每次仅激活1000亿参数以降低带宽压力,但全量模型仍需全部存储在HBM中,存储容量需求依然高企。
c. 长上下文与多模态升级:GPT-3上下文长度仅2000token,GPT-4已提升至44万token,当前主流厂商已可支持百万token级上下文,更长上下文窗口需要更多KV Cache存储在HBM中;多模态模型处理图片、音频、视频数据时,存储需求较文本呈指数级增长。
d. 推理端技术优化:推理端RAG、CoT等技术应用广泛,尤其是CoT产生的大量中间推理token,会进一步占用KV Cache空间,提升对HBM带宽与容量的要求。
4、存储核心厂商分析与风险提示
·核心存储厂商业务情况:美股存储标的方面,美光是美股唯一同时覆盖DRAM和NAND的标的,当前在HBM领域正奋起直追,拥有千亿规模HBM扩产计划,但产能落地及进入英伟达供应链节奏偏缓,长期增长确定性较强,业绩弹性主要来自HBM业务释放。闪迪是美股唯一纯NAND标的,核心业务为NAND Flash制造,同时拥有HBM相关业务作为额外增长期权,其中HBF是介于DRAM和SSD之间的产品,通过多个NAND Flash堆叠实现带宽增长。相较于HBM、DRAM,NAND的需求弹性更高:HBM与DRAM在GPU中的配比较为固定,单GPU通常配备对应1:8或1:16 FP点的HBM/DRAM容量,需求稳定易测算;而NAND可根据云厂商、大型企业训练及推理阶段的额外存储需求灵活扩容,单GPU对应的NAND配置量增长空间更大,因此弹性更高。韩系厂商海力士、三星业务结构与美光相近,DRAM、NAND业务占比约8:2,其中海力士是英伟达HBM第一供应商,充分受益于HBM行业高成长;三星拥有HBM底层逻辑芯片产能,未来增长空间充足。价端方面,美光26财年Q3(对应自然年2025年12月-2026年2月)产品综合涨价约70%,其中DRAM涨幅超60%,NAND涨幅超70%,对应2026年Q1营收涨幅预计约90%,符合预期,同期三星盈利表现同样亮眼。
·存储厂商估值水平:从估值维度来看,当前全球核心存储厂商估值处于相对低位,具备充足的上行修复空间。其中三星、海力士、美光三家覆盖多品类存储芯片的主流厂商,以当前股价测算,未来四个季度的PE预计可降至3倍左右;主打NAND业务的闪迪与铠侠两家厂商,当前对应的PE水平约为4倍。若存储行业景气度持续上行,市场给予行业的合理目标PE区间抬升至6-8倍,上述核心存储标的股价尚有一倍左右的上行空间。
·行业风险因素:存储行业当前主要面临三类核心风险:
a. 下游资本开支(capex)不及预期;
b. 存储原厂产能持续扩张导致竞争格局恶化;
c. 新技术研发遭遇瓶颈、良率爬升不及预期。

发布于 北京