随着 AI 应用(推理 / 多模态 / Agent)普及,存储会从 “成本项” 变成算力瓶颈与价值核心。下面把逻辑讲清楚:
一、为什么是 “爆发”,不是增长
1)单台 AI 服务器:存储用量是传统的5–10 倍
DRAM(含 HBM):传统服务器≈128GB;AI 服务器≈1TB–2TB(8–10 倍)
NAND/SSD:传统≈2–4TB;AI 服务器≈12–24TB(3 倍 +)
HBM:带宽是 DDR5 的10 倍 +,单价更高,供不应求
2)推理侧(应用普及)才是真正的 “超级变量”
训练阶段(少数公司):主要是大模型参数 + 训练数据,TB 级。
推理阶段(全民应用):KV Cache 爆发
上下文窗口:1k token → 128k token
KV Cache:0.5GB → 64GB / 单请求(暴涨 128 倍)
多用户并发:百万级会话同时在线,存储需求随 token / 并发线性爆炸
IDC 预测:2026–2030 年,AI 推理存储需求从0.5ZB → 25ZB,50 倍增长。
3)多模态 + AIGC:数据量从 KB → TB/EB
文本:KB 级
图片 / 视频:MB–GB 级
3D / 数字孪生:TB 级
AIGC 年增速200%+,2030 年全球数据总量将达1ZB。
二、哪些存储最受益(分层爆发)
HBM(高带宽内存):GPU 标配,2025/2026 年需求同比 **+90%/+35%**,供不应求持续到 2027。
企业级 SSD(eSSD):KV Cache 主力承载,2026 年成为 NAND 最大下游(占比37%)。
DRAM(DDR5):推理服务器标配,2026 年66% DRAM 产能被 AI 独占。
大容量 HDD:冷数据 / 训练数据集长期归档,需求稳健。
三、供给端:扩产慢,缺口至少到 2027
先进制程(EUV)、HBM 封装、良率爬坡:周期18–24 个月新华网
原厂(三星 / 海力士 / 美光)优先高毛利 AI 订单,消费级扩产保守
结论:缺货→涨价→高景气
四、一句话总结
AI 应用普及(推理 / 多模态 / Agent)会带来存储需求指数级爆发,核心是KV Cache + 多模态数据 + 单台服务器倍数级扩容,HBM>eSSD>DRAM最受益。
发布于 北京
