从桌面到万卡集群的 AI 存储基础设施（G3/G3.5 方向）卖的不是“更大存储”，而是“不再让 GPU 等数据”绿算把自身定位为 AI 存储 I/O 加速层产品商：通过全系 <20 μs 级延迟供给能力、超高 IOPS/吞吐与更紧的 GPU 集群数据通路，解决大模型/智算场景中常见的 GPU 空转等数据搬运问题，从而把被锁

从桌面到万卡集群的 AI 存储基础设施（G3/G3.5 方向）

卖的不是“更大存储”，而是“不再让 GPU 等数据”
绿算把自身定位为 AI 存储 I/O 加速层产品商：通过全系 <20 μs 级延迟供给能力、超高 IOPS/吞吐与更紧的 GPU 集群数据通路，解决大模型/智算场景中常见的 GPU 空转等数据搬运问题，从而把被锁住的算力释放出来。
产品线总览（图示）

各产品怎么选：按“GPU 集群规模 × 工作负载类型”对号入座
GP5000｜入门全闪加速（百卡以下更典型）
核心：把传统全闪常见瓶颈换成 <20 μs、千万级 IOPS 的供给能力，让中小集群不再被存储拖住。
典型适用：百卡以下 GPU 集群 / 通算加速 / 中小型 AI 平台做性能容量补齐。
相对传统方案出现 IOPS 量级抬升、同等性能目标下硬件投入更集约。

GP6000｜高端 GPU 全速供给（千卡级训练/云平台扩容）
核心：更高 IOPS/吞吐通道 + ASIC+FPGA 混合加速，瞄准训练/HPC里“持续吃带宽”的阶段。
典型适用：模型训练、HPC、云平台性能容量扩容。
GPU 利用率抬升、训练阶段提速。

GP7000｜AI 推理旗舰（万卡推理/CMX 方向）
核心：把推理链路上 KV Cache/上下文相关的 I/O 放大压力放进更高阶加速平面，追求“推理吞吐上去、首 Token 等数据的时间下来”。
典型适用：万卡级推理集群、对 Token 成本极度敏感的在线服务。
- GPU 利用率从低区间（例举 20% 档）拉到 80–90% 档；
- 推理性能倍数提升、Token 成本下降 60–70%、首 Token 延迟大幅下降；
- 并提到在昇腾 910B 实测中出现吞吐抬升口径（如“22 倍”示例），以及 DGX BasePOD 测试语境。

GP8000｜STX 旗舰（面向“AI 工厂”架构）
核心：走多 DPU（例示 4× BlueField‑4）高密度 CMX 供给思路，面向下一代高密 AI 工厂的数据供给骨架。
典型适用：超大规模/10,000+ 卡方向、STX 架构演进路线。
GP Spark 2000 / 3000｜桌面级/边端：把数据中心级 I/O 思路“下放”
Spark 2000（存储伴侣）：低功耗直连式思路，面向桌面级 AI 开发者、边端推理中心、数据极速备份迁移等。
Spark 3000（交换存储一体）：把交换 + CMX 向存储合到一个桌面/边端节点里；“全球唯一桌面级 G3.5 存储”定位，4×100GbE 交换能力、可多台 DGX Spark 直连这类布署形态。

“三个硬指标”
1. 延迟：全系瞄准 <20 μs（用来解决“GPU 95%时间在搬数据、真计算占比小”的结构性浪费）。
2. IOPS/吞吐天花板：从千万级到 7,000 万 IOPS / 300 GB/s 档位，用数字区分入门→旗舰。
3. GPU 有效利用率 & Token 成本：最终落点回到“更少空转、更低单位智能成本”。

典型落地场景
- 智算中心：训练加速 + IOPS 瓶颈解除 + 硬件更集约
- 金融/期货/城商行：把批处理/报表或高并发访问时延打下来
- 运营商公有云：在性能提升同时压成本与功耗
- 高校/科研：GPU 资源池更顺滑、存储供给不再卡脖子
- 边端/牧场等：用 Spark 系列做轻量但高 I/O 的存算分离支撑
#绿算技术# #存算# #GPSpark# #解决方案#

发布于北京