青松古藤
26-05-28 11:21 微博认证:湖南农业大学 教师 财经观察官

Nvdia Rubin CPX上线推迟,基底订单未能实现http://t.cn/AX68B5Cu

去年9月,英伟达推出了Rubin CPX的设计蓝图,预期会在2026年底上线。

但是在今年3月的GTC中,Rubin CPX 加速器完全没有出现在任何幻灯片或议程中,引发市场对其取消的猜测。NVIDIA 副总裁 Ian Buck 随后向 ComputerBase 确认 Rubin CPX 已被"延后",并定位到 Feynman 世代(预计 2028 年推出)。

CPX 经济性的本质——它本来就是 GDDR/HBM 价差套利产物,用便宜大容量内存承担 compute-bound 但带宽要求没那么极致的 prefill 工作。
当 GDDR7 绝对价格被卷进 DRAM 涨价周期(消费级 DRAM Q1 涨 75-80%,Q2 再 45-50%),这个卖点确实受损。

NVIDIA 官方给的取消原因:是工作负载结构变了
Ian Buck 原话:CPX 只改善 TTFT,不改善实际 token 速度,而 prefill 在整体工作负载里占比并不大。
在 agent-to-agent、400-500K KV context、1000 tokens/sec 的新场景下,瓶颈从 prefill 延迟转移到 decode 吞吐。

发布于 湖南