一图复盘尚 26-03-30 23:49
微博认证:投资内容创作者

你听到的“从4颗GPU减配至2颗”,是对 Rubin Ultra 架构 的误解/混淆——实际不是“砍半”,而是封装层级不同,总算力/规格没变。

一、先理清:Rubin vs Rubin Ultra 到底几颗“GPU”

1. 标准版 Rubin(Vera Rubin)

- 1个GPU Package = 2个计算Die(小芯片)
- 288GB HBM4
- 俗称:2芯版

2. 旗舰 Rubin Ultra(GTC 2026 正式规格)

- 1个GPU Package = 4个计算Die(2×2)
- 官方表述:2个双芯封装(MCM)拼在一起
- 即:2个GPU模块 × 2Die = 总4Die
- 1TB HBM4e、带宽 ~32–64TB/s
- 算力:NVFP4 100 PFLOPS(是Rubin的2倍)

二、为什么会有“4颗→2颗”的说法?

- 早期传闻(2025年底):
- 传言 Rubin Ultra 是4颗独立GPU(4个完整封装)
- GTC 2026 官方定稿(2026.3):
- 实际是2个双芯GPU封装(共4Die)
- 媒体/分析师简化说成:从4颗GPU → 2颗GPU模块

→ 不是减配,是封装方式从“4分立”改成“2×2集成MCM”。

三、真实调整:不是减配,是降功耗、好量产

- 核心没变:总Die数 4颗不变、1TB显存不变、100PFLOPS不变
- 变化点:
- 从“4颗独立GPU” → 2颗MCM双芯GPU
- 功耗更低、良率更高、更容易大规模出货
- 机柜:NVL144(144颗GPU/机架)、NVL576(扩展)

四、一句话总结

Rubin Ultra 没有“减配”:
仍是4颗计算核心,只是从4分立封装 → 2个双芯MCM封装,性能/规格完全拉满。

发布于 湖南