白水山人记
26-06-01 23:00 微博认证:投资内容创作者

GTC Taipei Keynote速览:全栈芯片机柜组合、CPU、PC是核心看点

事件点评:GTC TAIPEI在北京时间上午11:00举办,我们观看并梳理要点如下: 

硬件端 

全栈AI基础设施芯片能力。大会展示了Vera Rubin Compute Tray,Switch Tray,CPU Tray、Spx-6 CPO switch tray,Groq 3 LPX Tray,BF4 STX Storage Tray等机柜产品,并且表示Vera Rubin已经处于full production状态。 

Vera Rubin NVL72:10x Lower Cost per Token 

Vera CPU:1.8x the agentic sandbox performance of x86 CPUs; 

Groq 3 LPX:35x higher throughput at low latency with vera rubin NVL72; 

Vera BF-4 STX:5x higher tokens per second; 

Spectrum-X 6 SPX Ethernet:1.6x higher AI network performance;视频提及TSMC、Foxconn、Lumentum、SPIL、TFC等供应商; 

Vera CPU:AI时代的CPU。CPU原来是为人类做的,现在为Agent而生。CPU在rubin用在三个地方,一个是vera rubin compute tray 有2个CPU,用来组织和管理GPU,kv cache,处理软件和运行;一个是在BF-4有2个进行应用,快速的连接存储;还有一个是CPU Tray。Agent 四代,CPU成为GPU利用率的瓶颈,需要在效能和带宽间取得平衡。 

Vera CPU:88 Olympus Core,PCIe Gen 6 CSL3.1;164MB L3 Cache;3.4TB/s Core-to-Core Bisection Bandwidth;1.5TB LPDDR5X Memory;NVLink-C2C 1.8TB/s Coherent CPU0CPU和CPU-GPU连接界面; 

早期使用者为OpenAI,Anthropic,SpaceX 

重新发明电脑。Nvidia和微软一起重新发明电脑,主要发布了并采用了RTX Spark,包含Blackwell RTX GPU芯片,采用了3nm工艺,700亿个电晶体;同时与MTK定义的20核Grace CPU;128GB统一内存,600GB Nvlink C2C连接,然后可以支持英伟达全栈工具:CUDA,Tensor RT,NVFP4,Ray Tracing,DLSS等;与Dell、微软、联想等电脑厂商一起合作笔记本,以及工作站等。 

工具和Agent端 

包括Chip Design Super Agent(与Cadence等合作);发布Nemotron 3 Ultra模型(550B);COSMOs模型继续推介来满足AI数据不足的要求;机器人方面发布了Isaac GROOT Reference Humanoid Robot板载计算和全栈GR00T软件套装,包括与Unitree合作身体控制,和GR00T 1.7模型等。 #微博股票[超话]#

发布于 上海