华为 Atlas 950 SuperPoD 标准配置
等~昇腾950DT 2026年Q4同步发布+上市
🎯 一句话总览
Atlas 950 SuperPoD的“节点”分两类:计算节点(跑AI算力)与互联节点(负责高速互联);标准配置以单机柜64张昇腾950DT卡为计算柜基准,互联柜承载灵衢全光互联,整体满配为128个计算柜+32个互联柜,共8192卡。
🔎 一、核心定义:节点与机柜的关系
超节点层级:Atlas 950 SuperPoD是“超节点”,物理由计算柜和互联柜组成,每台机柜内的最小独立工作单元为“节点”。
节点类型:分计算节点(核心算力单元)和互联节点(高速通信单元),二者协同实现“逻辑上像一台超级计算机”。
⚙️ 二、计算节点(标准最小单元)
1. 核心定位
承载AI训练/推理的核心算力,是超节点的“大脑”。
2. 标准配置(单计算节点)
AI芯片:昇腾950DT(训练专用),单卡FP8算力1P FLOPS,FP4算力2P FLOPS
单节点卡数:8卡(业界主流2U/4U机架式),华为正交架构,柜内高密度部署
内存/存储:随950DT标配HBM,本地NVMe SSD,满足大模型训练的高带宽、大容量需求
互联接口:灵衢(UnifiedBus)全光接口,柜内低时延互联,卡间时延<200ns
软件栈:CANN 9.0 + 昇腾AI框架,适配MoE 671B等大模型,支持一键优化
3. 计算柜的节点聚合(标准计算柜)
单计算柜节点数:8个计算节点
单计算柜总卡数:64张昇腾950DT(8节点×8卡)
供电/散热:液冷为主,适配高密度算力的散热需求
柜内互联:灵衢协议,实现节点间高速通信
📡 三、互联节点(标准最小单元)
1. 核心定位
负责计算节点、计算柜之间的高速互联,是超节点的“神经中枢”。
2. 标准配置(单互联节点)
互联协议:灵衢(UnifiedBus),华为自研超节点专属协议,支持内存统一编址
互联介质:全光互联,柜间低时延、高带宽,总互联带宽16PB/s
交换能力:单节点支持多计算柜接入,实现计算节点间的高效数据转发
冗余设计:双路冗余,故障自动切换,保障超节点长稳运行,适配大模型训练的连续性需求
3. 互联柜的节点聚合(标准互联柜)
单互联柜节点数:按超节点规模弹性配置,以满足128个计算柜的互联需求为基准
核心功能:汇聚所有计算柜的互联流量,实现全局统一调度
🧩 四、Atlas 950 SuperPoD 超节点整体配置(满配)
计算柜数量:128个,每个64张950DT,合计8192卡
互联柜数量:32个,承载灵衢全光互联,总互联带宽16PB/s
总算力:FP8 8E FLOPS,FP4 16E FLOPS,1E=1000P,满足万亿参数MoE大模型训练
总内存:1152TB,全为HBM,支撑超长上下文训练
上市时间:2026年Q4,华为官方公布
✅ 极简复盘(便于记忆)
计算节点:8卡昇腾950DT,是最小算力单元;8个节点组成1个64卡计算柜。
互联节点:基于灵衢协议的全光互联单元,聚合为互联柜,负责高速通信。
超节点满配:128个计算柜+32个互联柜,共8192张950DT,FP8算力8E FLOPS。
发布于 湖北
