在HAIC 2025大会上,曙光正式推出了scaleX万卡超集群,标志着国产算力在大规模集群领域实现了一次重要跨越。这套系统以scaleX640超节点为基础构建,单个机柜就能部署640块AI加速卡,通过16个超节点组合,最终形成拥有10240张加速卡、算力突破5EFlops的万卡级集群。不过真正具有突破性意义的并非卡的数量本身,而是其背后的互联技术实力。
scaleX搭载的scaleFabric原生RDMA高速网络将带宽提升至400Gb/s,同时将端侧延迟压缩到了1微秒以内。相比之下,业界主流水平的延迟普遍还在3微秒左右徘徊。曙光这次直接将网络延迟削减了三分之二,相当于在互联技术这个英伟达最核心的优势领域撕开了一道突破口。
从技术参数来看,scaleX的目标非常明确,就是要对标英伟达的NDR InfiniBand方案。具体而言,其单子网可扩展能力超过10万卡,同等规模下的网络成本相较IB方案能降低约30%。这意味着不仅集群规模可以做得更大,使用成本还能更低,在规模和成本两个维度上都取得了有利进展。
更具战略意义的是这套系统采用了开放路线。scaleX兼容多个品牌的国产加速卡,支持主流大模型框架运行,目前已经适配了400多个大模型与世界模型,应用场景覆盖金融风控、地质勘探、科学智能等多个垂直领域。开放生态带来了更强的产业协同能力,这在国产算力的长期竞争中尤为关键。
在全球AI训练集群的竞争版图中,英伟达的NVL576节点一直被视为2027年前的行业标杆。如今曙光凭借万卡级现货产品提前入场,在带宽、延迟、成本三个关键维度同时发力。这不仅是产品层面的追赶,更是国产算力在集群架构与互联技术上向全球顶级玩家发起的一次正面挑战。
发布于 广东
