专业证券分析 26-03-15 17:51
微博认证:微博财经账号

【西部证券-计算机行业:国产RDMA技术实现突破,助力超节点加速落地】
研究报告内容摘要
  RDMA(Remote Direct Memory Access,远程直接内存访问)作为一种网络通信技术,致力于解决大规模并行计算中的数据传输延迟和CPU消耗问题。在生成式AI的时代,RDMA已成为AI算力基础设施重要的底层技术。

  中科曙光于2026年3月12日正式发布首款全栈自研400G无损高速网络——scaleFabric,实现了国产RDMA技术重要突破。scaleFabric作为国内首款原生无损RDMA高速网络,基于原生RDMA架构,在112GSerDes IP、交换芯片、网卡到交换机、驱动与管理软件等关键技术上实现自主研发。scaleFabric面向超大规模智算集群设计,有望为超大规模智算集群提供高带宽、低时延、真无损、超可靠的底层基础。

  scaleFabric 400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric 400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展。因此,scaleFabric 400网卡和交换机可满足万卡级AI训练集群对高带宽、低时延网络的性能要求。在稳定性与扩展能力上,scaleFabric采用基于信用的无损流控机制,链路故障恢复时间小于1毫秒,已支撑近万卡集群持续稳定运行验证超10个月。此外,scaleFabric单一子网的互连规模是传统IB网络的2.33倍,可支持最大11.4万卡集群部署。

  分析与判断:

  2026年是国产超节点落地的关键一年,RDMA技术的突破有望增加国产超节点落地的确定性。推理任务对时延有着较高的要求,超节点的Scale-up层能够将多颗芯片的显存整合成统一的逻辑内存池,从而有效压缩了Token的生成时延。因此,RDMA技术,特别是高性能国产网卡(HCA)与自适应拥塞控制算法的耦合,有望增强国产AI算力芯片Scale-up层的协同效率。

  我们认为:在生成式AI模型持续迭代,Agent等应用加速落地的背景下,推理和训练任务对算力基础设施的性能要求也在不断上升。RDMA等互联技术是国产超节点重要的技术基础,若国产RDMA等关键技术实现突破,有望国产超节点的技术落地节奏,具备较强技术积累的行业头部公司有望获得确定性较高、弹性较大的增长。

  建议关注:1)算术集成:中科曙光(已覆盖)。2)AI芯片:寒武纪(已覆盖)、海光信息(已覆盖)、天数智芯。3)互联技术:盛科通信(已覆盖)、澜起科技。4)AIDC:东阳光、润泽科技(已覆盖)。

  风险提示:下游需求不及预期;RDMA技术落地和商业化不及预期;宏观经济不及预期

发布于 北京