国产RDMA技术实现突破

【西部证券-计算机行业：国产RDMA技术实现突破，助力超节点加速落地】
研究报告内容摘要
　　RDMA（Remote Direct Memory Access，远程直接内存访问）作为一种网络通信技术，致力于解决大规模并行计算中的数据传输延迟和CPU消耗问题。在生成式AI的时代，RDMA已成为AI算力基础设施重要的底层技术。

　　中科曙光于2026年3月12日正式发布首款全栈自研400G无损高速网络——scaleFabric，实现了国产RDMA技术重要突破。scaleFabric作为国内首款原生无损RDMA高速网络，基于原生RDMA架构，在112GSerDes IP、交换芯片、网卡到交换机、驱动与管理软件等关键技术上实现自主研发。scaleFabric面向超大规模智算集群设计，有望为超大规模智算集群提供高带宽、低时延、真无损、超可靠的底层基础。

　　scaleFabric 400网卡基于PCIe5.0接口，端口带宽达400Gbps，端到端通信时延低至0.9微秒；scaleFabric 400交换机单端口带宽达800Gbps，整机交换容量可达双向64Tbps，交换时延约260纳秒，支持800G×40或400G×80端口扩展。因此，scaleFabric 400网卡和交换机可满足万卡级AI训练集群对高带宽、低时延网络的性能要求。在稳定性与扩展能力上，scaleFabric采用基于信用的无损流控机制，链路故障恢复时间小于1毫秒，已支撑近万卡集群持续稳定运行验证超10个月。此外，scaleFabric单一子网的互连规模是传统IB网络的2.33倍，可支持最大11.4万卡集群部署。

　　分析与判断：

　　2026年是国产超节点落地的关键一年，RDMA技术的突破有望增加国产超节点落地的确定性。推理任务对时延有着较高的要求，超节点的Scale-up层能够将多颗芯片的显存整合成统一的逻辑内存池，从而有效压缩了Token的生成时延。因此，RDMA技术，特别是高性能国产网卡（HCA）与自适应拥塞控制算法的耦合，有望增强国产AI算力芯片Scale-up层的协同效率。

　　我们认为：在生成式AI模型持续迭代，Agent等应用加速落地的背景下，推理和训练任务对算力基础设施的性能要求也在不断上升。RDMA等互联技术是国产超节点重要的技术基础，若国产RDMA等关键技术实现突破，有望国产超节点的技术落地节奏，具备较强技术积累的行业头部公司有望获得确定性较高、弹性较大的增长。

　　建议关注：1）算术集成：中科曙光（已覆盖）。2）AI芯片：寒武纪（已覆盖）、海光信息（已覆盖）、天数智芯。3）互联技术：盛科通信（已覆盖）、澜起科技。4）AIDC：东阳光、润泽科技（已覆盖）。

　　风险提示：下游需求不及预期；RDMA技术落地和商业化不及预期；宏观经济不及预期

发布于北京