越哥聊AI 26-03-09 18:30
微博认证:AI博主

刚收到的外网爆料,值得玩味。

据相关消息人士透露,国内某头部算力厂商已在原生RDMA技术上取得实质性突破,即将推出对标InfiniBand的高速互联方案。

如果属实,这将是国产AI算力进程中一次关键转向——从RoCE的“改良路线”,正式杀入IB的“原生战场”。

想要看懂这条新闻,需要理解超大规模智算集群的真实痛点。

前两天,两会点题的“超大规模智算集群”,落在工程层面,核心就一句话:当集群从千卡向万卡、十万卡狂奔时,网络不再是管道,而是龙骨。

大模型训练的通信模式,本质是数万张卡同时做全局同步,任何一次丢包、任何一纳秒抖动,都会被成倍放大,直接折算成算力闲置。

具体来看,目前的主流方案,各有各的命门。
RoCE的算盘是在以太网上跑RDMA,成本友好,生态开放,在中小规模集群里足够能打。

但它的基因是“尽力而为”,缺乏端到端的无损机制。
上到400G高速互联,物理层的先天短板就暴露了——更关键的是,高端交换芯片和网卡芯片的供应,现阶段不完全由我们说了算。

IB的护城河在于原生无损。它基于信用的流控机制,传输前先确认接收端资源,延迟压到100纳秒级,几乎零丢包。

这是为极限场景设计的奢侈体验,代价是封闭生态和英伟达的整合锁死。
爆料里提到的突破,卡位的正是这个缝隙——原生无损RDMA,兼容主流IB生态,专攻十万卡级集群。

这意味着什么?
第一,国产算力第一次有了万卡级互联的“入场券”。
不再依赖RoCE的修修补补,直接对标IB的性能基线,集群规模的天花板被实质性顶开。

第二,这是对英伟达护城河的精准打击。
继CUDA之后,InfiniBand是其在AI算力领域的另一道深壕。国产厂商从网络层切入,打的是算力基建的“底层桩”。

第三,路线选择的信号已经明确。
RoCE的生态位依然存在,但面向超大规模集群,国家队选择的是原生RDMA这条硬骨头路线。

想到一句评价很到位:“继5G/6G之后,中国在新一代AI基础设施领域的又一重要布局。”

这场连接之战,比芯片更隐蔽,却同样决定算力主权的边界。
国产算力的第二曲线,这次是真的切进了深水区。
#人工智能[超话]##how i ai##英伟达##算力网络#

发布于 上海