最近中科曙光又打破了国外垄断,他们发布了首款全栈自研的400G无损高速网络产品,叫scaleFabric。简单来说,就是给万卡集群大规模算力系统,实现网络互通的。
因为单张显卡的算力再强,它的性能也是有天花板的。如果我们要把算力往上提,那就只有把几万张显卡凑在一起搞集群协同工作,这才是是唯一的出路。
万卡这东西对于咱们普通人来说,可能有点陌生,但对于国家来说,这种大规模算力系统才有真正的战略价值,像做天气预报、搞基因测序、发现新材料、探索宇宙,甚至是国防、军用、金融等等,都是必不可少的,全得靠海量的计算。
以前大家总觉得,搞这个万卡集群,数量越多算力就越强,但却忽略了一个问题,这些计算卡可要不停地同步和交换数据。,把几万块显卡组织到一块,它们之间怎么传数据,是个大麻烦,尤其是显卡越大,传数据越麻烦。
因为数据传送技术,也被称为“算力大动脉”
发布于 上海
