闫跃龙
24-03-20 09:05 微博认证:科技博主 头条文章作者

单个GPU的能力已经到极限了,未来比拼的是集群!比如英伟达的B100也是通过GPU之间的互联提升性能。华为在这方面很强,在2023年7月举行的昇腾人工智能产业高峰论坛上,华为宣布昇腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,是业界首个万卡AI集群,拥有更快的训练速度和30天以上的稳定训练周期,十倍领先业界。
如果按照昇腾的指标,1000卡的算力约300P,千卡就能提升约30P,万卡就能提升约300P。
华为轮值董事长胡厚崑说,昇腾AI的集群相当于把AI的算力中心当做一台超级计算机来进行设计,使得昇腾AI集群的性能效率达到10%以上的提升,而且系统稳定性得到十倍以上的提高。
华为昇腾计算业务总裁张迪煊透露,早在2018年,华为就判断人工智能会快速发展,并改变过去小模型的开发模式,形成大算力结合大数据生成大模型的模式,所以华为那时候就开始开发算力集群产品。

发布于 北京