昇腾910C完成大模型训练

#QNEWS# 昇腾910C / 深圳 / 国产算力

据深圳发布6月5日消息，深圳河套学院AI训练平台项目团队联合哈尔滨工业大学（深圳）、深圳市大数据研究院、华为有关团队，协同深智城AI算力平台，依托华为昇腾910C国产AI算力集群，完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。

此次实践为全球第三方机构在国产算力平台上完成该级别模型训练积累了重要经验。据了解，DeepSeek-V4-Pro采用混合专家模型架构，后训练过程中模型各组件之间的通信量为普通模型的数十倍，对算力集群的稳定性和互联带宽要求极高。项目最终实现模型算力利用率超过30%，关键训练算子效率提升14%，各项指标均达到工业级运行标准。

从技术应用角度来看，调用已有模型开展业务推理与从零完成模型全参数训练分属不同技术环节，后者在硬件要求和技术难度上远超前者。本次试验结果表明，国产AI算力已可承担顶级大模型的全参数训练任务，相关技术路径具备可行性。

发布于北京