梁赛 25-02-27 10:25
微博认证:AI博主

#deepseek开源周# 第4天。
今天一口气发布了3个开源项目。
第一个是:DualPipe。最大的亮点是:作者仅有3人,其中包括梁文锋本人。据代码仓库显示作者分别是:Jiashi Li and Chengqi Deng and Wenfeng Liang.
这种老板亲自参与到大模型底层代码级别的,恐怕全球只有一个了。

再介绍一下这个DualPipe :用于双向并行计算,显著降低训练时间
技术背景:
在千亿参数大模型训练中,传统流水线并行技术(如1F1B、ZB1B)常因计算与通信等待产生“流水线气泡”,导致GPU资源闲置。据测算,8卡训练场景下,传统方法资源利用率不足50%,成为制约训练效率的关键瓶颈。

创新突破:双向计算通信全重叠
DeepSeek-V3技术报告提出的DualPipe算法,首次实现:
1️⃣ 双向异步流水线:前向传播与反向传播在对称通道上并行执行,类比“双车道高速公路”,双向数据流互不阻塞
2️⃣ 时空折叠技术:通过动态调度8-20个微批次任务,将计算(前向/反向)与通信(梯度/参数传输)精确重叠
3️⃣ 气泡压缩:采用(PP/2-1)(𝐹&𝐵+𝐵-3𝑊)调度策略,相比经典算法减少50%等待时间

工程实践
团队已开源PyTorch 2.0+实现方案,关键创新在于:
反向对称拓扑:构建镜像通信链路,消除方向性阻塞
内存优化策略:通过激活值动态复用,缓解2倍参数内存压力

应用前景

该技术已在DeepSeek-V3千亿模型训练中验证,同等算力下吞吐量提升37%。 可以说,DualPipe为万亿参数时代提供了新的并行范式 。

发布于 广东