摩尔线程适配DeepSeek-V4

#摩尔线程适配DeepSeekV4##deepseek#

摩尔线程携手智源众智FlagOS社区，在旗舰级AI训推一体全功能GPU MTT S5000上，率先实现对新一代大模型DeepSeek-V4-Flash的Day-0极速适配，并完成了全量核心算子的深度优化与部署支持。

DeepSeek-V4-Flash 采用混合专家（MoE）架构，总参数量高达284B，激活参数13B，支持百万token上下文长度。其预训练数据超32Ttoken，在最大推理力度模式（Flash-Max）下推理能力逼近Pro版本。

发布于广东