DeepSeek-V4-Flash上线华为云

DeepSeek-V4-Flash现已上线华为云魔坊（ModelArts）模型训推平台，一键完成推理服务部署上线，支持公共池和专属池两种资源部署方式，满足独占和非独占算力的使用诉求，全方位护航企业使用模型服务的连续性与稳定性。华为云通过超节点高带宽网络互联，重新设计PD分离模块，实现KVCache高效传输，支持DeepSeek-V4 模型推理性能达成业界领先，实测4P（Prefill）1D（Decode）部署形态下，CloudMatrix 384单卡Decode吞吐可达3300TPS。
#deepseekv4深度适配国产算力##DeepSeekV4##华为云#