DeepSeek-V4-Flash现已上线华为云魔坊(ModelArts)模型训推平台,一键完成推理服务部署上线,支持公共池和专属池两种资源部署方式,满足独占和非独占算力的使用诉求,全方位护航企业使用模型服务的连续性与稳定性。华为云通过超节点高带宽网络互联,重新设计PD分离模块,实现KVCache高效传输,支持DeepSeek-V4 模型推理性能达成业界领先,实测4P(Prefill)1D(Decode)部署形态下,CloudMatrix 384单卡Decode吞吐可达3300TPS。
#deepseekv4深度适配国产算力##DeepSeekV4##华为云#
发布于 广东
