DeepSeek论文提速85%

【大模型推理最高提速85%！DeepSeek发表重磅论文提出两项互补机制】《科创板日报》6月28日讯，在6月中旬获得500亿融资后仅十几天，6月27日，DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。

这不是一次模型版本的迭代，而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块，重点在于工程落地层面的优化。

不同于仅停留在实验室的算法优化，DSpark 已完成真实用户流量落地验证。该框架全面部署于 DeepSeek-V4-Flash、V4-Pro 线上服务，替代此前 MTP-1 生产基线。在同等系统总吞吐规模下，V4-Flash 单用户生成速度提升 60%-85%，V4-Pro 提升 57%-78%。

除了DeepSeek自家的大模型，DSpark也已经部署到了阿里旗下的Qwen3-4B、8B、14B，以及Gemma4-12B。三大评测领域分别是：数学推理、代码生成、日常对话。

值得注意的是，DeepSeek创始人梁文锋位列论文作者名单。在完成首轮融资的当下，创始人依然亲自参与技术论文撰写，这在AI行业并不多见。（记者王耐）