DeepSeek发布DSpark

#DeepSeek发布DSpark#6月27日，DeepSeek发布面向Deepseek V4 Flash与V4 Pro的DSpark。

不得不说，DeepSeek属实有点东西，专门给自家V4 Flash、V4 Pro模型做加速。

现在市面上常见的推测解码套路基本都是固定长度生成草稿，很死板，不同硬件、代码/聊天/数学场景适配性很差，很多算力都白白浪费掉。

DSpark换了思路，结合半自回归，靠置信度打分筛靠谱候选内容，再搭配硬件适配调度，无效计算直接砍掉一大截。

实测数据很亮眼，对比旧基线吞吐最少涨51%，最高直接翻四倍。

不光自家模型能用，Qwen、Gemma这些开源模型也能直接迁移，对比Eagle3、DFlash这些主流方案，每一轮有效生成token数量全面领先，不是只做纸面数据的花架子，是真正能落地的底层优化思路。http://t.cn/AXSQhS9B

发布于江苏