皮皮推
26-06-27 15:29 微博认证:科技博主 微博原创视频博主

#DeepSeek发布DSpark#6月27日,DeepSeek发布面向Deepseek V4 Flash与V4 Pro的DSpark。

不得不说,DeepSeek属实有点东西,专门给自家V4 Flash、V4 Pro模型做加速。

现在市面上常见的推测解码套路基本都是固定长度生成草稿,很死板,不同硬件、代码/聊天/数学场景适配性很差,很多算力都白白浪费掉。

DSpark换了思路,结合半自回归,靠置信度打分筛靠谱候选内容,再搭配硬件适配调度,无效计算直接砍掉一大截。

实测数据很亮眼,对比旧基线吞吐最少涨51%,最高直接翻四倍。

不光自家模型能用,Qwen、Gemma这些开源模型也能直接迁移,对比Eagle3、DFlash这些主流方案,每一轮有效生成token数量全面领先,不是只做纸面数据的花架子,是真正能落地的底层优化思路。http://t.cn/AXSQhS9B

发布于 江苏