#DeepSeek发布DSpark#6月27日直接甩出DSpark,这次给V4 Flash和V4 Pro搞了个加速器,说白了就是用半自回归加置信度调度的推测解码方法,听着复杂但效果超实在——处理速度直接快了51%到400%!比如之前要等10秒的结果,现在可能5秒就出来了,这效率提高了很多。
更牛的是,在Qwen,Gemma这些咱们常用的开源模型上也能用,迁移效果还特好,相当于给很多模型都加了个快进键!
发布于 山西
