皮皮聊科技
26-06-27 15:37 微博认证:微博知名搞笑博主 科技博主

#DeepSeek发布DSpark#DeepSeek 昨天悄悄开源了一个 DSpark。简单一点就是,给一些大模型提速用。这次核心就是结合半自回归生成的置信度调度推测解码,说普通些就是,可以用草稿模型先猜几个字,大模型再验证,不用一个字一个字蹦,省很多时间,加了个打分器,直接把不靠谱的草稿剪掉,不浪费时间验证错的,还有硬件感知前缀调度,让验证过程更贴硬件,效率直接拉满!

发布于 山西