哈侠
26-06-27 17:49 微博认证:微博2024最具人气科技大V 科技博主 视频博主

#DeepSeek发布DSpark#DeepSeek这次放出的DSpark,我觉得比单纯刷榜更有意义。过去大模型行业总在拼参数、堆算力,成本越来越高,但DSpark通过推测解码和置信度调度,把吞吐提升做到51%至400%,说明提升模型效率,未必只有“加机器”这一条路。更关键的是,它不仅适用于DeepSeek自家模型,在Qwen、Gemma等开源模型上也能迁移,这意味着整个开源生态都有机会受益。AI竞争进入下半场,拼的可能不再是谁模型最大,而是谁能把性能和成本平衡得更好。

发布于 湖北