#DeepSeek发布DSpark#
DeepSeek联合北大甩出的这套DSpark,确实把大模型推理的“天花板”又捅破了一层。🚀
以前大家卷参数、卷数据,现在终于开始卷“效率”了。
DSpark最狠的地方在于重构了推测解码逻辑:不再是死板的逐字生成,而是让小模型先批量“猜”出一段,大模型再一次性并行核验。配合置信度动态调度,有把握的直接放行,拿不准的再精细算,彻底避免了算力空转。⚡️http://t.cn/AXSQ4HpT
发布于 广东
