#DeepSeek发布DSpark# 国内AI又甩出硬核开源成果!DeepSeek联合北大推出DSpark推理加速框架,直击当下大模型最痛的高并发推理难题。 简单说,传统推测解码容易批量生成无效token,白白浪费昂贵算力。DSpark用半自回归结构+置信度动态调度两大创新,提升草稿生成准确率,减少无效校验。 线上部署在DeepSeek-V 4实测,同等服务器吞吐不变的前提下,用户生成速度直接拉高60%-85%。 重点是整套论文、代码全部开源,不只自家模型能用,还能迁移适配其他主流开源大模型。 现在算力成本居高不下,这种不堆显卡、靠算法优化提速的方案,对中小开发者价值巨大。 国内团队不再只卷模型参数,底层推理工程创新也跟上了。期待后续有更多企业落地实测数据!
发布于 陕西
