DeepSeek发表论文加速推理

【梁文锋署名！DeepSeek发表重磅论文：如何让大模型跑得更快】昨日，DeepSeek官方在Github低调发表了一篇最新论文，介绍其推理加速框架DSpark，试图解决大语言模型在高并发场景下的推理效率瓶颈。实测部署到自家线上服务后，同等吞吐量下用户生成速度提升60%-85%，还可适配多款主流第三方大模型。

发布于广东