#DeepSeek新发布的DSpark有多强#其实这个东西就是纯软件优化,不用你多买显卡,也不牺牲生成质量,就靠代码层面的优化,单用户生成速度最高能快85%,整体吞吐量直接干到4倍。
简单一点的说法就是,同样的显卡,跑大模型能快将近一倍,而且输出质量一点也不差。现在已经用在DeepSeek自家的V4-Flash和V4-Pro上了,还兼容Qwen、Gemma这些主流开源模型,MIT协议全栈开源,意思就是大家都能用。
发布于 山西
