#CPU能跑的DeepSeek##小版本DeepSeek打赢Claude4Sonnet#DeepSeek-R1又搞出惊喜操作——靠“极限瘦身”赢了Claude 4 Sonnet。它的1.93bit量化版本，体积缩水70%，但在aider编程榜上却打败了Sonnet和自己1月的满血版本，成了“轻装上阵也能赢”的代表。来看看具体怎么回事：- 榜单成绩亮眼：R1-0

#CPU能跑的DeepSeek##小版本DeepSeek打赢Claude4Sonnet#

DeepSeek-R1又搞出惊喜操作——靠“极限瘦身”赢了Claude 4 Sonnet。

它的1.93bit量化版本，体积缩水70%，但在aider编程榜上却打败了Sonnet和自己1月的满血版本，成了“轻装上阵也能赢”的代表。

来看看具体怎么回事：

- 榜单成绩亮眼：R1-0528（量化版）在aider榜拿到60%，击败Claude 4 Sonnet的56.4%，比1月的R1还强。而满血R1-0528更是直接打到71.4%，超过不开“思考”的Claude 4 Opus。

- 量化不用GPU也能跑：这个奇迹来自Unsloth团队，他们做了从1.66bit到5.5bit共9个版本。比如1.78bit版本，只要64GB内存，就能在CPU上跑，每秒输出1个token；24G显卡+128G内存能跑到5个token/s。

- 团队战绩强悍：Unsloth不仅做了DeepSeek，连Qwen、Phi、Mistral、Llama也都被他们优化过，最快提速达50%、最省内存砍半。GitHub上已有4万星星。

- 连打游戏都赢了：Hao AI Lab用R1-0528测试了一波人类小游戏，包括：
- 俄罗斯方块：坚持最久，打败o4-mini，仅次于o3；
- 2048、推箱子：表现大幅领先1月版；
- 糖果传奇：得分548，领先o4-mini近20分，仅次于o3。

最后再来个推荐版本和跑法：
- 最推荐：2.4bit和2.7bit，精度&体积更均衡；
- 跑得动的关键：下载文件大小 ≤ 显存+内存总量；
- 想稳妥运行，Unsloth建议180GB统一内存或RAM+显存合计超180GB。
http://t.cn/A6e9cpZM