#CPU能跑的DeepSeek##小版本DeepSeek打赢Claude4Sonnet#
DeepSeek-R1又搞出惊喜操作——靠“极限瘦身”赢了Claude 4 Sonnet。
它的1.93bit量化版本,体积缩水70%,但在aider编程榜上却打败了Sonnet和自己1月的满血版本,成了“轻装上阵也能赢”的代表。
来看看具体怎么回事:
- 榜单成绩亮眼:R1-0528(量化版)在aider榜拿到60%,击败Claude 4 Sonnet的56.4%,比1月的R1还强。而满血R1-0528更是直接打到71.4%,超过不开“思考”的Claude 4 Opus。
- 量化不用GPU也能跑:这个奇迹来自Unsloth团队,他们做了从1.66bit到5.5bit共9个版本。比如1.78bit版本,只要64GB内存,就能在CPU上跑,每秒输出1个token;24G显卡+128G内存能跑到5个token/s。
- 团队战绩强悍:Unsloth不仅做了DeepSeek,连Qwen、Phi、Mistral、Llama也都被他们优化过,最快提速达50%、最省内存砍半。GitHub上已有4万星星。
- 连打游戏都赢了:Hao AI Lab用R1-0528测试了一波人类小游戏,包括:
- 俄罗斯方块:坚持最久,打败o4-mini,仅次于o3;
- 2048、推箱子:表现大幅领先1月版;
- 糖果传奇:得分548,领先o4-mini近20分,仅次于o3。
最后再来个推荐版本和跑法:
- 最推荐:2.4bit和2.7bit,精度&体积更均衡;
- 跑得动的关键:下载文件大小 ≤ 显存+内存总量;
- 想稳妥运行,Unsloth建议180GB统一内存或RAM+显存合计超180GB。
http://t.cn/A6e9cpZM
