karminski-牙医
25-11-08 13:58 微博认证:AI博主

Kimi-Linear 剪枝版本!

cerebras 好像找到流量密码了, 开始疯狂魔改国产大模型.

(cerebras 是个基础设施厂商提供硬件加速运行大模型, 他们能把大模型输出打到 2000 token/s)

刚又发布了 Kimi-Linear-REAP-35B-A3B-Instruct, 没错, 就是前几天的 Kimi-Linear-48B-A3B-Instruct 魔改的.

参数从 48B 剪枝 到 35B, 但性能反而还提升了? (魔改后通常会微调一波来保证效果) LiveCodeBench, AIME25, HumanEval 都有所上升.

我本地还在跑 48B-A3B 的召回效果, 这俩我都测一下晚点给大家放出看看这个模型适不适合本地使用.

模型地址: huggingface.co/cerebras/Kimi-Linear-REAP-35B-A3B-Instruct

#ai创造营##ai生活指南#

发布于 日本