Kimi-Linear 剪枝版本!
cerebras 好像找到流量密码了, 开始疯狂魔改国产大模型.
(cerebras 是个基础设施厂商提供硬件加速运行大模型, 他们能把大模型输出打到 2000 token/s)
刚又发布了 Kimi-Linear-REAP-35B-A3B-Instruct, 没错, 就是前几天的 Kimi-Linear-48B-A3B-Instruct 魔改的.
参数从 48B 剪枝 到 35B, 但性能反而还提升了? (魔改后通常会微调一波来保证效果) LiveCodeBench, AIME25, HumanEval 都有所上升.
我本地还在跑 48B-A3B 的召回效果, 这俩我都测一下晚点给大家放出看看这个模型适不适合本地使用.
模型地址: huggingface.co/cerebras/Kimi-Linear-REAP-35B-A3B-Instruct
#ai创造营##ai生活指南#
发布于 日本
