Unsloth 团队采用 1-bit 压缩技术把GLM 5.2 转换成轻量级的 GGUF 格式 ,在256GB RAM 的 Mac Studio M3 Ultra 上本地运行,速度~21.6 tok/s。
发布于 新加坡
Unsloth 团队采用 1-bit 压缩技术把GLM 5.2 转换成轻量级的 GGUF 格式 ,在256GB RAM 的 Mac Studio M3 Ultra 上本地运行,速度~21.6 tok/s。