karminski-牙医
25-10-23 16:52 微博认证:AI博主

还在用老方法量化大模型吗?

Unsloth 刚刚发布了他们的量化感知训练(QAT)教程!

他们测试的数据,与传统 4bit 量化相比,QAT能恢复70%的损失精度,在 GPQA 和 MMLU Pro 等基准测试中实现 1–3% 的模型性能提升。并且 QAT 还能结合 LoRA 用,这样既能降低训练成本,又能提升量化质量。

目前 unsloth 提供了 fp8-int4 、 fp8-fp8 、 int8-int4 、 int4 这几个 qat_scheme 。

这个教程里面还给了免费的 Qwen3-4B QAT训练,使用的 google colab. 脚本打开就能用.

教程在这里:docs.unsloth.ai/new/quantization-aware-training-qat

#ai生活指南##ai创造营#

发布于 日本