Unsloth 刚刚发布了他们的 GRPO 的新互动教程 (ipynb notebook)只需要跟着教程一步步来就能微调 Qwen3-Base 并且开启思考模式，并且是 GRPO 的所以可以几乎让模型无监督学习地址：colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Qwen3_(4B)-GRPO.ipynb#ai创造营#

Unsloth 刚刚发布了他们的 GRPO 的新互动教程 (ipynb notebook)

只需要跟着教程一步步来就能微调 Qwen3-Base 并且开启思考模式，并且是 GRPO 的所以可以几乎让模型无监督学习

地址：colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Qwen3_(4B)-GRPO.ipynb

#ai创造营# #AI生活指南#

发布于日本