知识蒸馏应用方法

分享一下「AI 之父」讲过的一个想法：让大 AI 帮你「蒸馏」出一套自己的小模板。

最近我读到一些 Geoffrey Hinton 离开 Google 之后的发言，发现他反复在讲一个看起来特别技术、其实普通人也完全用得上的想法：大模型的真正力量不在于「大」，而在于它能把自己的能力「教」给小模型。这件事在 AI 圈叫「知识蒸馏」。听起来玄，但翻译成普通人的工作流，就是一句话：你日常对着大 AI 反复要做的事，可以让它倒过来帮你「蒸馏」出一套自己反复能用的小模板。

说一下 Hinton 这个人。他是深度学习的奠基人之一，圈内常被叫「AI 之父」，2018年拿过图灵奖，2024年又拿了诺贝尔物理学奖。2023年5月他76岁那年从 Google 离职，离开之后开始更自由地谈他的想法。这些发言里有一类听起来很玄、其实很实用，「蒸馏」就是其中之一。

先说这个想法的来历。2015年 Hinton 跟两位 Google 同事发过一篇论文，意思是：你训练好一个又大又慢但回答得很好的 AI 模型（叫「老师」），然后让一个小很多的模型（叫「学生」）来模仿老师的输出。

但精彩的地方在于：学生学的不是老师的最终答案，而是老师的「判断感」。

举个例子。老师看一张图说「这是猫」，传统训练只告诉学生「答案是猫」。Hinton 的做法是把老师的全部「软答案」给学生看：这张图老师有七成觉得像猫、两成觉得像狗、一成觉得像老虎。藏在「猫和狗比较像、和老虎也有点像」里的相对感，就是 Hinton 起的名字 "dark knowledge"（暗知识）。

学到了暗知识的小模型，体积是老师的几十分之一，效果却几乎追平。这条路径催生了今天手机上能直接跑的 AI（iPhone 自带的智能助手就是这么来的），也是 DeepSeek 这种小型模型能用很少参数跟上 GPT 的关键之一。

说回普通人怎么用。

这套思路反过来用，正好是一个普通人也能套的工作流：你每天对着国内的几个大模型，或者像 ChatGPT、Claude 这种大 AI 反复要做的事（写周报、写邮件、整理会议纪要、给孩子讲数学题、改代码），不就是「老师在反复回答」吗。你完全可以让大 AI 倒过来帮你「蒸馏」出一份你自己反复能用的小模板。

我把这套用法叫「个人蒸馏」。

具体是这么操作的。

挑一件你反复要做的事——最适合做个人蒸馏的，是那种每周都要做、每次又得花点脑子的活：写周报、写月报、写晨会通知、给某类客户回信息、整理会议纪要等等。

挑好之后，第一次让大 AI 从零做一遍。把你脑子里的所有约束、想法、好范例都告诉 AI，跟它聊到结果让你满意。这一次可能要花30分钟到一小时，不要怕慢，这是「老师在认真讲」的过程。

最关键的一步，是让 AI 倒过来帮你提炼模板。你跟 AI 说：「把刚才我们的整个流程浓缩成一段提示词模板，让我下次拿一份原始材料贴进去就能直接用；把你刚才考虑过的关键判断点都嵌进去。」

得到的这份模板，就是你的「学生」——下次同类任务来了，你不用从零再讨论一遍，把数据塞进去就能跑。

举一个场景：写周报（拿这个做实验）

第一次你可以跟 AI 来回聊，时间长一些，把你这周做的事、想突出什么、想避免什么、领导更喜欢看什么风格全都讲清楚了，可能要反复改才行。然后你让 AI 输出一份「以后我每周写周报的提示词模板」，里面包含「先列三件最值得说的事」「按事件加数据加影响加下周计划的结构写」「语气克制、避免吹牛」这些具体规则。

之后就可以直接复用了。你就蒸馏了写周报的自己 ^_^

不管你用 ChatGPT、Claude 这种国外大模型，还是 DeepSeek、Kimi、通义、豆包这些国内的，这套做法都一样能跑——它跟用哪家模型没关系，跟「怎么把一次精雕的对话浓缩成一份能反复用的模板」有关系。

Hinton 想法的底层逻辑：大 AI 真正的价值，不在于每次都从零跟它聊一遍，在于它能帮你把一次精雕的好做法蒸馏成你以后能反复使用的东西。

技术圈把这件事叫「知识蒸馏」，普通人可以管它叫「个人蒸馏」。叫法不重要，重要的是把这件事落到自己每天反复做的某件具体事上。

发布于北京