分享一下「AI 之父」讲过的一个想法:让大 AI 帮你「蒸馏」出一套自己的小模板。
最近我读到一些 Geoffrey Hinton 离开 Google 之后的发言,发现他反复在讲一个看起来特别技术、其实普通人也完全用得上的想法:大模型的真正力量不在于「大」,而在于它能把自己的能力「教」给小模型。这件事在 AI 圈叫「知识蒸馏」。听起来玄,但翻译成普通人的工作流,就是一句话:你日常对着大 AI 反复要做的事,可以让它倒过来帮你「蒸馏」出一套自己反复能用的小模板。
说一下 Hinton 这个人。他是深度学习的奠基人之一,圈内常被叫「AI 之父」,2018年拿过图灵奖,2024年又拿了诺贝尔物理学奖。2023年5月他76岁那年从 Google 离职,离开之后开始更自由地谈他的想法。这些发言里有一类听起来很玄、其实很实用,「蒸馏」就是其中之一。
先说这个想法的来历。2015年 Hinton 跟两位 Google 同事发过一篇论文,意思是:你训练好一个又大又慢但回答得很好的 AI 模型(叫「老师」),然后让一个小很多的模型(叫「学生」)来模仿老师的输出。
但精彩的地方在于:学生学的不是老师的最终答案,而是老师的「判断感」。
举个例子。老师看一张图说「这是猫」,传统训练只告诉学生「答案是猫」。Hinton 的做法是把老师的全部「软答案」给学生看:这张图老师有七成觉得像猫、两成觉得像狗、一成觉得像老虎。藏在「猫和狗比较像、和老虎也有点像」里的相对感,就是 Hinton 起的名字 "dark knowledge"(暗知识)。
学到了暗知识的小模型,体积是老师的几十分之一,效果却几乎追平。这条路径催生了今天手机上能直接跑的 AI(iPhone 自带的智能助手就是这么来的),也是 DeepSeek 这种小型模型能用很少参数跟上 GPT 的关键之一。
说回普通人怎么用。
这套思路反过来用,正好是一个普通人也能套的工作流:你每天对着国内的几个大模型,或者像 ChatGPT、Claude 这种大 AI 反复要做的事(写周报、写邮件、整理会议纪要、给孩子讲数学题、改代码),不就是「老师在反复回答」吗。你完全可以让大 AI 倒过来帮你「蒸馏」出一份你自己反复能用的小模板。
我把这套用法叫「个人蒸馏」。
具体是这么操作的。
挑一件你反复要做的事——最适合做个人蒸馏的,是那种每周都要做、每次又得花点脑子的活:写周报、写月报、写晨会通知、给某类客户回信息、整理会议纪要等等。
挑好之后,第一次让大 AI 从零做一遍。把你脑子里的所有约束、想法、好范例都告诉 AI,跟它聊到结果让你满意。这一次可能要花30分钟到一小时,不要怕慢,这是「老师在认真讲」的过程。
最关键的一步,是让 AI 倒过来帮你提炼模板。你跟 AI 说:「把刚才我们的整个流程浓缩成一段提示词模板,让我下次拿一份原始材料贴进去就能直接用;把你刚才考虑过的关键判断点都嵌进去。」
得到的这份模板,就是你的「学生」——下次同类任务来了,你不用从零再讨论一遍,把数据塞进去就能跑。
举一个场景:写周报(拿这个做实验)
第一次你可以跟 AI 来回聊,时间长一些,把你这周做的事、想突出什么、想避免什么、领导更喜欢看什么风格全都讲清楚了,可能要反复改才行。然后你让 AI 输出一份「以后我每周写周报的提示词模板」,里面包含「先列三件最值得说的事」「按事件加数据加影响加下周计划的结构写」「语气克制、避免吹牛」这些具体规则。
之后就可以直接复用了。你就蒸馏了写周报的自己 ^_^
不管你用 ChatGPT、Claude 这种国外大模型,还是 DeepSeek、Kimi、通义、豆包这些国内的,这套做法都一样能跑——它跟用哪家模型没关系,跟「怎么把一次精雕的对话浓缩成一份能反复用的模板」有关系。
Hinton 想法的底层逻辑:大 AI 真正的价值,不在于每次都从零跟它聊一遍,在于它能帮你把一次精雕的好做法蒸馏成你以后能反复使用的东西。
技术圈把这件事叫「知识蒸馏」,普通人可以管它叫「个人蒸馏」。叫法不重要,重要的是把这件事落到自己每天反复做的某件具体事上。
发布于 北京
