寓言故事解析Agent Harness概念

这个通过寓言故事学习概念的提示词 http://t.cn/AXxSmXKd 真的很棒，我做了一点点小调整，方便你使用。

--- 文本提示词 ---

我在学习：【Agent Harness】这个概念。

我希望你通过写一个寓言的方式，间接地把这个概念完整讲出来。最好一直到快结尾时，人才会慢慢意识到这个概念究竟是什么。然后在故事之后，再补一段解释，把你刚才真正要讲的概念说清楚。

--- 画漫画提示词 ---

还可以配合 GPT Image 2 生成漫画，Prompt：
> 帮我把下面的故事画成【4】页【中式现代漫画】风格的漫画故事

打开 Thinking 一次性可以生成多张图片

---- 实际结果 ---

玉室里的先生

很久以前，青云山里有一间密封的玉室。

玉室没有门，没有窗，墙壁厚达三尺。里面住着一位先生。没有人知道他从哪里来，只知道他极其聪明——天文地理、治国用兵、农桑水利，什么都懂。

但他有一个问题：他看不见外面，听不到外面，也走不出去。

第一个找到玉室的是齐国。齐国的做法很简单：在墙上凿了一个小洞，派人对着洞大喊问题，然后等先生把答案写在竹简上，从洞里递出来。

一开始效果还行。"今年麦子什么时候种？"先生答了，齐国照做，收成不错。

但问题很快就来了。齐国问："北边的敌军怎么打？"先生答了一套方略，头头是道。齐国照做，大败。

齐国大怒，觉得先生是骗子。但事后复盘才发现：先生根本不知道齐国的兵力有多少，不知道地形是山地还是平原，不知道敌军用的是骑兵还是步兵。他在玉室里凭空想出来的方略，只是"一般来说应该这么打"。

而齐国从头到尾，只问了一句"怎么打"。

楚国也找到了一间一模一样的玉室，里面住着一位同样聪明的先生。

楚国有个年轻的官员叫沈括。沈括第一次去玉室的时候，也只是对着洞喊话。先生的回答聪明但空泛，和齐国的经历差不多。

沈括没有骂先生。他想了三天，然后开始做一件奇怪的事。

他先派了两个识字的文吏，常驻在玉室旁边。一个负责把问题写清楚，连同所有背景材料一起整理好，从洞里递进去。另一个负责把先生递出来的答案仔细誊抄，遇到看不懂的地方，再递回去追问。

仅这一步，效果就明显不同。先生开始给出具体的、能用的建议。

但沈括没有停下来。他发现先生经常说"需要看看地图""要知道土壤的情况"，可先生看不见任何东西。于是沈括又安排了一批人，专门负责把地图、账册、田间观察的记录做成文字描述，送进玉室。

先生有了"眼睛"。

然后沈括注意到另一个问题。先生会说"把河堤往东移二十丈"，但先生自己动不了。说完就说完了。于是沈括组建了一支执行队，他们的职责是：接收先生的指令，去现场执行，然后把执行结果——成功的、失败的、意外的——全部记录下来，再送回玉室。

先生有了"手脚"，而且能知道手脚做了什么。

到这一步，楚国已经靠先生解决了好几个棘手问题。但沈括又发现了一个麻烦：先生偶尔会说错。他会用一种极其自信的口吻说出明显离谱的话。比如他声称某种草药能治疫病，但楚国的医官翻遍药典，找不到这种草药——先生编了一个不存在的东西，还说得言之凿凿。

沈括的做法很务实。他不要求先生不犯错，他在外面加了一层校验：每次先生给出关键建议，都有专人去交叉核实。能核实的才采纳，核实不了的标记存疑。先生的错误从流程上被拦截了，不需要先生自己改正。

先生有了"免疫系统"。

还有一个问题更微妙。先生每次回答问题的时候，并不记得上次说过什么。同一个问题问两遍，可能得到两个矛盾的答案。沈括发现先生的"记忆"是断裂的。

于是他安排了一个专职的记录官。这个人的工作只有一件事：把历次和先生的对话全部整理成册，每次递新问题进去的时候，连同之前相关的记录一起送进去。先生拿到的不再只是一个孤立的问题，而是一个问题连同它的全部历史。

先生有了"记忆"。

几年后，周边的国家都听说了玉室的事情。很多国家纷纷去找自己的玉室。他们都找到了——每间玉室里的先生都一样聪明，一样什么都看不见，一样走不出去。

但结果天差地别。

有的国家只凿了一个洞，全靠喊。先生说什么他们做什么，做砸了就骂先生蠢。有的国家给先生递了一些材料，但执行全靠将军们自己理解，先生永远不知道自己的方案最后被执行成了什么样。有的国家什么都做了，唯独没有安排校验。先生一本正经地胡说八道的时候，全国上下照单全收。

只有楚国，围绕先生搭建了一整套体系：感知、行动、校验、记忆。先生还是那个先生，但在楚国，他像是拥有了一副完整的身体。

有一天，沈括的学生问他："老师，先生到底有多聪明？"
沈括想了想，说："我不知道他有多聪明。我只知道一件事——他的聪明能发挥出几成，从来不取决于他自己。取决于我们在外面给他造了一副什么样的身体。"
学生又问："那我们做的这些事情，叫什么？"

沈括说："我管它叫'造身体的学问'。先生是脑子，我们造的是眼耳手脚、筋骨血脉。脑子谁都一样，谁的身体造得好，谁的先生就更有用。"

这个寓言在说什么

"玉室里的先生"就是大语言模型（LLM）。

它极其聪明，但它是一个封闭系统——没有感知，没有行动能力，没有持久记忆，也没有自我纠错的机制。你给它什么输入，它就基于这些输入来"想"，然后输出一段文字。仅此而已。

沈括围绕先生搭建的那套体系，在今天有一个专门的名字：Harness。

故事里的每个角色都对应着 Harness 的一个组件：

文吏（感知层）：负责把外部信息整理好，送进模型的上下文窗口。这包括 system prompt 的设计、上下文的组装、用户输入的预处理。模型的"视野"取决于你往上下文里塞了什么。

执行队（行动层）：模型说"执行这个命令"或者"调用这个 API"，但它自己做不了。Harness 负责接收模型的工具调用指令，真正去执行，再把结果反馈回来，形成一个"思考→行动→观察→再思考"的循环。

校验官（容错层）：模型会产生幻觉，会犯错。Harness 不指望模型自己不犯错，而是在外部设置护栏——linter、测试、交叉验证、结构化输出校验——从流程上拦截错误。

记录官（记忆层）：模型的上下文窗口是有限的，而且每次对话之间默认没有记忆。Harness 负责管理短期记忆（当前对话中哪些信息该保留、哪些该丢弃）、长期记忆（跨对话的持久化信息）和项目级知识（主动为模型准备的文档、规范、历史记录）。

而沈括做的事——设计、搭建、持续改进这整套体系——就是 Harness Engineering。

故事里最关键的一句话是沈括说的那句：先生的聪明能发挥几成，从来不取决于他自己，取决于外面给他造了什么样的身体。

翻译成今天的话就是：模型能力是地板，Harness 质量才是天花板。同一个模型，套上不同的 Harness，表现可以天差地别。Claude Code 和 OpenClaw 用的是同一个 Claude 模型，但因为 Harness 不同，一个是程序员的身体，一个是项目经理的身体，能做的事情完全不一样。

这就是为什么越来越多的人意识到：在 Agent 时代，真正决定产品好坏的，往往不是你选了哪个模型，而是你围绕模型搭建了什么样的体系。

发布于美国