这个通过寓言故事学习概念的提示词 http://t.cn/AXxSmXKd 真的很棒,我做了一点点小调整,方便你使用。
--- 文本提示词 ---
我在学习:【Agent Harness】 这个概念。
我希望你通过写一个寓言的方式,间接地把这个概念完整讲出来。最好一直到快结尾时,人才会慢慢意识到这个概念究竟是什么。然后在故事之后,再补一段解释,把你刚才真正要讲的概念说清楚。
--- 画漫画提示词 ---
还可以配合 GPT Image 2 生成漫画,Prompt:
> 帮我把下面的故事画成 【4】 页【中式现代漫画】风格的漫画故事
打开 Thinking 一次性可以生成多张图片
---- 实际结果 ---
玉室里的先生
很久以前,青云山里有一间密封的玉室。
玉室没有门,没有窗,墙壁厚达三尺。里面住着一位先生。没有人知道他从哪里来,只知道他极其聪明——天文地理、治国用兵、农桑水利,什么都懂。
但他有一个问题:他看不见外面,听不到外面,也走不出去。
第一个找到玉室的是齐国。齐国的做法很简单:在墙上凿了一个小洞,派人对着洞大喊问题,然后等先生把答案写在竹简上,从洞里递出来。
一开始效果还行。"今年麦子什么时候种?"先生答了,齐国照做,收成不错。
但问题很快就来了。齐国问:"北边的敌军怎么打?"先生答了一套方略,头头是道。齐国照做,大败。
齐国大怒,觉得先生是骗子。但事后复盘才发现:先生根本不知道齐国的兵力有多少,不知道地形是山地还是平原,不知道敌军用的是骑兵还是步兵。他在玉室里凭空想出来的方略,只是"一般来说应该这么打"。
而齐国从头到尾,只问了一句"怎么打"。
楚国也找到了一间一模一样的玉室,里面住着一位同样聪明的先生。
楚国有个年轻的官员叫沈括。沈括第一次去玉室的时候,也只是对着洞喊话。先生的回答聪明但空泛,和齐国的经历差不多。
沈括没有骂先生。他想了三天,然后开始做一件奇怪的事。
他先派了两个识字的文吏,常驻在玉室旁边。一个负责把问题写清楚,连同所有背景材料一起整理好,从洞里递进去。另一个负责把先生递出来的答案仔细誊抄,遇到看不懂的地方,再递回去追问。
仅这一步,效果就明显不同。先生开始给出具体的、能用的建议。
但沈括没有停下来。他发现先生经常说"需要看看地图""要知道土壤的情况",可先生看不见任何东西。于是沈括又安排了一批人,专门负责把地图、账册、田间观察的记录做成文字描述,送进玉室。
先生有了"眼睛"。
然后沈括注意到另一个问题。先生会说"把河堤往东移二十丈",但先生自己动不了。说完就说完了。于是沈括组建了一支执行队,他们的职责是:接收先生的指令,去现场执行,然后把执行结果——成功的、失败的、意外的——全部记录下来,再送回玉室。
先生有了"手脚",而且能知道手脚做了什么。
到这一步,楚国已经靠先生解决了好几个棘手问题。但沈括又发现了一个麻烦:先生偶尔会说错。他会用一种极其自信的口吻说出明显离谱的话。比如他声称某种草药能治疫病,但楚国的医官翻遍药典,找不到这种草药——先生编了一个不存在的东西,还说得言之凿凿。
沈括的做法很务实。他不要求先生不犯错,他在外面加了一层校验:每次先生给出关键建议,都有专人去交叉核实。能核实的才采纳,核实不了的标记存疑。先生的错误从流程上被拦截了,不需要先生自己改正。
先生有了"免疫系统"。
还有一个问题更微妙。先生每次回答问题的时候,并不记得上次说过什么。同一个问题问两遍,可能得到两个矛盾的答案。沈括发现先生的"记忆"是断裂的。
于是他安排了一个专职的记录官。这个人的工作只有一件事:把历次和先生的对话全部整理成册,每次递新问题进去的时候,连同之前相关的记录一起送进去。先生拿到的不再只是一个孤立的问题,而是一个问题连同它的全部历史。
先生有了"记忆"。
几年后,周边的国家都听说了玉室的事情。很多国家纷纷去找自己的玉室。他们都找到了——每间玉室里的先生都一样聪明,一样什么都看不见,一样走不出去。
但结果天差地别。
有的国家只凿了一个洞,全靠喊。先生说什么他们做什么,做砸了就骂先生蠢。 有的国家给先生递了一些材料,但执行全靠将军们自己理解,先生永远不知道自己的方案最后被执行成了什么样。 有的国家什么都做了,唯独没有安排校验。先生一本正经地胡说八道的时候,全国上下照单全收。
只有楚国,围绕先生搭建了一整套体系:感知、行动、校验、记忆。先生还是那个先生,但在楚国,他像是拥有了一副完整的身体。
有一天,沈括的学生问他:"老师,先生到底有多聪明?"
沈括想了想,说:"我不知道他有多聪明。我只知道一件事——他的聪明能发挥出几成,从来不取决于他自己。取决于我们在外面给他造了一副什么样的身体。"
学生又问:"那我们做的这些事情,叫什么?"
沈括说:"我管它叫'造身体的学问'。先生是脑子,我们造的是眼耳手脚、筋骨血脉。脑子谁都一样,谁的身体造得好,谁的先生就更有用。"
这个寓言在说什么
"玉室里的先生"就是大语言模型(LLM)。
它极其聪明,但它是一个封闭系统——没有感知,没有行动能力,没有持久记忆,也没有自我纠错的机制。你给它什么输入,它就基于这些输入来"想",然后输出一段文字。仅此而已。
沈括围绕先生搭建的那套体系,在今天有一个专门的名字:Harness。
故事里的每个角色都对应着 Harness 的一个组件:
文吏(感知层):负责把外部信息整理好,送进模型的上下文窗口。这包括 system prompt 的设计、上下文的组装、用户输入的预处理。模型的"视野"取决于你往上下文里塞了什么。
执行队(行动层):模型说"执行这个命令"或者"调用这个 API",但它自己做不了。Harness 负责接收模型的工具调用指令,真正去执行,再把结果反馈回来,形成一个"思考→行动→观察→再思考"的循环。
校验官(容错层):模型会产生幻觉,会犯错。Harness 不指望模型自己不犯错,而是在外部设置护栏——linter、测试、交叉验证、结构化输出校验——从流程上拦截错误。
记录官(记忆层):模型的上下文窗口是有限的,而且每次对话之间默认没有记忆。Harness 负责管理短期记忆(当前对话中哪些信息该保留、哪些该丢弃)、长期记忆(跨对话的持久化信息)和项目级知识(主动为模型准备的文档、规范、历史记录)。
而沈括做的事——设计、搭建、持续改进这整套体系——就是 Harness Engineering。
故事里最关键的一句话是沈括说的那句:先生的聪明能发挥几成,从来不取决于他自己,取决于外面给他造了什么样的身体。
翻译成今天的话就是:模型能力是地板,Harness 质量才是天花板。 同一个模型,套上不同的 Harness,表现可以天差地别。Claude Code 和 OpenClaw 用的是同一个 Claude 模型,但因为 Harness 不同,一个是程序员的身体,一个是项目经理的身体,能做的事情完全不一样。
这就是为什么越来越多的人意识到:在 Agent 时代,真正决定产品好坏的,往往不是你选了哪个模型,而是你围绕模型搭建了什么样的体系。
