Y Combinator 的 CEO Garry Tan 分享了一个非常实用的经验:怎么让你的 AI Agent 说话像个真人,而不是一个千篇一律的聊天机器人。有人夸他的 Agent 特别有表达力,问他能不能分享配置文件,他就把自己的方法论拆开讲了。
秘诀在于三个文件,各管一件事。
第一个叫 SOUL.md,定义的是 Agent 的「灵魂」。这个文件写的是 Agent 是谁,它的声音、价值观、行为准则,什么样的输出是好的,什么样的是差的。Garry Tan 强调,这个文件不能当成系统提示词来写,要当成一部宪法。他自己的 SOUL.md 里写了这些规则:简洁是强制的,幽默是强制的,永远不要用「好问题」开头,在合适的时候可以说脏话。越具体越有态度,Agent 就越不像机器人。他说,写这个文件的心态应该是「你在给你最聪明的朋友做一个关于怎么当你的 briefing」,而不是在配置一个软件。
第二个叫 USER.md,定义的是你是谁。这不是一份简历,是一个关于你这个人的深度模型。你的思维方式,你在做什么事情,你的优势和盲区,你的家庭,你的性格,什么东西会触发你的情绪,你真正在乎什么。Agent 越了解你,就越能好好服务你。Garry Tan 说他自己的 USER.md 大概有 4000 字。
第三个叫 AGENTS.md,定义的是操作规则。每条消息进来要检查什么,什么事情绝对不能做,失败了怎么处理,查找链怎么走,路径规则是什么。这是 Agent 的操作手册,管的是它怎么干活。
Garry Tan 最后点了一个核心:Agent 的表达力来自 SOUL.md 的极度具体。如果你写的是「请有帮助且简洁」,你得到的就是 ChatGPT 默认味道。但如果你写的是「像一个有品味的同行那样说话,一句话能说清的就用一句话,让人不舒服的真话,只要确实是真的,就大胆说出来」,你得到的就是一个有生命力的东西。
我看,有人指出这三个文件还缺一个第四层:MEMORY.md,负责情景记忆的连续性。SOUL.md 让 Agent 的声音保持一致,USER.md 让 Agent 对你的理解保持一致,但如果没有对昨天发生了什么的记忆,Agent 每次开机都会重置对你的认知模型。有人分享了实操经验,说他跟 AI 做了 40 分钟的人格深度访谈,基于 Karpathy 的三层记忆系统更新了记忆地图之后,token 消耗直接降了 90%。还有人提了一个很有意思的实践心得:写 SOUL 文件的时候,用否定句(禁止什么)比用肯定句(应该怎样)效果好得多。他自己的文件里禁止使用破折号,禁止用「关键在于」这个短语,禁止用「leverage」这个词。通用的指令等于通用的输出,有态度的禁令才等于有辨识度的声音。
还有人说了一句特别形象的话:现在配置 Agent 就像在玩模拟人生。也有人做了一个叫 OpenSoul 的小工具,帮不会写这些 md 文件的人,基于他们跟 Claude 或 ChatGPT 的历史对话自动生成这三个文件。
#科技先锋官##How I AI#
