默庵·超级个体 26-04-01 22:37
微博认证:微博新知博主 科技博主 头条文章作者 微博原创视频博主

分析 Claude Code 的文章看了不少,但博主 XiaoTan 这篇《ClaudeCode 源码深度研究报告》是真正让我觉得值得反复读的一篇。

它最厉害的地方在于,把一个大家都觉得「很强但说不清为什么强」的产品,拆成了清清楚楚的工程结构。看完之后你会发现,Claude Code 的强,跟某一段神秘的 system prompt 没有关系,它强在整个系统的设计。

报告里有几个发现,我觉得对做产品 Agent 的人来说特别有启发:

第一,prompt 是拼装出来的。Claude Code 的系统提示词根本不是一段写死的文本,而是一个动态编排器。前半段是稳定的身份定义、行为规范、工具说明,适合做缓存;后半段是根据每次会话实时注入的上下文,比如 memory、语言偏好、MCP 指令等等。这意味着 prompt 可以像代码模块一样管理、调试、灰度发布。

第二,工具调用走的是完整管线。模型说要调工具,系统不会直接执行,而是先过一遍 schema 校验、权限判断、pre-hook 处理,执行完再走 telemetry、post-hook、异常兜底。每个环节都可以插入逻辑,工具本身的代码完全不用动。这条管线是它比大多数 Agent 产品稳定得多的核心原因。

第三,它内建了多个专业化 Agent。有负责通用任务的,有负责探索的,有负责规划的,还有一个专门搞验证的 Verification Agent。这个验证 Agent 特别狠,它的工作就是主动去尝试打破你的实现,跑 build、跑测试、做类型检查,最后给一个明确的通过或不通过。

第四,Skill 在这个体系里是可复用的工作流包。它包含完整的执行步骤、工具调用序列和输出规范,模型加载之后可以直接进入执行状态,不需要每次都从零推理该怎么做。

第五,MCP 的角色比大多数人理解的要深。它同时承担了工具注册和行为引导两个职责,不仅告诉模型有哪些工具可用,还通过 instructions 字段告诉模型在什么场景下该怎么用。

第六,prompt 里专门写了一段「任务哲学」:不要乱加功能,不要过度抽象,不要瞎重构,先读代码再改代码,结果要诚实汇报。这些负面约束看起来像常识,但对 LLM 来说极其重要,因为模型天然倾向于过度发挥。

把这些加在一起看,你会理解为什么报告最后的结论是:Claude Code 更像一个 Agent Operating System。它有平台化的入口层,有可编排的 prompt 系统,有带治理的工具管线,有专业化的 Agent 分工,有四套扩展机制(Skills、Plugins、Hooks、MCP)。这就是一个操作系统该有的样子。

对我们做产品 Agent 的人来说,最直接的收获就是五件事:把 system prompt 拆成模块用函数拼装,给工具调用加上校验和权限管线,把高频任务封装成标准化 Skill,在 prompt 里明确写清楚哪些事不要做,关键任务完成后加一个独立的验证环节。

这些方法不需要一步到位,一层一层加就行。每加一层,Agent 就稳定一分。

报告下载地址:github.com/tvytlx/claude-code-deep-dive

#科技先锋官##How I AI#

发布于 山东