Claude Code源码研究报告分析

分析 Claude Code 的文章看了不少，但博主 XiaoTan 这篇《ClaudeCode 源码深度研究报告》是真正让我觉得值得反复读的一篇。

它最厉害的地方在于，把一个大家都觉得「很强但说不清为什么强」的产品，拆成了清清楚楚的工程结构。看完之后你会发现，Claude Code 的强，跟某一段神秘的 system prompt 没有关系，它强在整个系统的设计。

报告里有几个发现，我觉得对做产品 Agent 的人来说特别有启发：

第一，prompt 是拼装出来的。Claude Code 的系统提示词根本不是一段写死的文本，而是一个动态编排器。前半段是稳定的身份定义、行为规范、工具说明，适合做缓存；后半段是根据每次会话实时注入的上下文，比如 memory、语言偏好、MCP 指令等等。这意味着 prompt 可以像代码模块一样管理、调试、灰度发布。

第二，工具调用走的是完整管线。模型说要调工具，系统不会直接执行，而是先过一遍 schema 校验、权限判断、pre-hook 处理，执行完再走 telemetry、post-hook、异常兜底。每个环节都可以插入逻辑，工具本身的代码完全不用动。这条管线是它比大多数 Agent 产品稳定得多的核心原因。

第三，它内建了多个专业化 Agent。有负责通用任务的，有负责探索的，有负责规划的，还有一个专门搞验证的 Verification Agent。这个验证 Agent 特别狠，它的工作就是主动去尝试打破你的实现，跑 build、跑测试、做类型检查，最后给一个明确的通过或不通过。

第四，Skill 在这个体系里是可复用的工作流包。它包含完整的执行步骤、工具调用序列和输出规范，模型加载之后可以直接进入执行状态，不需要每次都从零推理该怎么做。

第五，MCP 的角色比大多数人理解的要深。它同时承担了工具注册和行为引导两个职责，不仅告诉模型有哪些工具可用，还通过 instructions 字段告诉模型在什么场景下该怎么用。

第六，prompt 里专门写了一段「任务哲学」：不要乱加功能，不要过度抽象，不要瞎重构，先读代码再改代码，结果要诚实汇报。这些负面约束看起来像常识，但对 LLM 来说极其重要，因为模型天然倾向于过度发挥。

把这些加在一起看，你会理解为什么报告最后的结论是：Claude Code 更像一个 Agent Operating System。它有平台化的入口层，有可编排的 prompt 系统，有带治理的工具管线，有专业化的 Agent 分工，有四套扩展机制（Skills、Plugins、Hooks、MCP）。这就是一个操作系统该有的样子。

对我们做产品 Agent 的人来说，最直接的收获就是五件事：把 system prompt 拆成模块用函数拼装，给工具调用加上校验和权限管线，把高频任务封装成标准化 Skill，在 prompt 里明确写清楚哪些事不要做，关键任务完成后加一个独立的验证环节。

这些方法不需要一步到位，一层一层加就行。每加一层，Agent 就稳定一分。

报告下载地址：github.com/tvytlx/claude-code-deep-dive

#科技先锋官##How I AI#

发布于山东