Claude Managed Agents设计方向

听了一期很有料的播客，是 Every 的 Dan Shipper 采访 Anthropic 平台团队的两位负责人，一位是产品负责人 Angela Jiang，一位是工程负责人 Katelyn Lesse。聊的核心话题是 Claude Managed Agents 这个产品背后的设计思路和未来方向。

先说背景。Claude 的平台经历了几个阶段的演化：最早就是一个补全接口，发个 prompt 拿个回复；后来加了工具调用和对话状态；现在变成了一整套可以在云端运行的自主 Agent 基础设施。这个演化的驱动力很简单，模型越来越强、越来越自主，平台就得跟着往更高层的抽象走，目标始终是帮用户用最少的力气拿到最好的结果。

Angela 提到一个很关键的观点：现在这个阶段，harness（运行框架）和模型正在变成一个紧密绑定的整体。以前大家喜欢搞一个超级通用的框架，随便换模型进去跑。但现在各家模型走的技术路线差异越来越大，你想榨出最好的效果，就得针对特定模型做深度的 harness 工程。他们内部测试过不同的 harness 方案，效果差异非常大。所以未来的趋势是，你换的单位应该是"Agent"（harness 加模型的组合），而不是单独换底层模型。

Katelyn 重点聊了基础设施这块。她说大多数人以为做 Agent 最难的是 harness 工程，就是怎么调 prompt、怎么管理上下文窗口这些。但实际上真正卡住所有人的是基础设施：怎么让 Agent 持续运行不挂掉、怎么安全地沙箱隔离、怎么存储会话数据、怎么弹性伸缩。Anthropic 自己内部反复踩了这个坑之后，决定把这层基础设施做成产品开放出来，这就是 Managed Agents 的由来。

关于实际应用场景，他们举了一个内部的例子：法务审核营销文案。以前营销写完东西要提工单给法务审，现在有一个 Agent 先做第一轮审核，能过的直接放行，拿不准的才推给人类法务。而且有意思的是，使用这个工具的非技术人员后来自己用 Claude Code 给 Agent 提 PR 做改进。整个系统是"managed agents 套 managed agents"的结构，每一层针对不同用户做了不同的抽象。

多智能体编排也是他们刚上线的能力。Angela 说看到了几种很有意思的模式：一个生成、一个对抗审查的配对模式；拆成很多小任务再汇总的 swarm 模式；还有执行和建议分离的 advisor 模式。不同架构适合不同场景，比如 swarm 适合 bug hunting，advisor 适合深度研究。

最后聊到未来一年的方向，Angela 说了一句很有野心的话：他们想让 Claude 足够理解自己，能自己决定用什么模型、自己拆分子 Agent、自己构建运行框架。到那个时候，用户只需要给两个东西：一个可验证的目标，和一个预算。剩下的全部由 Claude 自己搞定。

这个方向如果真能走通，意味着"平台"这个概念本身也会被压缩。你不再需要理解什么是 harness、什么是 tool calling、什么是 prompt engineering。你只需要说清楚你要什么结果，愿意花多少钱，然后等着收货就行。

#科技先锋官##How I AI#

发布于山东