听了一期很有料的播客,是 Every 的 Dan Shipper 采访 Anthropic 平台团队的两位负责人,一位是产品负责人 Angela Jiang,一位是工程负责人 Katelyn Lesse。聊的核心话题是 Claude Managed Agents 这个产品背后的设计思路和未来方向。
先说背景。Claude 的平台经历了几个阶段的演化:最早就是一个补全接口,发个 prompt 拿个回复;后来加了工具调用和对话状态;现在变成了一整套可以在云端运行的自主 Agent 基础设施。这个演化的驱动力很简单,模型越来越强、越来越自主,平台就得跟着往更高层的抽象走,目标始终是帮用户用最少的力气拿到最好的结果。
Angela 提到一个很关键的观点:现在这个阶段,harness(运行框架)和模型正在变成一个紧密绑定的整体。以前大家喜欢搞一个超级通用的框架,随便换模型进去跑。但现在各家模型走的技术路线差异越来越大,你想榨出最好的效果,就得针对特定模型做深度的 harness 工程。他们内部测试过不同的 harness 方案,效果差异非常大。所以未来的趋势是,你换的单位应该是"Agent"(harness 加模型的组合),而不是单独换底层模型。
Katelyn 重点聊了基础设施这块。她说大多数人以为做 Agent 最难的是 harness 工程,就是怎么调 prompt、怎么管理上下文窗口这些。但实际上真正卡住所有人的是基础设施:怎么让 Agent 持续运行不挂掉、怎么安全地沙箱隔离、怎么存储会话数据、怎么弹性伸缩。Anthropic 自己内部反复踩了这个坑之后,决定把这层基础设施做成产品开放出来,这就是 Managed Agents 的由来。
关于实际应用场景,他们举了一个内部的例子:法务审核营销文案。以前营销写完东西要提工单给法务审,现在有一个 Agent 先做第一轮审核,能过的直接放行,拿不准的才推给人类法务。而且有意思的是,使用这个工具的非技术人员后来自己用 Claude Code 给 Agent 提 PR 做改进。整个系统是"managed agents 套 managed agents"的结构,每一层针对不同用户做了不同的抽象。
多智能体编排也是他们刚上线的能力。Angela 说看到了几种很有意思的模式:一个生成、一个对抗审查的配对模式;拆成很多小任务再汇总的 swarm 模式;还有执行和建议分离的 advisor 模式。不同架构适合不同场景,比如 swarm 适合 bug hunting,advisor 适合深度研究。
最后聊到未来一年的方向,Angela 说了一句很有野心的话:他们想让 Claude 足够理解自己,能自己决定用什么模型、自己拆分子 Agent、自己构建运行框架。到那个时候,用户只需要给两个东西:一个可验证的目标,和一个预算。剩下的全部由 Claude 自己搞定。
这个方向如果真能走通,意味着"平台"这个概念本身也会被压缩。你不再需要理解什么是 harness、什么是 tool calling、什么是 prompt engineering。你只需要说清楚你要什么结果,愿意花多少钱,然后等着收货就行。
#科技先锋官##How I AI#
