大规模并行agent开发经验分享

#IT那些事儿# 大规模并行 agent 开发的实战经验和踩的坑

太逗了，目标是从零开始构建浏览器的多 Agent 大型开发管理实验却暴露了人类社会各种怪现象：

第一个实验：元老院平等参政议政模式
如图一所示，他们让处于同一层级的各个 Agent 使用一个共享状态文件，查看其他 Agent 在做什么，决定自己要做什么，并将更新写回该文件。尽量少规定该怎么做，而是让各个 agent 自行摸索如何自我协作。
结果：一个是这些议员们的吞吐量会降到 1–3 个的水平，大部分时间都在等待锁。二一个是没有任何单个 agent 会接手大型、复杂的任务，它们会刻意回避争用和冲突，选择更小、更安全的修改，而不是对整个项目负起整体责任。

第二个实验：人类公司常见管理模式
如图二所示，他们设计了三个 agent 角色：
规划者——相当于人类中的老板
执行者——相当于人类中的“牛马”
裁决者——相当于人类中的HRBP
规划器会先制定出明确的方案和交付物，推动用户指令不断向前推进。然后这会交给执行者，由执行者作为唯一的主导代理，全权负责确保计划被完整落实。在执行者完成后会有一个独立的裁决者介入，判断执行是否已经完成，以及是否需要再进行一轮迭代。
结果：规划者在一开始就把所有规划都做完了，相当于年初订了战略规划直接下发“牛马”，这会让系统在发现新问题时很难动态调整。这种南辕北辙直到循环的下一次迭代才能自我纠正。

第三个：不要HRBP了
如图三所示，因为发现 agent 执行力足够强，有一个裁决者反而增加了系统复杂度，所以移除了这位 HRBP[允悲]
并且他们在 system prompts 中加入了自我反思和目标对齐提醒。
鼓励 agents 随时调整方向并质疑既有假设。
系统现在高度动态且灵活！！！

小结一下：
当“牛马”足够强的时候，不要为它们本来就会的事情下指令，而只针对它们“不知道的东西”（例如多智能体协作），或者与你的领域强相关的内容（例如如何运行测试、你的部署流水线）。你要把“牛马”们当成一位极其聪明但刚入职的工程师：懂工程，但还不熟悉你的代码库和流程。因为约束往往比指令更有效。“牛马”们在默认情况下通常会做正确的事，而约束是在划定它们的边界。

#昀哥推荐阅读# http://t.cn/AXcIXTUu

发布于北京