🔥从 Claude Code 到 Codex: 基于 Anthropic harness 思路的迁移实践
2026 年 3 月 24 日,Anthropic 发了一篇工程文章:Harness Design for Long-Running Apps。
链接:http://t.cn/AXf30W0V
我反复读了好几遍。越读越觉得它跟市面上那些 agent 经验帖完全不在一个层面上——它可能是目前公开资料里,把长时间应用开发的 harness 讲得最系统、最工程化、也最坦诚的一篇。
过去一年里,围绕 agent coding 的讨论几乎全部集中在同一个问题上:模型到底够不够聪明?上下文窗口够不够长?工具调用够不够灵活?Anthropic 这篇文章把注意力拽到了一个完全不同的方向——外层系统该怎么设计。
这个视角转换非常关键。因为长时间开发任务里,真正会把系统拖垮的,往往跟模型聪不聪明没多大关系。任务一长,目标开始漂移;上下文一长,模型开始忘东忘西、张冠李戴;模型习惯性高估自己的完成度;每一轮看起来"差不多了",最后交出来的东西根本不能用。
这些问题,再聪明的模型也解决不了。它们需要的是工程层面的结构性约束——也就是 Anthropic 所说的 harness。
阅读全文:http://t.cn/AXMq6ljS
#人工智能[超话]##青稞社区##Claude#
发布于 河北
