[AI]《Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems》J Liu, X Zhao, X Shang, Z Shen [Mohamed bin Zayed University of Artificial Intelligence] (2026)
在AI编码代理领域,「究竟该让模型决策还是让框架决策」是一个悬而未决的工程哲学之争。过去的主流方案受困于显式规划图的僵化——把模型套进状态机,本质原因是工程师不信任模型的自由判断。
本文的核心洞见是:把「代理系统」重新看作「操作系统」。由此,将98.4%的代码投入确定性基础设施(权限门控、工具路由、上下文压缩、会话恢复),而让模型在这个精密容器内自由裁量,这一关键架构使「安全」与「自主」的两难得以解开。
这项工作真正留下的遗产是:证明了生产级AI代理的核心竞争力在于围绕模型的「运营基础设施质量」,而非模型本身的决策能力——当前沿模型的编码能力趋于收敛时,这一洞见将成为决定性的工程指引。它为后来者打开的新门是:如何设计跨会话的持久记忆层、如何量化并主动保护开发者的长期认知能力。但尚未跨过的门槛是:当前架构仅放大了人的短期产出,对开发者技能萎缩、代码库长期连贯性下降等系统性代价,至今没有任何内置的感知与对抗机制。
arxiv.org/abs/2604.14228
#机器学习# #人工智能# #论文# #AI创造营#
发布于 北京
