在人机交互过程中,人类消费的是 GUI,机器消费的是 API,那么 Agent 消费的是什么?
Agent 必须理解任务的整体场景:用户的目标、当前状态、外部环境(数据、工具、权限),它不是单点调用 API,而是要根据上下文决定调用哪些 API、以何种顺序来完成目标。从这个视角来看,它消费的是上下文(Context)。
人类给 Agent 的输入不是一堆低级操作,而是对目标的“规格说明”或“期望结果”,Agent 的工作是把 Prompt 转换成可执行的 API 调用序列。从这个视角看,它消费的是规范描述(Spec)。
Agent 并非孤立存在,它往往处在多 Agent 协作或人机混合环境中,因此它需要消费一种比 API 更高阶的“交互协议”:包含角色、任务分工、状态同步、反馈循环等等。从这个视角看,它消费的是协议约定(Protocol)。
发布于 浙江
