OpenAI解析Agent Loop架构

今天OpenAI官博和Altman突然在X平台甩出了两张王炸：

1. Agent Loop架构揭秘：首次公开Codex的「大脑」是怎么运转的

2. PostgreSQL极限架构：1个主库扛起8亿用户的疯狂操作

这一波组合拳打得太漂亮了。

今天咱们就来拆解一下，OpenAI到底憋了什么大招。

Agent LoopCodex的「大脑」是怎么运转的

什么是Agent Loop？

如果你用过Codex CLI、Claude Code等等CLI终端工具，你可能会好奇：

这玩意儿到底是怎么知道我想干啥的？怎么就能自己读文件、写代码、跑命令？

答案就藏在一个叫Agent Loop（智能体循环）的东西里。

简单来说，Agent Loop就像一个「总指挥」，它负责把「用户意图」「模型大脑」和「执行工具」串成一个完美的闭环。

这不是普通的「你问我答」，而是一个包含了「观察-思考-行动-反馈」的能干活的系统。

下面，把这个黑盒拆开，看看一个真正的AI Agent是如何跑起来的。

一个完整的Agent Loop是怎么跑起来的

用一个具体的例子来说明。

假设在终端里输入：给项目的README.md加一个架构图。

第一步：构建Prompt

这好比给大脑发工单。

Codex不会直接把你的话丢给模型，它会先构建一个精心设计的「Prompt」：

我是谁：（System）：告诉模型它是谁、能干什么

我有什么工具（Tools）：有哪些工具可以调用（比如shell命令、文件操作）

环境上下文（Context）：当前在哪个目录、用的什么shell

用户指令：给README.md加一个架构图。

这就像给模型发一封详细的工作邮件，而不是只发一句「帮我干活」。

第二步：模型推理（Inference）

这一步，大脑开始转动。

Codex把这个Prompt发给ResponsesAPI，模型开始思考：

「用户想加架构图，我得先看看现在的README是什么样的……」

然后模型做出决定：调用shell工具，执行catREADME.md。

第三步：工具调用（ToolCall）

Codex收到模型的请求，在本地执行命令，把README.md的内容读出来。

这就像手脚开始动起来。

第四步：结果反馈

这一步，终端把README.md的内容吐了出来。

这时候流程没有结束。Codex把命令的输出追加到Prompt里，再发给模型。

第五步：循环

模型看到了README的内容，再次进行推理：

可能是生成一个Mermaid图，可能是直接写一段ASCII图形……然后再调用工具写入文件。

这个循环一直持续，直到模型认为任务完成了，输出一条「我搞定了」的消息。

它不是在回答问题，它是在解决问题。

为什么这很重要？

也许你可能会说：「这不就是多调了几次API吗？」

但绝非这么简单。

传统的LLM应用是「一问一答」式的：你问，它答，完事儿。

但Agent Loop让AI变成了一个能独立干活的员工。

它会自己规划路径（Chain of Thought）。

它会自己检查错误（Self-Correction）。

它会自己验证结果（Feedback Loop）。

这才是真正的「AI Agent」。

而Agent Loop，就是那个可以让AI实现从「陪伴聊天」迈向「独立干活」飞跃的桥梁。