新智元 26-01-24 15:31
微博认证:新智元官方微博

今天OpenAI官博和Altman突然在X平台甩出了两张王炸:

1. Agent Loop架构揭秘:首次公开Codex的「大脑」是怎么运转的

2. PostgreSQL极限架构:1个主库扛起8亿用户的疯狂操作

这一波组合拳打得太漂亮了。

今天咱们就来拆解一下,OpenAI到底憋了什么大招。

Agent LoopCodex的「大脑 」 是怎么运转的

什么是Agent Loop?

如果你用过Codex CLI、Claude Code等等CLI终端工具,你可能会好奇:

这玩意儿到底是怎么知道我想干啥的?怎么就能自己读文件、写代码、跑命令?

答案就藏在一个叫Agent Loop(智能体循环)的东西里。

简单来说,Agent Loop就像一个「总指挥」,它负责把「用户意图」「模型大脑」和「执行工具」串成一个完美的闭环。

这不是普通的「你问我答」,而是一个包含了「观察-思考-行动-反馈」的能干活的系统。

下面,把这个黑盒拆开,看看一个真正的AI Agent是如何跑起来的。

一个完整的Agent Loop是怎么跑起来的

用一个具体的例子来说明。

假设在终端里输入:给项目的README.md加一个架构图。

第一步:构建Prompt

这好比给大脑发工单。

Codex不会直接把你的话丢给模型,它会先构建一个精心设计的「Prompt」:

我是谁:(System):告诉模型它是谁、能干什么

我有什么工具(Tools):有哪些工具可以调用(比如shell命令、文件操作)

环境上下文(Context):当前在哪个目录、用的什么shell

用户指令:给README.md加一个架构图。

这就像给模型发一封详细的工作邮件,而不是只发一句「帮我干活」。

第二步:模型推理(Inference)

这一步,大脑开始转动。

Codex把这个Prompt发给ResponsesAPI,模型开始思考:

「用户想加架构图,我得先看看现在的README是什么样的……」

然后模型做出决定:调用shell工具,执行catREADME.md。

第三步:工具调用(ToolCall)

Codex收到模型的请求,在本地执行命令,把README.md的内容读出来。

这就像手脚开始动起来。

第四步:结果反馈

这一步,终端把README.md的内容吐了出来。

这时候流程没有结束。Codex把命令的输出追加到Prompt里,再发给模型。

第五步:循环

模型看到了README的内容,再次进行推理:

可能是生成一个Mermaid图,可能是直接写一段ASCII图形……然后再调用工具写入文件。

这个循环一直持续,直到模型认为任务完成了,输出一条「我搞定了」的消息。

它不是在回答问题,它是在解决问题。

为什么这很重要?

也许你可能会说:「这不就是多调了几次API吗?」

但绝非这么简单。

传统的LLM应用是「一问一答」式的:你问,它答,完事儿。

但Agent Loop让AI变成了一个能独立干活的员工。

它会自己规划路径(Chain of Thought)。

它会自己检查错误(Self-Correction)。

它会自己验证结果(Feedback Loop)。

这才是真正的「AI Agent」。

而Agent Loop,就是那个可以让AI实现从「陪伴聊天」迈向「独立干活」飞跃的桥梁。