Agent 要被吃进大模型了OpenAI推出了o3，指标都很好，最新2025美国数学竞赛99.5%。现在更新显著不同是加了agent，就是大模型不靠自己不靠谱的数学和逻辑能力了，改用工具。还有自己写个python程序跑结果。这种框架是必然的，也是一次解放。有工具，没有必要自己艰难地去理解。感觉基座大模型目

Agent 要被吃进大模型了

OpenAI推出了o3，指标都很好，最新2025美国数学竞赛99.5%。

现在更新显著不同是加了agent，就是大模型不靠自己不靠谱的数学和逻辑能力了，改用工具。还有自己写个python程序跑结果。

这种框架是必然的，也是一次解放。有工具，没有必要自己艰难地去理解。

感觉基座大模型目前基本到头了，大家都差不多，再训练也不会有本质提升，沦为雕花。好事是中国已经能追上了。

现在潮流是搞agent，而且大模型来吃agent，直接训练调用agent。而之前是agent开发者调用外接的大模型提供能力，接入的大模型不变。显然前者更有潜力，大模型和agent都能不断变化，满足人类要求。

这里还是会有基础问题，就是大模型没有理解数学，通过调用工具缓解了。

大约过程是这样，大模型说，我看你问了一个问题，这东西文字组合像是数学。我虽然不知道什么意思，但看人类给的例子，是套用这几个文字过程，能让用户满意。有时调用计算器，能更快得出结果，用户更满意了。模仿人类写程序算，就能输出更多结果，用户超级满意。我算的都是对的，用户不满意我再承认错了。有时我干脆说这些是编程算的，虽然我不知道怎么编，但是用户看我说编了，就很满意。

发布于广东