风云学会陈经 25-04-18 08:29
微博认证:亚洲视觉科技 研发总监 2024微博年度新知博主 长文原创作者 财经观察官

Agent 要被吃进大模型了

OpenAI推出了o3,指标都很好,最新2025美国数学竞赛99.5%。

现在更新显著不同是加了agent,就是大模型不靠自己不靠谱的数学和逻辑能力了,改用工具。还有自己写个python程序跑结果。

这种框架是必然的,也是一次解放。有工具,没有必要自己艰难地去理解。

感觉基座大模型目前基本到头了,大家都差不多,再训练也不会有本质提升,沦为雕花。好事是中国已经能追上了。

现在潮流是搞agent,而且大模型来吃agent,直接训练调用agent。而之前是agent开发者调用外接的大模型提供能力,接入的大模型不变。显然前者更有潜力,大模型和agent都能不断变化,满足人类要求。

这里还是会有基础问题,就是大模型没有理解数学,通过调用工具缓解了。

大约过程是这样,大模型说,我看你问了一个问题,这东西文字组合像是数学。我虽然不知道什么意思,但看人类给的例子,是套用这几个文字过程,能让用户满意。有时调用计算器,能更快得出结果,用户更满意了。模仿人类写程序算,就能输出更多结果,用户超级满意。我算的都是对的,用户不满意我再承认错了。有时我干脆说这些是编程算的,虽然我不知道怎么编,但是用户看我说编了,就很满意。

发布于 广东