王铁匠
26-06-27 13:36 微博认证:深圳市云歌人工智能科技有限公司 创始人、CEO 王欣

http://t.cn/AXSHjqKy

这篇文章挺值得看。

AI Agent 的叙事正在变,不再只是比模型,而是比成本、比效率、比工程。同一个模型,换一套 Agent Harness,成功率可能从 12% 到 92%。这说明很多时候,问题不在模型不够聪明,而在模型外面的系统没有做好。

上下文怎么管理,工具怎么调用,失败怎么重试,什么时候该停,每一步怎么追踪,每次成功任务到底花了多少钱,这些才是 Agent 真正落地时绕不过去的问题。以后不能只看 token 单价,而要看 cost per success。一次任务失败了,token 再便宜也只是便宜地失败。

这也是我最近做 Pouchy / Agent SDK 越来越深的感受。真正难的不是接一个大模型 API,而是把记忆、上下文、工具调用、权限、钱包、真实服务和可观测性,做成一套稳定可复用的执行系统。

模型是发动机,但真正决定车能不能开上路的,还有变速箱、底盘、刹车和控制系统。AI 从 demo 走向真实世界,拼的会越来越是工程能力。

发布于 新加坡