我研究完 Claude Code 的代码,发现 cli Agent 产品,归根结底是看模型能力,而不是产品的算法多先进工程能力多强,真的就是模型即产品。Agent 本质上还得依赖模型去调用工具,模型能力不行 cli 就不行。
比如图中这个对 Gemini CLI 的测试,相同任务,Gemini cli 要 30 分钟,而 Claude Code 只要 6 分钟。
但我对下一代 Gemini 很有信息,一定可以缩小差距甚至反超,因为借助 Gemini CLI 这样的应用,他们可以收集足够多的优质用户行为数据,只要数据上来了就可以用这些数据做更好的 RL 强化训练,以 Gemini 团队的能力,他们下一代模型在工具使用方面就可以做到很强,也不愁质量上不来。
AI Agent 能力的核心就是工具调用能力和判断任务是否完成可以停止的能力
发布于 美国
