虾包 26-01-19 12:41
微博认证:动漫博主

这两天体验opencode + oh-my-opencode 方案,感觉 agents 这种方式已经进化到一个能提供生产力的水平了,特别是感觉手中的GLM-4.7比之前在Cladue Code上使用要聪明很多

- 由于工具使用能力很强,所以能自己敲命令,自主挖掘合适的上下文
- 虽然目前看起来还是不太聪明但是会努力试错的模型
- 自主选择合适的模型,可后台启动多个agent并发

今天为了测试他们宣称的“人肉agent调度器”用法,我试着同时开多个 Agents 窗口,并行解决了一些之前懒得弄的环境设置的小case:

- 协助我修复了X11环境下的 emoji 是黑白的问题(影响体验但一直懒弄)
- 一款叫 alacritty 的 terminal 在更新后,复制功能失效了,它帮提了几个方案,我配合它更新配置、验证
- 帮修复一个开源项目的构建、做appimage打包(和创建打包需要的docker环境),提交git commit和PR

它们做得比较慢,但大部分时候不需要我参与,可以清晰感受到,人在其中参与的环节越来越少了.. 现在要求使用者充当一个提供现实环境上下文 + 审查工作结果 + 关键决策的工具,似乎是对使用者的要求变高了

它目前很适合:

- 自动操作工具:比如让它帮忙修复某个平台上的构建、布置环境、写自动化脚本
- 尝试修复错误:找方案(自己想、搜索引擎上找)修复,自己验证
- 可自行做验证的程序模块的开发

很极端地, oh-my-opencode 出了一个特殊的 ulw 模式,让 agents 驱动程序一直跑,跑到目标成功为止... 适合工作目标十分清晰+完全可自行验证的场景
难想象到年底会演化到什么程度...
大胆想象一下,Agents一多,做事太快了,审查不过来呀,那就需要:
- 引入一个慢一点、但能力很强的模型帮着慢慢审查、操作
- 更强的与真实环境交互的能力,去年已经出现了强有力的苗子MCP + Skills,不过似乎因为工具那端的支持还不足,还不够强,但它会随着社区和厂商的跟进,慢慢变强
年底再回来看看..

发布于 广西