AI编程助手进阶实测

这两天体验opencode + oh-my-opencode 方案，感觉 agents 这种方式已经进化到一个能提供生产力的水平了，特别是感觉手中的GLM-4.7比之前在Cladue Code上使用要聪明很多

- 由于工具使用能力很强，所以能自己敲命令，自主挖掘合适的上下文
- 虽然目前看起来还是不太聪明但是会努力试错的模型
- 自主选择合适的模型，可后台启动多个agent并发

今天为了测试他们宣称的“人肉agent调度器”用法，我试着同时开多个 Agents 窗口，并行解决了一些之前懒得弄的环境设置的小case：

- 协助我修复了X11环境下的 emoji 是黑白的问题（影响体验但一直懒弄）
- 一款叫 alacritty 的 terminal 在更新后，复制功能失效了，它帮提了几个方案，我配合它更新配置、验证
- 帮修复一个开源项目的构建、做appimage打包（和创建打包需要的docker环境），提交git commit和PR

它们做得比较慢，但大部分时候不需要我参与，可以清晰感受到，人在其中参与的环节越来越少了.. 现在要求使用者充当一个提供现实环境上下文 + 审查工作结果 + 关键决策的工具，似乎是对使用者的要求变高了

它目前很适合：

- 自动操作工具：比如让它帮忙修复某个平台上的构建、布置环境、写自动化脚本
- 尝试修复错误：找方案（自己想、搜索引擎上找）修复，自己验证
- 可自行做验证的程序模块的开发

很极端地， oh-my-opencode 出了一个特殊的 ulw 模式，让 agents 驱动程序一直跑，跑到目标成功为止... 适合工作目标十分清晰+完全可自行验证的场景
难想象到年底会演化到什么程度...
大胆想象一下，Agents一多，做事太快了，审查不过来呀，那就需要：
- 引入一个慢一点、但能力很强的模型帮着慢慢审查、操作
- 更强的与真实环境交互的能力，去年已经出现了强有力的苗子MCP + Skills，不过似乎因为工具那端的支持还不足，还不够强，但它会随着社区和厂商的跟进，慢慢变强
年底再回来看看..

发布于广西