karminski-牙医 26-04-10 06:13
微博认证:AI博主

各位老铁在使用 AI 的过程中为了省 Token 试过这样的用法吗? 先用性能比较强的模型制作 Plan, 然后用 Token 比较便宜的模型执行 Plan 来写代码?

Anthropic 刚又把这个方法更进了一步, 直接让 claude-sonnet(性价比模型)执行, 无论是写代码还是使用 SKILL 都是这些模型自己执行的, 然后当这些模型自己拿不定主意的时候, 会咨询顾问模型 claude-opus(贵的模型).

这个时候 claude-opus 会访问共享上下文(一定注意这个概念), 然后给到指导意见, 让性价比模型继续干活. Anthropic 管这个叫 Advisor tool (顾问工具).

所以看到区别了吗? 这完全相当于一个反模式, 让性价比模型全面接管任务, 只有在需要咨询的时候才咨询性能更强的模型, 而性能更强的模型也只做指导, 是不会去调用工具或者执行任何 SKILL 的(它可以指挥性价比模型做, 这样更经济).

这样做更像现在专业的程序员使用AI的方式, 贵的模型在模拟人类程序员的行为, 在必要的时候给出关键决策.

这么搞效果咋样? Anthropic 自己测试的结果是, opus 充当顾问, sonnet-4.6 做具体执行, 在 terminal-bench 2.0 中分数从只用 sonnet-4.6 的 59.6 分提升到了 63.4 分, 并且每项任务的执行成本还从 0.94 刀下降到了 0.88 刀!

为啥会更省钱? 我个人推测估计是节省了模型在面对复杂问题时候的探索和试错成本, 以及 advisor 模型的输出被限制了(只需要做关键指导, 不会事无巨细), 所以综合成本反而更低了.

他们弄的使用方式是在API请求中直接带上 "tools": [{"type": "advisor_20260301","name": "advisor","model": "claude-opus-4-6"}], 这样就行了, 所以从实现上看, 这也是个 tool call.

各位正在本地用龙虾的可以考虑按照这个思路拆个新的 skill 了, 直接做一个 advisor skill 来节省本地龙虾的 Token 消耗

#HOW I AI##anthropic##AdvisorStrategy##claude#

发布于 日本