AIGCLINK 26-03-05 16:46
微博认证:AI博主

Anthropic给自己的官方Skill构建工具“Skill-creator”做了大升级,增加了写评估、并行测试+A/B对比、触发时机优化功能

之前的Skill-creator只管构建skill,升级后的Skill-creator解决了模型更新技能还能不能用、修改调整后效果是好是坏、基础模型变强后技能是否还适用的问题

这个升级对非技术人员比较友好,像HR、财务、运营不用写代码、搭测试环境、看日志的情况下也能测试、衡量以及优化自己的Agent Skill

只需设定测试提示词和预期结果,skill-creator就会验证该skill是否达到标准

这可以帮助捕捉“技能倒退”情况(比如模型更新后技能突然不好用了),并且追踪通过率、耗时以及Token使用量

支持启动多个独立智能体并行运行测试,速度更快且互不干扰,同时新增了对比智能体,可以进行A/B测试

并且优化了触发时机,因为技能只有在正确的时候被触发才最有效和价值,它会分析你的技能描述和样本提示词,提供修改建议,来减少误触发或漏触发

Anthropic测试了6个文档创建的技能,其中5个技能的触发效果得到了改善

最新skill-creator已在Claude.ai和Cowork中可用,只需向Claude提出使用skill-creator即可开始,也可作为Claude Code的插件使用或直接从仓库下载

详情:http://t.cn/AXV7AEUO
插件:http://t.cn/AXV7AEU0
仓库:http://t.cn/AXGZiVap

#AIagentskill##aiskill##Claudeskill# http://t.cn/AXV7AmKW

发布于 山西