黄建同学
26-05-24 11:03 微博认证:AI博主

阿里这篇 「Agent Skill规范、构建与设计模式」归纳得挺好!

现在 Claude Code、Cursor、Codex 这些 AI 编程助手都支持 Skill 扩展机制,但大多数人还停留在"写几行 Prompt 调一下"的阶段。阿里技术团队最近整理了一篇系统性文章,把 Skill 规范、构建方法论、设计模式讲得很清楚,整理了核心点。

1. Skill 的底层结构
Anthropic 在 2025 年 12 月发布了 Agent Skill 开放规范,目前已被 33+ 个 Agent 产品采纳。一个 Skill 的最小形态就是一个 SKILL.md 文件,YAML 元数据 + Markdown 指令。
最核心的设计是三层渐进式加载:
1)L1 目录层:会话启动时只加载 name + description,每个 Skill 约 50-100 tokens
2)L2 指令层:Skill 被激活时才加载完整指令,建议控制在 5000 tokens 以内
3)L3 资源层:指令中引用到时按需加载外部文件
本质上是:即使装了 20 个 Skill,初始上下文开销也只有 1000-2000 tokens,比单体式 Prompt 减少约 90%。

2. Description 的写法比指令正文更重要
Skill 的触发完全依赖 description 字段,由模型自主判断是否匹配——不是关键词硬编码。description 绝不能总结 Skill 的工作流程,只能描述触发条件。原因是测试发现,一旦 description 里写了工作流摘要,模型会直接按 description 执行,跳过读完整 Skill 正文。
写法原则:用"Use when..."句式,覆盖用户可能的各种表述,包含关键触发词。

3. Anthropic 官方的 Skill-Creator
Skill-Creator 是"用来创建 Skill 的 Skill",设计理念是:像做机器学习一样做 Prompt Engineering——有训练集、测试集、评估指标、迭代优化循环、防过拟合机制。
三个核心原则:
1)泛化而非过拟合——Skill 会被用在无数种场景,不要只针对测试用例优化
2)解释"为什么"而非堆砌"必须"——今天的 LLM 有心智理论,理解原因比执行命令更有效
3)提取重复模式——如果多个测试用例里模型都独立写了相似脚本,应该直接放进 scripts/ 目录

4. 五种 Skill 设计模式(来自 Google ADK 团队)
1)Tool Wrapper:按需加载特定领域知识,适合封装技术栈规范
2)Generator:模板 + 风格指南强制输出一致性,缺信息主动提问
3)Reviewer:把"查什么"和"怎么查"分离,审查清单独立维护
4)Inversion:翻转交互模式,Agent 先采访用户再动手,适合需求不明确的场景
5)Pipeline:带强制检查点的多步工作流,Agent 不能跳步,用户不点头不能继续

访问:mp.weixin.qq.com/s/LCpiLyLnRn5WyuHpribyHw

#HOW I AI##程序员#

发布于 北京