阿里整理Agent Skill规范

阿里这篇「Agent Skill规范、构建与设计模式」归纳得挺好！

现在 Claude Code、Cursor、Codex 这些 AI 编程助手都支持 Skill 扩展机制，但大多数人还停留在"写几行 Prompt 调一下"的阶段。阿里技术团队最近整理了一篇系统性文章，把 Skill 规范、构建方法论、设计模式讲得很清楚，整理了核心点。

1. Skill 的底层结构
Anthropic 在 2025 年 12 月发布了 Agent Skill 开放规范，目前已被 33+ 个 Agent 产品采纳。一个 Skill 的最小形态就是一个 SKILL.md 文件，YAML 元数据 + Markdown 指令。
最核心的设计是三层渐进式加载：
1）L1 目录层：会话启动时只加载 name + description，每个 Skill 约 50-100 tokens
2）L2 指令层：Skill 被激活时才加载完整指令，建议控制在 5000 tokens 以内
3）L3 资源层：指令中引用到时按需加载外部文件
本质上是：即使装了 20 个 Skill，初始上下文开销也只有 1000-2000 tokens，比单体式 Prompt 减少约 90%。

2. Description 的写法比指令正文更重要
Skill 的触发完全依赖 description 字段，由模型自主判断是否匹配——不是关键词硬编码。description 绝不能总结 Skill 的工作流程，只能描述触发条件。原因是测试发现，一旦 description 里写了工作流摘要，模型会直接按 description 执行，跳过读完整 Skill 正文。
写法原则：用"Use when..."句式，覆盖用户可能的各种表述，包含关键触发词。

3. Anthropic 官方的 Skill-Creator
Skill-Creator 是"用来创建 Skill 的 Skill"，设计理念是：像做机器学习一样做 Prompt Engineering——有训练集、测试集、评估指标、迭代优化循环、防过拟合机制。
三个核心原则：
1）泛化而非过拟合——Skill 会被用在无数种场景，不要只针对测试用例优化
2）解释"为什么"而非堆砌"必须"——今天的 LLM 有心智理论，理解原因比执行命令更有效
3）提取重复模式——如果多个测试用例里模型都独立写了相似脚本，应该直接放进 scripts/ 目录

4. 五种 Skill 设计模式（来自 Google ADK 团队）
1）Tool Wrapper：按需加载特定领域知识，适合封装技术栈规范
2）Generator：模板 + 风格指南强制输出一致性，缺信息主动提问
3）Reviewer：把"查什么"和"怎么查"分离，审查清单独立维护
4）Inversion：翻转交互模式，Agent 先采访用户再动手，适合需求不明确的场景
5）Pipeline：带强制检查点的多步工作流，Agent 不能跳步，用户不点头不能继续

访问：mp.weixin.qq.com/s/LCpiLyLnRn5WyuHpribyHw

#HOW I AI##程序员#

发布于北京