AI技术栈架构类比计算机系统

“大模型就像处理器：需要巨大投资，潜力无限，但单独用处有限。
Agent运行时就像操作系统：协调模型周围的进程、资源和数据，让模型更有价值。
Skills就像应用程序：真正创造价值的地方。”

这一观点将AI技术栈类比为传统计算机架构（处理器、操作系统、应用程序），不仅是一个形象的比喻，更揭示了AI开发方向的重大战略转移。

1. 模型 (Model) = 处理器 (Processor)

在计算机架构中，CPU提供原始的算力；在AI架构中，模型（如Claude 3.5 Sonnet, GPT-4）提供原始的智力。

- 极高的通用性与门槛：就像全球只有少数几家公司能制造高端芯片（Intel, AMD, Apple），只有极少数公司能训练前沿的基础大模型。这是一项资本密集型、技术密集型的基础设施建设。
- 潜力巨大但不可控：模型本身就像演讲中提到的“智商300的天才Mahesh”。它拥有从第一性原理推导万物的能力，算力（智力）惊人。
- 局限性：光有一颗强大的CPU放在桌子上是无法工作的。同样，模型如果缺乏上下文和具体约束，虽然能解决问题，但过程不可控，每次都要从头推导，结果不稳定，无法直接在垂直场景中产生稳定价值。

2. Agent 运行时 (Runtime) = 操作系统 (OS)

操作系统负责管理资源、进程和输入输出；Agent运行时则是协调模型与数字世界交互的通用平台。

- 通用接口：Anthropic发现，底层的Agent架构其实是高度通用的。就像Windows或macOS可以运行在不同的电脑上一样，Agent运行时为模型提供了标准化的环境。
- 资源调度：操作系统管理内存和硬盘，Agent运行时则管理代码执行环境、API调用权限和文件系统。演讲中提到的代码（Code）就是通往数字世界的通用接口。无论是生成财报还是处理反馈，本质上都是通过代码这一“系统指令”来调用底层资源。
- 连接层（MCP）：类似于操作系统通过驱动程序连接硬件，Agent运行时通过MCP（Model Context Protocol）连接外部数据库和工具。它提供了“连接”的能力，但还没提供“如何使用”的知识。

3. Skills = 应用程序 (App)

应用程序是用户真正使用的工具，解决了具体问题；Skills则是封装了专业知识的“业务逻辑包”。

- 专业知识的载体：Skills就像演讲中的“税务专家Barry”。它不依赖模型从头推导，而是提供了一套经过验证的“工作手册”。
- 定义的简单性：Skills的本质就是“文件夹”。它包含了指令（Prompt）、脚本（Code）和资源文件（Template/Reference）。它不需要复杂的架构设计，就像写一个Markdown文件一样简单。
- 差异化与价值核心：
- 生态规模：做CPU（模型）和OS（运行时）的公司屈指可数，但开发App（Skills）的人可以有千千万万。
- 场景落地：就像Excel处理表格、Photoshop处理图片一样，Skills让通用的AI算力聚焦于特定任务。例如“品牌合规Skill”确保文案风格统一，“财报分析Skill”确保数据处理流程标准。
- 可复用与可迁移：Skills如同软件安装包，可以被版本管理（Git）、分享（Google Drive）和分发。它是固化下来的最佳实践。

总结：从“造轮子”到“写应用”的范式转移

这个类比的核心启示在于纠正了当前AI开发的误区：

1. 分工明确：不要试图去重新发明“处理器”（训练基座模型）或“操作系统”（构建复杂的通用Agent架构）。这些是基础设施，应该由大厂来做。
2. 价值下沉：真正的机会在于“应用程序层”（Skills）。企业和个人应该专注于将自身的领域知识（Domain Knowledge）——即SOP、品牌规范、业务流程——打包成Skills。
3. 确定性交付：通过将“高智商模型”（处理器）与“专业知识包”（应用程序）结合，我们不仅利用了AI的推理能力，还通过Skills约束了其行为，实现了从“每次随机生成的不可控结果”到“稳定、专业的专家级交付”的转变。

参考：mp.weixin.qq.com/s/AIIZiW4tmeWD8SNxXBAemw

发布于北京