爱可可-爱生活 25-12-12 14:33
微博认证:AI博主 2025微博新锐新知博主

“大模型就像处理器:需要巨大投资,潜力无限,但单独用处有限。
Agent运行时就像操作系统:协调模型周围的进程、资源和数据,让模型更有价值。
Skills就像应用程序:真正创造价值的地方。”

这一观点将AI技术栈类比为传统计算机架构(处理器、操作系统、应用程序),不仅是一个形象的比喻,更揭示了AI开发方向的重大战略转移。

1. 模型 (Model) = 处理器 (Processor)

在计算机架构中,CPU提供原始的算力;在AI架构中,模型(如Claude 3.5 Sonnet, GPT-4)提供原始的智力。

- 极高的通用性与门槛:就像全球只有少数几家公司能制造高端芯片(Intel, AMD, Apple),只有极少数公司能训练前沿的基础大模型。这是一项资本密集型、技术密集型的基础设施建设。
- 潜力巨大但不可控:模型本身就像演讲中提到的“智商300的天才Mahesh”。它拥有从第一性原理推导万物的能力,算力(智力)惊人。
- 局限性:光有一颗强大的CPU放在桌子上是无法工作的。同样,模型如果缺乏上下文和具体约束,虽然能解决问题,但过程不可控,每次都要从头推导,结果不稳定,无法直接在垂直场景中产生稳定价值。

2. Agent 运行时 (Runtime) = 操作系统 (OS)

操作系统负责管理资源、进程和输入输出;Agent运行时则是协调模型与数字世界交互的通用平台。

- 通用接口:Anthropic发现,底层的Agent架构其实是高度通用的。就像Windows或macOS可以运行在不同的电脑上一样,Agent运行时为模型提供了标准化的环境。
- 资源调度:操作系统管理内存和硬盘,Agent运行时则管理代码执行环境、API调用权限和文件系统。演讲中提到的代码(Code)就是通往数字世界的通用接口。无论是生成财报还是处理反馈,本质上都是通过代码这一“系统指令”来调用底层资源。
- 连接层(MCP):类似于操作系统通过驱动程序连接硬件,Agent运行时通过MCP(Model Context Protocol)连接外部数据库和工具。它提供了“连接”的能力,但还没提供“如何使用”的知识。

3. Skills = 应用程序 (App)

应用程序是用户真正使用的工具,解决了具体问题;Skills则是封装了专业知识的“业务逻辑包”。

- 专业知识的载体:Skills就像演讲中的“税务专家Barry”。它不依赖模型从头推导,而是提供了一套经过验证的“工作手册”。
- 定义的简单性:Skills的本质就是“文件夹”。它包含了指令(Prompt)、脚本(Code)和资源文件(Template/Reference)。它不需要复杂的架构设计,就像写一个Markdown文件一样简单。
- 差异化与价值核心:
- 生态规模:做CPU(模型)和OS(运行时)的公司屈指可数,但开发App(Skills)的人可以有千千万万。
- 场景落地:就像Excel处理表格、Photoshop处理图片一样,Skills让通用的AI算力聚焦于特定任务。例如“品牌合规Skill”确保文案风格统一,“财报分析Skill”确保数据处理流程标准。
- 可复用与可迁移:Skills如同软件安装包,可以被版本管理(Git)、分享(Google Drive)和分发。它是固化下来的最佳实践。

总结:从“造轮子”到“写应用”的范式转移

这个类比的核心启示在于纠正了当前AI开发的误区:

1. 分工明确:不要试图去重新发明“处理器”(训练基座模型)或“操作系统”(构建复杂的通用Agent架构)。这些是基础设施,应该由大厂来做。
2. 价值下沉:真正的机会在于“应用程序层”(Skills)。企业和个人应该专注于将自身的领域知识(Domain Knowledge)——即SOP、品牌规范、业务流程——打包成Skills。
3. 确定性交付:通过将“高智商模型”(处理器)与“专业知识包”(应用程序)结合,我们不仅利用了AI的推理能力,还通过Skills约束了其行为,实现了从“每次随机生成的不可控结果”到“稳定、专业的专家级交付”的转变。

参考:mp.weixin.qq.com/s/AIIZiW4tmeWD8SNxXBAemw

发布于 北京