AI聊天与智能体区别

如果你只是跟豆包千问这些AI软件聊聊天，并不清楚Claude Code和OpenClaw是什么，那么推荐阅读这条微博，它可以帮助你更好的使用AI。

先从Chat（聊天）跟Agent（智能体）的三点区别开始说起：
- 对于聊天来说，用户输入一句话，AI输出的就是这句话的回答，那么这轮聊天就结束了，下一轮聊天，AI会记住之前聊天的历史，接着用户新的输入去回答；但是对于智能体来说，用户输入一句话之后，AI的输出不一定是回答用户，它可能会输出工具调用，再去回答用户，也可能因为有不确定的决策，反向要求用户新的输入，那么从功能角度来说，智能体不会**始终以有限轮数的输出作为用户输入的结束，而是以任务的完成作为结束**，这叫做`loop`。

- 刚才说到了工具调用，工具调用的目的只有两种，读或者写，AI通过工具调用，可以把**自己无法触及到的事物，提取出对自己有用的信息**，也就是说，这里存在两步，一步是AI触及不到的东西，可以通过AI的运行环境中提供的能力转换成数据，另一步是触及到的数据可能是AI无法理解的，可能对于AI来说数据量太大，远超过了1M的上下文窗口（可以理解成AI跟你聊天最多只能记下这么多东西），那么AI的运行环境就要把它转换成AI可以理解的有限信息，例如AI看一个网页，可能只是提取网页上的文字，而不是JavaScript代码，AI如果没有视觉能力，可能是通过调用OCR工具来把图片上的文字和简单物体识别出来，这叫做`skill`。

- 我们前面两点说到了AI可以根据用户单次的输入进行多轮的输入输出从而完成任务，也提到了AI可以利用工具读取到更丰富的信息，那么第三点就是提示词了，你可以把用户的输入也当作一种提示词，因此对于智能体来说，或者如果你想把现在的AI聊天软件像智能体一样使用，在提示词中相比输入给AI它可以获得到的信息或者它可能已经具有的知识，应该告诉它的是AI对于完成你的任务，所了解不到的完整背景上下文，例如你让它处理一个文档，应该告诉AI的是**你在一家什么样的公司工作，你是什么职位，你为什么要写这个文档，这个文档要给谁看**，而不是说这个文档要写中文，文档的用词要书面化，要使用什么专业知识，然后把专业知识复制粘贴给AI。**把AI当作刚入职但是经验丰富的员工，而不是可以理解自然语言的自动化机器**，对于20B以上参数的模型来说，无论是写系统提示词还是给AI作为聊天的输入，都应该如此，这叫做`harness`。

上面是对提升使用豆包这种AI聊天软件的用户有帮助的，下面聊点别的：

以Claude Code为代表的AI编程框架基于上面三点，搭建了编程的harness工程，但是现在除了编程以外的智能体不好用的原因在于，它们像Manus一样，不是基于上面三点去做让用户办公生活使用的智能体，而是基于Claude Code的工程化思路去做，这导致的就是你但凡让它干点什么，都会以编程的方式去浪费Token。

这也是为什么看起来只有AI编程应用有巨大市场的原因，世界上程序员就这么点人，你用Claude Code的方式去给普通用户做智能体，根据这种Token使用量定价，会有人用吗？许多智能体可能对一个用户来说每个月是需要十几二十块钱，但用户基数是巨大的，我不是说要用便宜的模型，而是应该不要干什么都通过一堆python脚本的工具调用给用户搓个网页或者文档出来，通过设计合理的harness工程，理解用户真正的任务，这是现在很多AI产品都没有考虑清楚的。

发布于陕西