如果你只是跟豆包千问这些AI软件聊聊天,并不清楚Claude Code和OpenClaw是什么,那么推荐阅读这条微博,它可以帮助你更好的使用AI。
先从Chat(聊天)跟Agent(智能体)的三点区别开始说起:
- 对于聊天来说,用户输入一句话,AI输出的就是这句话的回答,那么这轮聊天就结束了,下一轮聊天,AI会记住之前聊天的历史,接着用户新的输入去回答;但是对于智能体来说,用户输入一句话之后,AI的输出不一定是回答用户,它可能会输出工具调用,再去回答用户,也可能因为有不确定的决策,反向要求用户新的输入,那么从功能角度来说,智能体不会**始终以有限轮数的输出作为用户输入的结束,而是以任务的完成作为结束**,这叫做`loop`。
- 刚才说到了工具调用,工具调用的目的只有两种,读或者写,AI通过工具调用,可以把**自己无法触及到的事物,提取出对自己有用的信息**,也就是说,这里存在两步,一步是AI触及不到的东西,可以通过AI的运行环境中提供的能力转换成数据,另一步是触及到的数据可能是AI无法理解的,可能对于AI来说数据量太大,远超过了1M的上下文窗口(可以理解成AI跟你聊天最多只能记下这么多东西),那么AI的运行环境就要把它转换成AI可以理解的有限信息,例如AI看一个网页,可能只是提取网页上的文字,而不是JavaScript代码,AI如果没有视觉能力,可能是通过调用OCR工具来把图片上的文字和简单物体识别出来,这叫做`skill`。
- 我们前面两点说到了AI可以根据用户单次的输入进行多轮的输入输出从而完成任务,也提到了AI可以利用工具读取到更丰富的信息,那么第三点就是提示词了,你可以把用户的输入也当作一种提示词,因此对于智能体来说,或者如果你想把现在的AI聊天软件像智能体一样使用,在提示词中相比输入给AI它可以获得到的信息或者它可能已经具有的知识,应该告诉它的是AI对于完成你的任务,所了解不到的完整背景上下文,例如你让它处理一个文档,应该告诉AI的是**你在一家什么样的公司工作,你是什么职位,你为什么要写这个文档,这个文档要给谁看**,而不是说这个文档要写中文,文档的用词要书面化,要使用什么专业知识,然后把专业知识复制粘贴给AI。**把AI当作刚入职但是经验丰富的员工,而不是可以理解自然语言的自动化机器**,对于20B以上参数的模型来说,无论是写系统提示词还是给AI作为聊天的输入,都应该如此,这叫做`harness`。
上面是对提升使用豆包这种AI聊天软件的用户有帮助的,下面聊点别的:
以Claude Code为代表的AI编程框架基于上面三点,搭建了编程的harness工程,但是现在除了编程以外的智能体不好用的原因在于,它们像Manus一样,不是基于上面三点去做让用户办公生活使用的智能体,而是基于Claude Code的工程化思路去做,这导致的就是你但凡让它干点什么,都会以编程的方式去浪费Token。
这也是为什么看起来只有AI编程应用有巨大市场的原因,世界上程序员就这么点人,你用Claude Code的方式去给普通用户做智能体,根据这种Token使用量定价,会有人用吗?许多智能体可能对一个用户来说每个月是需要十几二十块钱,但用户基数是巨大的,我不是说要用便宜的模型,而是应该不要干什么都通过一堆python脚本的工具调用给用户搓个网页或者文档出来,通过设计合理的harness工程,理解用户真正的任务,这是现在很多AI产品都没有考虑清楚的。
发布于 陕西
