Meta、耶鲁大学、斯坦福大学、Google DeepMind 和微软的顶尖研究人员在一篇长达 264 页的论文中,系统总结了目前对智能体(Agents)的全部认知。
以下是他们的一些关键发现:
他们构建了一个智能体各个组件(如感知、记忆、世界建模)与人脑不同区域之间的映射关系,并进行对比:
人脑的能效远高于人工智能系统
智能体没有真正的“体验”或主观意识
人脑是持续学习的,而智能体通常是静态的(训练完就固定不变)
一个智能体可以被拆分为以下几个部分:
感知(Perception):智能体的输入机制。可以通过多模态输入、人类纠错等反馈机制来提升感知能力。
认知(Cognition):包括学习、推理、规划和记忆等核心功能。大语言模型(LLMs)在这一部分发挥着关键作用。
行动(Action):指智能体的输出能力以及使用工具的能力。
智能体的记忆可以表示为:
感官记忆:即对输入信息的瞬时或短暂保留,在当前的智能体系统中并不被特别强调。
短期记忆:对应大语言模型的上下文窗口(context window),用于处理当前任务中的信息。
长期记忆:指外部存储系统,如基于检索的增强生成(RAG)或知识图谱,用于保存和调用长期知识。
智能体的记忆系统可以从以下几个方面进行改进和研究:
增加存储信息的容量
如何检索出最相关的信息
将上下文窗口内的记忆与外部记忆相结合
决定应该遗忘或更新哪些记忆内容
更多内容论文链接:http://t.cn/A6ric4Jh
