写了一周多,机器7我3[旺柴],现在开源了,7层智能记忆系统:基于Context Engineering的AI 分层记忆实现
现在agent基本都上下文局限性和乱装载:单次对话的记忆容量有限,跨会话无法保持状态连续性,缺乏个性化感知能力。这些问题本质上是PE领域尚未解决的。
系统架构设计
这个项目提出了一个基于多层记忆融合的Context Engineering解决方案,核心包含7个互补的记忆子系统:
短期记忆层(STM): 采用Redis实现的会话级记忆缓存,存储精炼的对话摘要而非原始消息,TTL机制自动管理容量
工作记忆层(WM): 基于任务状态的中间计算存储,支持复杂推理过程的状态维护
长期偏好记忆(LTM): SQLite关系数据库存储用户个性化配置,支持结构化查询与更新
向量记忆系统: Faiss索引+元数据管理的语义检索引擎,实现情节记忆和语义知识的统一存储
知识图谱层: Neo4j图数据库构建的实体关系网络,支持复杂关系推理
程序化记忆: 文件系统级别的动态技能加载机制,支持45+种专业技能的运行时调用
会话工作区: 当前轮次的完整推理链路,容量限制20条消息,负责协调调度所有记忆子系统
用上Context Engineering 的核心创新点是这样,动态上下文构建策略: 会话工作区作为Context Engineering的控制中心,根据用户输入动态调度相关记忆类型。系统维护15轮单一会话调度信息提供时序连续性,只这15轮任意记忆模块都有可能被调度,然后finnal结果被整合进短期记忆点redis里 结合20条短期记忆同/跨会话的推理过程保证深度分析能力和时间层面的延续性和一定因果性
3级智能过滤算法: Level 1正则表达式快速筛选(90%低价值内容),Level 2基于LLM的轻量语义分析(8%中等价值),Level 3深度上下文价值评估(2%高价值内容)。该机制确保了Context质量的同时优化了计算效率,保证任何有用的绘画信息都能进到合适的memory中被存储,及以后的调用
记忆类型自适应融合: 会话工作区可根据任务复杂度动态调用不同记忆子系统。例如项目管理场景下同时检索LTM偏好配置、向量记忆中的历史项目数据、知识图谱中的团队关系,以及程序化记忆中的专业分析工具,真正做到了context根据情景需要自动装载。
核心组件包括FastAPI,Redis缓存层、Neo4j图计算引擎、Faiss向量检索服务。通过gpt4.1 API实现装载理解与生成,而且特意强化了human in loop,都是开源的大家可以随便改,找出符合你性能的组件来替代
项目已在GitHub开源(github.com/hellangleZ/Agent-MemoryForge),提供完整的部署文档、配置模板
未来工作
目前以demo形式先开源,计划扩展支持多模态记忆融合、认证系统,多租户,记忆压缩算法优化、以及跨Agent的Context engineering标准化的可能性。
