量子位
25-10-29 17:08 微博认证:量子位官方微博

#RAG技术栈最全拆解##一图总结RAG技术栈#

RAG(Retrieval-Augmented Generation)进化出了一个更智能、更自动化的新形态:Agentic RAG。下面这张图,完整拆解了Agentic RAG的技术栈,看懂这8层,就理解了现代RAG系统是怎么跑起来的。

- Level 0:部署基础设施
包括AWS、groq、Modal等,负责模型运行的底座。没有它们,大模型跑不动。

- Level 2:基础大模型
Claude、Gemini、GPT-4都在这里,是回答问题的“大脑”。

- Level 3:流程编排框架
LangChain、LlamaIndex用来安排大模型的“动线”,像是大脑的指挥系统,告诉模型什么时候该调用搜索、什么时候该总结。

- Level 4&5:向量数据库+Embedding模型
有Milvus、Chroma、Cohere这些,把文本转成向量存起来,然后再快速查出来,是RAG“记忆力”的核心。

- Level 6:数据抓取与处理
BeautifulSoup、Scrapy、Tika这些能自动抓网页、清洗数据,把信息输送给模型。

- Level 7:记忆与上下文管理
像LangChain、Zep会记住你之前说过什么,保证多轮对话不会“断片”。

- Level 8:安全与治理
最顶层是保障安全与质量的部分,比如Guardrails AI、Helicone会帮你监控模型输出,别说错话、跑偏。

这张图展示了整个Agentic RAG生态正如何发展——从部署、抓取、理解、记忆、回答、再到安全闭环,像极了一台能自主运作的AI机器。