#RAG技术栈最全拆解##一图总结RAG技术栈#RAG（Retrieval-Augmented Generation）进化出了一个更智能、更自动化的新形态：Agentic RAG。下面这张图，完整拆解了Agentic RAG的技术栈，看懂这8层，就理解了现代RAG系统是怎么跑起来的。- Level 0：部署基础设施包括AWS、groq、Modal等，负责模型运

#RAG技术栈最全拆解##一图总结RAG技术栈#

RAG（Retrieval-Augmented Generation）进化出了一个更智能、更自动化的新形态：Agentic RAG。下面这张图，完整拆解了Agentic RAG的技术栈，看懂这8层，就理解了现代RAG系统是怎么跑起来的。

- Level 0：部署基础设施
包括AWS、groq、Modal等，负责模型运行的底座。没有它们，大模型跑不动。

- Level 2：基础大模型
Claude、Gemini、GPT-4都在这里，是回答问题的“大脑”。

- Level 3：流程编排框架
LangChain、LlamaIndex用来安排大模型的“动线”，像是大脑的指挥系统，告诉模型什么时候该调用搜索、什么时候该总结。

- Level 4&5：向量数据库+Embedding模型
有Milvus、Chroma、Cohere这些，把文本转成向量存起来，然后再快速查出来，是RAG“记忆力”的核心。

- Level 6：数据抓取与处理
BeautifulSoup、Scrapy、Tika这些能自动抓网页、清洗数据，把信息输送给模型。

- Level 7：记忆与上下文管理
像LangChain、Zep会记住你之前说过什么，保证多轮对话不会“断片”。

- Level 8：安全与治理
最顶层是保障安全与质量的部分，比如Guardrails AI、Helicone会帮你监控模型输出，别说错话、跑偏。

这张图展示了整个Agentic RAG生态正如何发展——从部署、抓取、理解、记忆、回答、再到安全闭环，像极了一台能自主运作的AI机器。