实验室那点事 25-07-26 10:14

最新公开实验表:LightRAG 在 Legal 领域把 NaiveRAG 的综合指标从 15.2% 拉到 84.8%,图里一目了然。

整套代码已放 GitHub,pip install lightrag-hku[api] 就能跑,不用再搭积木。

核心亮点分三块:

• 双索引:实体-关系图 + 向量库并行,local/global/hybrid/mix 四种检索模式一键切换

• 低门槛:7 行代码完成文档插入、查询、可视化,支持 OpenAI、Ollama、HF、LlamaIndex、LiteLLM 任意底座

• 全链路:Token 追踪、增量插入、实体合并、文档级删除、Neo4j/PostgreSQL/Faiss 多后端,一条龙解决

技术细节

• 默认 NetworkX 图库,可换 Neo4j 或 Memgraph;向量端 NanoVectorDB 也能切到 Qdrant、Milvus

• 32k 上下文 LLM 即可跑通,embedding 用 bge-m3 或 text-embedding-3-large,reranker 可选 bge-reranker-v2-m3

• 对话历史、用户 prompt、token 预算全部暴露接口,二次开发零阻碍

仓库:http://t.cn/A6E3lAPP

#RAG新范式##知识图谱##开源项目##大模型实战##HKUDS#

发布于 天津