爱可可-爱生活
26-04-29 20:04 微博认证:AI博主 2025微博新锐新知博主

传统知识库管理文档需要反复切換工具:OCR解析PDF、向量化嵌入、检索匹配、每次查询重新构建上下文,效率低下且知识无法积累。

OpenKB 将文档处理全流程整合,提供开源LLM知识库解决方案,无需向量数据库。

利用LLM自动编译原始文档为结构化wiki,支持长文档树索引、多模态检索、概念交叉链接,知识持续积累而非每次重算。

GitHub:github.com/VectifyAI/OpenKB

主要功能:

- 广格式支持:PDF、Word、PPT、Excel、HTML、图像等多文件类型;
- 长文档处理:PageIndex树索引,无向量精准检索超长PDF(≥20页);
- 原生多模态:理解图表、表格、图像,而非纯文本;
- 编译wiki:自动生成摘要、概念页、跨文档链接,保持同步;
- 查询&聊天:单次问答或多轮交互,支持会话恢复;
- Lint检查:检测矛盾、空白、孤儿页,Watch模式实时更新;
- Obsidian兼容:纯Markdown + [[wikilinks]],图谱浏览知识图谱。

CLI安装:pip install openkb,初始化后直接添加文档运行,支持多LLM(OpenAI/Claude/Gemini)。

#AI工具# #知识管理# #LLM# #RAG替代#

发布于 北京