在本地整理扫描件和电子文档时,文件一多就容易失控,靠文件夹命名很难长期维持清晰结构。Docspell是一个偏向个人和小团队使用的文档管理项目,围绕自动归档、元数据提取和全文检索来设计,让文档存放更有秩序。
项目地址:github.com/eikek/docspell
主要功能
1.支持从扫描仪或文件夹导入PDF和图片文档;
2.自动进行OCR识别,生成可搜索文本;
3.通过规则对文档进行自动分类和标签标注;
4.提供全文搜索,快速定位历史资料;
5.支持自托管部署,数据完全掌握在本地;
Docspell关注的是长期文档积累后的可查找性,把杂乱文件转化为结构化资料库,适合需要管理账单、合同或学习资料的用户。
发布于 四川
