OCR+LLM等于纸质文件自动扫描得到markdown!
GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型(LLM)增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别(OCR)和大型语言模型(LLM),通过LLM的纠错功能,大大提升了OCR文本的准确性和可读性,适用于处理扫描的PDF文件。
➡️链接:http://t.cn/A681GEU0
✨重点
●🔍 项目使用Tesseract进行OCR处理,并通过LLM对输出的文本进行错误修正,确保文本的准确性和格式一致性。
●🛠️ 支持本地和云端的LLM(如OpenAI和Anthropic),并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本,并提供详细的日志记录和质量评估功能,方便跟踪和调试。
⬆️精选自每周更新的知识星球:AI 白日梦想家([抱一抱]向我提问/AI信息查找/72小时退款),加入见置顶帖:http://t.cn/A6jz8QLy(WX 扫图9享优惠),感谢打赏 [爱你]
发布于 广西
