OCR+LLM等于纸质文件自动扫描得到markdown！GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型（LLM）增强扫描PDF的Tesseract OCR输出🧐这个项目结合了光学字符识别（OCR）和大型语言模型（LLM），通过LLM的纠错功能，大大提升了OCR文本的准确性和可读性，适用于处理扫描的PDF文件。

OCR+LLM等于纸质文件自动扫描得到markdown！

GitHub - Dicklesworthstone/llm_aided_ocr: 使用大型语言模型（LLM）增强扫描PDF的Tesseract OCR输出
🧐这个项目结合了光学字符识别（OCR）和大型语言模型（LLM），通过LLM的纠错功能，大大提升了OCR文本的准确性和可读性，适用于处理扫描的PDF文件。
➡️链接：http://t.cn/A681GEU0
✨重点
●🔍 项目使用Tesseract进行OCR处理，并通过LLM对输出的文本进行错误修正，确保文本的准确性和格式一致性。
●🛠️ 支持本地和云端的LLM（如OpenAI和Anthropic），并提供异步处理以提高性能。
●📄 最终输出包括LLM修正后的Markdown格式文本，并提供详细的日志记录和质量评估功能，方便跟踪和调试。

⬆️精选自每周更新的知识星球：AI 白日梦想家（[抱一抱]向我提问/AI信息查找/72小时退款），加入见置顶帖：http://t.cn/A6jz8QLy（WX 扫图9享优惠），感谢打赏 [爱你]

发布于广西