想要提取文档或 PDF 里的文字,上传到在线转换工具总让人心里不踏实。而很多本地工具要么识别率感人,要么格式乱成一团。
偶然在 GitHub 看到local_ai_ocr 这个开源项目,基于 DeepSeek-OCR 模型构建,专门用于 Windows 端的本地离线文字识别。
能够利用 GPU 加速处理图片和 PDF 文档,不仅精准提取文字,还支持直接导出 Markdown 以保留复杂的表格和排版格式。
GitHub:github.com/th1nhhdk/local_ai_ocr
采用完全离线运行机制,数据无需上传云端,下载解压并运行初始化脚本后即可开箱即用,无需复杂的环境配置。
对于非常看重数据隐私,或者需要高精度还原文档格式的朋友,值得下载体验。
发布于 广东
