智谱刚刚又炸出来款OCR:GLM-OCR,PDF每秒1.86页,1元能跑2000张A4扫描图片,0.9B,可边缘部署
擅长手写体、复杂表格、代码文档、印章、多语言混排
在OmniDocBench V1.5上94.6分登顶
处理PDF文档的吞吐量1.86页/秒,图片0.67张/秒
成本上,1块钱可以处理约2000张A4大小扫描图片,或者200份10页简单排版PDF,是传统OCR方案的1/10
支持vLLM、SGLang和Ollama部署,降低推理延迟与算力开销,适合高并发与边缘部署
Github:http://t.cn/AX5wA2Ul
HF:http://t.cn/AX5wA2Uj
#OCR##GLMOCR#
发布于 北京
