群星_寒光 26-02-03 10:14

智谱刚刚又炸出来款OCR:GLM-OCR,PDF每秒1.86页,1元能跑2000张A4扫描图片,0.9B,可边缘部署

擅长手写体、复杂表格、代码文档、印章、多语言混排
在OmniDocBench V1.5上94.6分登顶

处理PDF文档的吞吐量1.86页/秒,图片0.67张/秒

成本上,1块钱可以处理约2000张A4大小扫描图片,或者200份10页简单排版PDF,是传统OCR方案的1/10

支持vLLM、SGLang和Ollama部署,降低推理延迟与算力开销,适合高并发与边缘部署

Github:http://t.cn/AX5wA2Ul
HF:http://t.cn/AX5wA2Uj

#OCR##GLMOCR#

发布于 北京