梁赛 26-02-03 09:02
微博认证:AI博主

刚刚,智谱正式发布并开源GLM-OCR,以“小尺寸、高精度”实现文档解析能力新标杆。作为一款轻量的专业级OCR模型,其核心亮点如下:

性能SOTA:以94.6分登顶OmniDocBench V1.5,并在公式识别、表格识别、信息抽取的多项主流基准中均取得SOTA表现;

场景优化:专攻真实业务痛点,在手写体、复杂表格、代码文档及印章等高难场景中表现稳健;

推理高效:仅0.9B参数规模,支持vLLM、SGLang和Ollama部署,显著降低推理延迟与算力开销,适合高并发与边缘部署;

开源易用:同步开源完整SDK与推理工具链,环境依赖简单,支持一行命令快速调用,轻松接入现有业务系统。

发布于 广东