#OCR##开源模型##PaddleOCR##多语言#
【百度PP-OCRv6发布于Hugging Face:1.5M起的小模型覆盖50种语言】
百度PaddleOCR团队近日将PP-OCRv6正式上架Hugging Face,提供tiny(1.5M参数)、small(7.7M)和medium(34.5M)三档模型。其中small与medium版本支持包括中英日及46种拉丁语系在内的50种语言。据官方基准测试,medium版本在检测端Hmean达86.2%,识别准确率83.2%,较PP-OCRv5分别提升4.6和5.1个百分点。模型采用PPLCNetV4统一骨干网络,支持PaddleOCR、Transformers及ONNX Runtime等多后端部署。
OCR赛道在大模型热潮中容易被忽视,但PP-OCRv6的方向值得关注——1.5M参数级别的模型意味着在嵌入式设备上即可部署,34.5M就能覆盖多语种场景。对于企业文档数字化、票据识别、边缘端翻译等B端需求来说,这种"轻量化+多语言"的组合会实质性降低部署门槛。
发布于 北京
