#OCR##开源模型##PaddleOCR##多语言#【百度PP-OCRv6发布于Hugging Face：1.5M起的小模型覆盖50种语言】百度PaddleOCR团队近日将PP-OCRv6正式上架Hugging Face，提供tiny（1.5M参数）、small（7.7M）和medium（34.5M）三档模型。其中small与medium版本支持包括中英日及46种拉丁语系在内的50种语言。

#OCR##开源模型##PaddleOCR##多语言#

【百度PP-OCRv6发布于Hugging Face：1.5M起的小模型覆盖50种语言】

百度PaddleOCR团队近日将PP-OCRv6正式上架Hugging Face，提供tiny（1.5M参数）、small（7.7M）和medium（34.5M）三档模型。其中small与medium版本支持包括中英日及46种拉丁语系在内的50种语言。据官方基准测试，medium版本在检测端Hmean达86.2%，识别准确率83.2%，较PP-OCRv5分别提升4.6和5.1个百分点。模型采用PPLCNetV4统一骨干网络，支持PaddleOCR、Transformers及ONNX Runtime等多后端部署。

OCR赛道在大模型热潮中容易被忽视，但PP-OCRv6的方向值得关注——1.5M参数级别的模型意味着在嵌入式设备上即可部署，34.5M就能覆盖多语种场景。对于企业文档数字化、票据识别、边缘端翻译等B端需求来说，这种"轻量化+多语言"的组合会实质性降低部署门槛。

发布于北京