飞浆轻量级OCR更新: PP-OCRv6开源
大模型搞OCR虽然猛,拿去做批量数据清洗还是太烧显存了。
飞桨刚更新的PP-OCRv6就是专门干这脏活的。
参数量从1.5M 7.7M 34.5M三个版本,小到能直接塞浏览器或者边缘单片机上跑。叠上OpenVINO优化之后,纯CPU跑推理速度直接拉高5.2倍,根本不用额外配GPU。
统一支持50种语言,顺便把PCB板、CAD图纸、点阵文本这些多模态大模型容易翻车的场景给优化了。
说白了,纯文本提取这种活,几兆大小的专有模型比几百亿的VLM靠谱得多。
体验: paddleocr.com
HF: huggingface.co/collections/PaddlePaddle/pp-ocrv6
#PaddlePaddle #OCR #端侧模型 #机器视觉 #数据清洗
发布于 四川
