百度开源OCR全球第一

刚刚，百度开源拿下全球第一！作者疑似DeepSeek出走大神

就在刚刚，百度闷声干了票大的！

最新开源的Unlimited OCR，总参数3B，实际激活仅500M——放在大模型时代几乎是个零头。

但就是这个小到离谱的模型，在OmniDocBench v1.5上拿下93.23%的综合分，v1.6更是达到93.92%，直接刷新了端到端SOTA。

什么概念？v1.5同台竞技的选手里，235B的Qwen3-VL拿了89.15，72B的Qwen2.5-VL拿了87.02，不公布参数量的Gemini-2.5 Pro也只有88.03。激活参数不到它们零头的选手，反手把它们全甩了。

更离谱的是，它还干了件之前没有OCR模型干成过的事：一口气解析40多页文档，不失忆、不降速，一次推理从第一页读到最后一页。

目前，模型和代码都已同步上线GitHub和HuggingFace。

GitHub：

http://t.cn/AXSbAeUt

Hugging Face：

http://t.cn/AXSbAeU5