新智元
26-06-22 19:49 微博认证:新智元官方微博

刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神

就在刚刚,百度闷声干了票大的!

最新开源的Unlimited OCR,总参数3B,实际激活仅500M——放在大模型时代几乎是个零头。

但就是这个小到离谱的模型,在OmniDocBench v1.5上拿下93.23%的综合分,v1.6更是达到93.92%,直接刷新了端到端SOTA。

什么概念?v1.5同台竞技的选手里,235B的Qwen3-VL拿了89.15,72B的Qwen2.5-VL拿了87.02,不公布参数量的Gemini-2.5 Pro也只有88.03。激活参数不到它们零头的选手,反手把它们全甩了。

更离谱的是,它还干了件之前没有OCR模型干成过的事:一口气解析40多页文档,不失忆、不降速,一次推理从第一页读到最后一页。

目前,模型和代码都已同步上线GitHub和HuggingFace。

GitHub:

http://t.cn/AXSbAeUt

Hugging Face:

http://t.cn/AXSbAeU5