刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神
就在刚刚,百度闷声干了票大的!
最新开源的Unlimited OCR,总参数3B,实际激活仅500M——放在大模型时代几乎是个零头。
但就是这个小到离谱的模型,在OmniDocBench v1.5上拿下93.23%的综合分,v1.6更是达到93.92%,直接刷新了端到端SOTA。
什么概念?v1.5同台竞技的选手里,235B的Qwen3-VL拿了89.15,72B的Qwen2.5-VL拿了87.02,不公布参数量的Gemini-2.5 Pro也只有88.03。激活参数不到它们零头的选手,反手把它们全甩了。
更离谱的是,它还干了件之前没有OCR模型干成过的事:一口气解析40多页文档,不失忆、不降速,一次推理从第一页读到最后一页。
目前,模型和代码都已同步上线GitHub和HuggingFace。
GitHub:
http://t.cn/AXSbAeUt
Hugging Face:
http://t.cn/AXSbAeU5
