挨踢牛魔王
25-10-05 17:39 微博认证:科技博主

MinerU2.5出了一个1.2B的解析模型,模型不大,效果还不错。

主要特点:
全面、精细的布局分析:它不仅保留页眉、页脚和页码等非正文元素以确保完整的内容完整性,而且还采用了精致和标准化的标签模式。这样可以更清晰、更结构化地表示列表、引用和代码块等元素。
公式解析的突破:对复杂、冗长的数学公式进行高质量解析,并准确识别混合语言(中英)方程。
增强表解析的稳健性:轻松处理具有挑战性的情况,包括旋转表、无边框表和部分边框表

模型地址:huggingface.co/opendatalab/MinerU2.5-2509-1.2B

发布于 广东