karminski-牙医 25-06-13 10:39
微博认证:AI博主

来看一个超强的表格转 Markdown 模型——Nanonets-OCR-s

这个模型可以把图片中的表格转换为 Markdown,效果如图。这个模型可以正确识别 LaTeX 语法, 并且能抽取内嵌的图片位置转换为 标签供后续替换, 签名也一样会转换为 标签. 复选框等 symbol 则会转换为颜文字 ☑。并且合并单元格的表格也会转换为 html 输出。

亮点是这个模型只有 3.75B (这个模型其实是基于 Qwen2.5-VL-3B-Instruct 微调的)

由于是基于Qwen的,所以中文支持应该不是问题,感兴趣的同学可以试试了。

模型地址:huggingface.co/nanonets/Nanonets-OCR-s

#ai创造营##AI生活指南#

发布于 日本