来看一个超强的表格转 Markdown 模型——Nanonets-OCR-s
这个模型可以把图片中的表格转换为 Markdown,效果如图。这个模型可以正确识别 LaTeX 语法, 并且能抽取内嵌的图片位置转换为 标签供后续替换, 签名也一样会转换为
亮点是这个模型只有 3.75B (这个模型其实是基于 Qwen2.5-VL-3B-Instruct 微调的)
由于是基于Qwen的,所以中文支持应该不是问题,感兴趣的同学可以试试了。
模型地址:huggingface.co/nanonets/Nanonets-OCR-s
#ai创造营##AI生活指南#
发布于 日本
