字节在依靠自家短视频数据量大,各种民间运镜数据丰富的雄厚资本下搞出了 Seedance 2.0。那么还有谁家天生背后就有类似的数据能搞出对应的模型呢。
具有庞大文字类图像数据的小红书,开源了 FireRed-OCR 模型,以 2B 参数登顶文档解析榜单。在权威文档解析基准 OmniDocBench v1.5 上拿下端到端方案第一,综合得分 92.94%,超越 Gemini 3.0 Pro、DeepSeek-OCR 2 和 Qwen3-VL-235B。
Model: http://t.cn/AXc3bgbQ
Demo: http://t.cn/AXc3bgbH
GitHub: http://t.cn/AXc3bsDT
发布于 上海
