摇摆时间线ZHLMI
26-03-03 01:49 微博认证:上海慧龙计算机系统有限公司多媒体经理

字节在依靠自家短视频数据量大,各种民间运镜数据丰富的雄厚资本下搞出了 Seedance 2.0。那么还有谁家天生背后就有类似的数据能搞出对应的模型呢。

具有庞大文字类图像数据的小红书,开源了 FireRed-OCR 模型,以 2B 参数登顶文档解析榜单。在权威文档解析基准 OmniDocBench v1.5 上拿下端到端方案第一,综合得分 92.94%,超越 Gemini 3.0 Pro、DeepSeek-OCR 2 和 Qwen3-VL-235B。

Model: http://t.cn/AXc3bgbQ
Demo: http://t.cn/AXc3bgbH
GitHub: http://t.cn/AXc3bsDT

发布于 上海