强,腾讯刚刚开源了最新原生端到端OCR:HunyuanOCR,1B,OmniDocBench得分94.1,超DeepSeek OCR、Gemini 3 Pro
功能覆盖文本检测、复杂文档处理、视频字幕提取、端到端照片翻译等全场景
文本检测,支持街景、手写、艺术字、广告、票据、截屏等等
复杂文档处理,表格/公式直接输出 HTML/LaTeX
端到端照片翻译支持14种语言
github:http://t.cn/AXLK1Mab
HF:http://t.cn/AXLCYOfA
#OCR##HunyuanOCR#
发布于 中国香港
