刚刚,#DeepSeek开源视觉新模型#
DeepSeek-AI发布DeepSeek-OCR2新视觉语言模型,采用创新的DeepEncoder V2架构,以LLM风格编码器替代CLIP,引入因果流查询与定制化注意力掩码,实现视觉令牌语义驱动动态重排,显著提升文档OCR性能(OmniDocBench v1.5准确率达91.09%,提升3.73%),并降低重复率、优化PDF和线上处理效果。
该技术突破强化了AI视觉与ISP深度融合趋势,直接利好具备AI视觉ISP技术落地能力的厂商。
处于AI视觉感知硬件关键环节的公司,有望受益于大模型驱动的智能终端、文档识别、工业视觉等下游需求扩张。
#科技先锋官#
发布于 广东
