DeepSeek开源视觉新模型

刚刚，#DeepSeek开源视觉新模型#

DeepSeek-AI发布DeepSeek-OCR2新视觉语言模型，采用创新的DeepEncoder V2架构，以LLM风格编码器替代CLIP，引入因果流查询与定制化注意力掩码，实现视觉令牌语义驱动动态重排，显著提升文档OCR性能（OmniDocBench v1.5准确率达91.09%，提升3.73%），并降低重复率、优化PDF和线上处理效果。

该技术突破强化了AI视觉与ISP深度融合趋势，直接利好具备AI视觉ISP技术落地能力的厂商。

处于AI视觉感知硬件关键环节的公司，有望受益于大模型驱动的智能终端、文档识别、工业视觉等下游需求扩张。

#科技先锋官#

发布于广东