老手看盘 26-01-27 15:12
微博认证:财经知识分享官 财经观察官 投资内容创作者 微博原创视频博主

DeepSeek发布新的视觉编辑模型

核心概念股:

1️⃣汉王科技002362
2️⃣视觉中国000681
3️⃣合合信息688615

DeepSeek 新发布的视觉编辑模型以多模态特征融合与精准交互编辑为核心,其 VL2 模型采用 MoE 架构与动态切图技术,支持 1152x1152 高分辨率处理,具备视觉定位、梗图解析、Plot2Code 逆向生成等功能,像素级语义解析准确率达 96.7%。汉王科技术储备与生态基础形成天然适配。​

DeepSeek 新发布的视觉编辑模型以OCR 精准识别与结构化输出为核心支撑,VL2 模型通过动态切图技术与 MoE 架构优化,在 1152x1152 高分辨率下实现 96.7% 的像素级语义解析,其 OCR 模块融合 SAM 分割与 CLIP 视觉理解能力,可同步提取文本内容与空间布局信息,解决传统 OCR “识文不识布局” 的痛点。同期开源的 DeepSeek-OCR 模型更以高压缩比优势著称,800 个视觉 token 即可超越传统模型 6000token 的识别效果,支持 Markdown 格式输出与批量处理。

发布于 广东