DeepSeek多模态灰度测试

【DeepSeek多模态真的来了？识图模式已开始小范围灰度】

4 月 29 日下午，#DeepSeek# 多模态团队负责陈小康（Xiaokang Chen）在 X 发布动态：“Now, we see you. 👀”，配图为两只 DeepSeek 鲸鱼 logo，一只仍戴着海盗眼罩，一只已经睁开眼睛。这是他在 24 小时内第二次释放类似信号。前一天，他曾发布措辞为“Soon, we see you”的同主题预告，随后该推文被删除。

陈小康目前在 DeepSeek 负责多模态预训练与后训练，统领 DeepSeek 大模型的多模态能力建设。其北大博士阶段导师为曾刚教授，研究方向涵盖视觉-语言模型、半监督分割、masked image modeling 等。

与预告同步，部分用户已在 DeepSeek 官方 App 中灰度到“识图模式”（没能被灰度测试到）截图显示，App 输入栏上方除原有的“快速模式”“专家模式”外，新增“识图模式”按钮，并标注“图片理解功能内测中”。社交平台流出的内测截图显示，用户上传一张图片后，能够输出包括“分析用户需求”“分析图片”在内的结构化描述，识别图片具体内容。

这是 DeepSeek 主线产品中首次出现具备图像理解能力的模式。此前 4 月 8 日，DeepSeek App 完成第一轮模式分层改版，上线“快速模式”和“专家模式”，根据 V4 发布后的官方说明，前者由 V4-Flash 驱动，后者对应 V4-Pro。当时已有微博用户（@蚁工厂）放出含"快速/专家/视觉"三档选项的截图，但视觉一档迟迟未开放。从今天起，这一档开始进入小范围灰度。

戳链接查看详情：http://t.cn/AXJzgLn7