买家张俊 26-04-29 15:06
微博认证:科技博主

#DeepSeek多模态值得期待吗#值得期待,但别急着替代现有工具。

从官方预告和陈小康研究员释放的信号看,DeepSeek走的是"原生多模态架构"路线——文本和图像在底层统一处理,而非传统"OCR+文本"的拼接方案。这种技术路径上限更高,在处理图表解析、图文混排等复杂场景时理论上更流畅。

但更值得关注的是价格策略。V4纯文本版已打出"1.25元/百万Token"的牌,如果多模态延续同样的性价比逻辑,确实可能把图像识别成本打到接近免费。这对中小企业、教育机构是实打实的利好。

至于替代现有工具,我的答案是:分场景看。

如果只是日常OCR提取文字、简单图表解析,价格够低的话完全可以切换。但专业级的图像生成、精细抠图、复杂修图——这些领域现有的工具链已经非常成熟,DeepSeek作为"理解型"模型本就不擅长这类任务。术业有专攻,没必要用一个工具包揽所有事。

理性期待,等实测再下判断。http://t.cn/AXJzpgit

发布于 湖北