DeepSeek正处在转折期。从 2025 年下半年至今,已有多位核心成员离开并流向外部:王炳宣被腾讯挖走,他是DeepSeek LLM 核心作者,后续参与历代模型训练;
魏浩然离开,他是DeepSeek-OCR 核心作者;郭达雅离开,他是DeepSeek-R1 核心作者;阮独更早离开,后加入 元戎启行,他是从幻方时期就加入的老成员,也是
Janus-Pro等多模态成果的核心贡献者。
梁文锋的重心在变化。从 2025 年秋天起,他开始更多提产品化和商业化。DeepSeek 已有小数十人的产品团队,但还没有进入 AI 编程、通用 Agent 等热门方向,C
端仍主要是Chatbot。与此同时,DeepSeek人数已经超过幻方,成为梁文锋管理过的最大组织。
DeepSeek 的底层组织方式没有变。公司 不打卡、不加班、没有明确绩效和 DDL,多数成员平时6 点到7点离开公司。内部仍是高密度人才驱动的"自然分工",研究
员可以自由组队,也可以长期做未必短期出成果的研究。梁文锋本人参与最多的仍是基模架构团队,并与团队共同确定每一代基模的架构方向;与之配套的Infra 和 数
据团队也各有小几十人。
技术路线上,DeepSeek 仍很克制。没有重点押注多模态生成,因为梁文锋认为这不是智能主线;同时会投入国产 GPU 适配,以应对高性能 GPU 受限的问题。到
DeepSeek-V3.2,其底层算子库甚至已从 CUDA、Triton(OpenAI开源)转向 TileLang(北大开源)。
资本层面,DeepSeek一直很特殊。2023 年梁文锋曾接触部分投资人,但提出了一个少见条件:希望投资方接受类似OpenAI一微软 那样的 回报上限机制。最终这一
轮没有机构投资DeepSeek。
外界当前最关注的是V4。已有消息称DeepSeekV4可能在4月发布。判断上,它大概率仍会是开源最强模型之一,但未必再是过去那种单一标准下的"碾压式领先",
因为现在不同场景对"强"的定义已经分化。
另据网络公开信息,DeepSeek最近已开启新一轮灰度测试。现有反馈集中在三点:代码能力提升,尤其是SVG 生成;多轮搜索和信息整理能力提升;思考过程中的
分步修改能力提升。结合此前有关V4大版本的说法,外界猜测这次灰测对应的可能就是V4的大参数版本,若测试顺利,可能很快上线
发布于 浙江
