鸡精锦鲤_ 26-04-02 19:18

华泰计算机,

最近DeepSeek的信息多了起来,帮大家梳理下,资料来源:晚点 LatePost;网络公开信息。

DeepSeek 正处在转折期。 从2025年下半年至今,已有多位核心成员离开并流向外部:王炳宣被腾讯挖走,他是 DeepSeek LLM 核心作者,后续参与历代模型训练;魏浩然离开,他是 DeepSeek-OCR 核心作者;郭达雅离开,他是 DeepSeek-R1 核心作者;阮翀更早离开,后加入元戎启行,他是从幻方时期就加入的老成员,也是 Janus-Pro 等多模态成果的核心贡献者。

梁文锋的重心在变化。从 2025 年秋天起,他开始更多提 产品化和商业化。DeepSeek 已有小数十人的产品团队,但还没有进入AI 编程、通用 Agent 等热门方向,C 端仍主要是 Chatbot。与此同时,DeepSeek 人数已经超过幻方,成为梁文锋管理过的最大组织。

DeepSeek 的底层组织方式没有变。 公司不打卡、不加班、没有明确绩效和 DDL,多数成员平时 6 点到 7 点离开公司。内部仍是高密度人才驱动的“自然分工”,研究员可以自由组队,也可以长期做未必短期出成果的研究。梁文锋本人参与最多的仍是 基模架构团队,并与团队共同确定每一代基模的架构方向;与之配套的 Infra 和 数据团队 也各有 小几十人。

技术路线上,DeepSeek 仍很克制。 没有重点押注多模态生成,因为梁文锋认为这不是智能主线;同时会投入 国产 GPU 适配,以应对高性能 GPU 受限的问题。到 DeepSeek-V3.2,其底层算子库甚至已从 CUDA、Triton(OpenAI开源) 转向 TileLang(北大开源)。

资本层面,DeepSeek 一直很特殊。 2023 年梁文锋曾接触部分投资人,但提出了一个少见条件:希望投资方接受类似 OpenAI—微软 那样的 回报上限 机制。最终这一轮没有机构投资 DeepSeek。

外界当前最关注的是 V4。 已有消息称 DeepSeek V4 可能在 4 月发布。判断上,它大概率仍会是 开源最强模型之一,但未必再是过去那种单一标准下的“碾压式领先”,因为现在不同场景对“强”的定义已经分化。

另据 网络公开信息,DeepSeek 最近已开启新一轮 灰度测试。现有反馈集中在三点:代码能力提升,尤其是 SVG 生成;多轮搜索和信息整理能力提升;思考过程中的分步修改能力提升。结合此前有关 V4 大版本的说法,外界猜测这次灰测对应的可能就是 V4 的大参数版本,若测试顺利,可能很快上线。

发布于 广东