DeepSeek核心员工被大厂挖角

就在DeepSeek V4山雨欲来的前夜，晚点LatePost的更新爆了不少料：

- 最近半年，DeepSeek的核心员工，包括DeepSeek第一代模型作者王炳宣、DeepSeek-OCR系列作者魏浩然、DeepSeek-R1作者郭达雅、Janus-Pro贡献者阮翀等人，都被各家大厂给挖走了，更不用说已经在小米做出了成果的前研究员罗福莉；

- 尽管如此，DeepSeek依然不怎么卷，同行的每周工作时间都奔着80小时去了，DeepSeek的大多数员工还是遵循着早上不打卡、下午6-7点走人的规律，因为老板梁文锋相信一个人每天高质量输出的时间不会超过8小时，加班疲劳产生的昏庸判断，反而会浪费宝贵的算力资源；

- 搞AI和做量化之间的关系其实相当紧密，2016年，DeepMind的创始人哈萨比斯就组建过量化团队，希望能为刚刚脱离Google的公司创收，结果没赚到钱，而幻方则是倒过来的，也是在同一年开始用GPU的深度学习算力去干实盘交易，成功让梁文锋以30岁的年纪实现财富自由，再才组建了DeepSeek；

- 2023年的时候，梁文锋小范围见过一些投资人，但提出的构想类似OpenAI和微软的投资协议，投资方需要接受一个回报上限，这在投资者看来是没道理的，所以见完一轮之后，没有任何机构愿意投DeepSeek，而在大模型火了之后，梁文锋把和投资人建联的通道直接关闭了；

- 在公司里，梁文锋参与最多的是基模架构工作，然后就是充当不同团队之间的粘合剂，DeepSeek内部鼓励交叉协作，一个团队的周会也会向其他团队开放，这种开放组织很容易被规模扩张给破坏，所以DeepSeek对于核心团队的增加相当谨慎；

- 去年以来，外部世界发生巨变，既有DeepSeek-V3/R1的一炮走红，也有竞争烈度的大幅升级，DeepSeek没有加入任何战局，依然在自己重视的效率优化（注意力机制）、架构改进（mHC）和非主流探索（OCR）上面努力，梁文锋甚至招进了一些神经科学和脑科学背景的顾问，对人脑原理兴趣大增；

- 这也意味着DeepSeek错过了去年最重要的两条主线，一个是AI Coding，这里不只有商业价值的爆发，还引发了以龙虾为代表的Agentic应用形态，DeepSeek-V3.2完全被其他国产模型盖过了风头，另一个是多模态生成，从GPT-4o到Nano Banana再到Seedance 2.0，全都颠覆性的创造了海量增长，但梁文锋认为多模态「不是智能的主线」；

- 外界期待DeepSeek每次出手都能像去年年初那样石破天惊，这可能有些强人所难，也未必是梁文锋的目标，而他也需要稳定团队抗拒财富诱惑的心力，猎头给DeepSeek员工开出2-3倍的薪水，而且这还是建立在DeepSeek本身工资就不低的前提下，确实也有员工做出了跳槽去参与更确定性的、持续参与业界最强模型工作的选择；

- 留下的人当然还是占了大多数，他们习惯了相对宽松的研究氛围，也愿意做非竞争驱动的探索，在DeepSeek的价值体系里，原创的排序是要比最强更靠前的，它们本质上并不冲突，有时候实现了原创也就自然实现了最强，但在进入Agentic版本后，工程能力变得更重要了，而这正好进入了DeepSeek没有过多投入的地方；

- 于是梁文锋也比较少见的做出了应变回应，最近一段时间，他开始启动了对公司的估值，这意味着可以给团队更有刺激性的财富预期，同时也开始招揽模型策略产品经理，明确要求深度使用过Claude Code、OpenClaw、Manus；

- 坚持该坚持的，改变该改变的，至于什么是该坚持的、什么是该改变的，这个判断还是得由梁文锋来拿捏，「奇迹之所以是奇迹，就是因为它不常发生，是小概率事件。在中国这个崇尚竞争和结果说话的环境里，敢于追求独特目标的 DeepSeek 的存在本身，是一个令人惊喜的小概率事件。」

#DeepSeek不打卡也不加班##DeepSeekV4或将在4月发布#

发布于北京