就在DeepSeek V4山雨欲来的前夜,晚点LatePost的更新爆了不少料:
- 最近半年,DeepSeek的核心员工,包括DeepSeek第一代模型作者王炳宣、DeepSeek-OCR系列作者魏浩然、DeepSeek-R1作者郭达雅、Janus-Pro贡献者阮翀等人,都被各家大厂给挖走了,更不用说已经在小米做出了成果的前研究员罗福莉;
- 尽管如此,DeepSeek依然不怎么卷,同行的每周工作时间都奔着80小时去了,DeepSeek的大多数员工还是遵循着早上不打卡、下午6-7点走人的规律,因为老板梁文锋相信一个人每天高质量输出的时间不会超过8小时,加班疲劳产生的昏庸判断,反而会浪费宝贵的算力资源;
- 搞AI和做量化之间的关系其实相当紧密,2016年,DeepMind的创始人哈萨比斯就组建过量化团队,希望能为刚刚脱离Google的公司创收,结果没赚到钱,而幻方则是倒过来的,也是在同一年开始用GPU的深度学习算力去干实盘交易,成功让梁文锋以30岁的年纪实现财富自由,再才组建了DeepSeek;
- 2023年的时候,梁文锋小范围见过一些投资人,但提出的构想类似OpenAI和微软的投资协议,投资方需要接受一个回报上限,这在投资者看来是没道理的,所以见完一轮之后,没有任何机构愿意投DeepSeek,而在大模型火了之后,梁文锋把和投资人建联的通道直接关闭了;
- 在公司里,梁文锋参与最多的是基模架构工作,然后就是充当不同团队之间的粘合剂,DeepSeek内部鼓励交叉协作,一个团队的周会也会向其他团队开放,这种开放组织很容易被规模扩张给破坏,所以DeepSeek对于核心团队的增加相当谨慎;
- 去年以来,外部世界发生巨变,既有DeepSeek-V3/R1的一炮走红,也有竞争烈度的大幅升级,DeepSeek没有加入任何战局,依然在自己重视的效率优化(注意力机制)、架构改进(mHC)和非主流探索(OCR)上面努力,梁文锋甚至招进了一些神经科学和脑科学背景的顾问,对人脑原理兴趣大增;
- 这也意味着DeepSeek错过了去年最重要的两条主线,一个是AI Coding,这里不只有商业价值的爆发,还引发了以龙虾为代表的Agentic应用形态,DeepSeek-V3.2完全被其他国产模型盖过了风头,另一个是多模态生成,从GPT-4o到Nano Banana再到Seedance 2.0,全都颠覆性的创造了海量增长,但梁文锋认为多模态「不是智能的主线」;
- 外界期待DeepSeek每次出手都能像去年年初那样石破天惊,这可能有些强人所难,也未必是梁文锋的目标,而他也需要稳定团队抗拒财富诱惑的心力,猎头给DeepSeek员工开出2-3倍的薪水,而且这还是建立在DeepSeek本身工资就不低的前提下,确实也有员工做出了跳槽去参与更确定性的、持续参与业界最强模型工作的选择;
- 留下的人当然还是占了大多数,他们习惯了相对宽松的研究氛围,也愿意做非竞争驱动的探索,在DeepSeek的价值体系里,原创的排序是要比最强更靠前的,它们本质上并不冲突,有时候实现了原创也就自然实现了最强,但在进入Agentic版本后,工程能力变得更重要了,而这正好进入了DeepSeek没有过多投入的地方;
- 于是梁文锋也比较少见的做出了应变回应,最近一段时间,他开始启动了对公司的估值,这意味着可以给团队更有刺激性的财富预期,同时也开始招揽模型策略产品经理,明确要求深度使用过Claude Code、OpenClaw、Manus;
- 坚持该坚持的,改变该改变的,至于什么是该坚持的、什么是该改变的,这个判断还是得由梁文锋来拿捏,「奇迹之所以是奇迹,就是因为它不常发生,是小概率事件。在中国这个崇尚竞争和结果说话的环境里,敢于追求独特目标的 DeepSeek 的存在本身,是一个令人惊喜的小概率事件。」
#DeepSeek不打卡也不加班##DeepSeekV4或将在4月发布#
