晚点团队最近发了一篇关于 DeepSeek 的深度报道,信息量很大,我来帮大家捋一捋。
先说人事变动。DeepSeek 确实走了几个核心成员:第一代大语言模型的核心作者王炳宣被腾讯挖走了,R1 的核心作者郭达雅也正式离职,可能去某大厂,还有做 OCR 的魏浩然、做多模态的阮翀也先后离开。但文章也强调了,走的是少数,更多人选择留下来。
再说 V4。其实早在今年 1 月,V4 的小参数版本就已经给到一些开源社区做适配了,原本最乐观的预期是春节前后发布,但现在看起来可能要到 4 月。
然后聊聊梁文锋这个人,挺有意思的。不到 30 岁就财富自由,生活极其简单,好多天穿同一件衣服,在杭州长期住酒店,在北京租房住。他几乎不社交,不参加团建,年底大团建只在讲话时露面,讲完就走。有个小故事特别能说明他的风格:MiniMax 的创始人闫俊杰约他吃饭,到了之后看到一个穿 T 恤的小哥,以为是助理,结果对方上来就问了半小时技术问题,闫俊杰问"梁总什么时候来",对方说"我就是梁文锋"。
组织方面,DeepSeek 可能是全球唯一一个"不卷"的顶级 AI 实验室。不打卡,没有明确的绩效考核和截止时间,多数人下午六七点就下班了。梁文锋的逻辑是:一个人每天能高质量输出的时间就 6 到 8 小时,加班加出来的昏庸判断反而浪费算力。整个研究团队 100 多人,只有梁文锋和研究员两个层级,极度扁平。团队成员超七成是本硕,超七成不到 30 岁。
关于方向选择,梁文锋的路线跟行业主流有明显差异。他没有重押多模态生成,觉得那不是智能的主线。在 Agent 方向上投入也相对克制。他更看重三件事:一是极致的效率优化,用更少的算力做出更多的智能;二是基于国产生态做大模型,包括适配国产 GPU;三是做一些别人不愿意试的"原创式创新",比如 OCR 系列、持续学习、仿生人脑的探索,甚至招了神经科学和脑科学的顾问。
当然,挑战也很现实。DeepSeek 之前没融过资,员工手里的期权没有明确标价,而外面的公司开出的薪资翻两三倍都不稀奇,有的甚至给八位数总包。智谱、MiniMax 上市股价高涨,也让内部成员对自己手中期权的价值产生更多疑问。梁文锋已经开始想办法给公司估值,给团队更确定的预期。
最后一个信号值得关注:DeepSeek 最近的招聘启事里,第一次出现了 Agent 方向的"模型策略产品经理"岗位,要求熟悉 Claude Code、OpenClaw、Manus 等产品。这意味着 DeepSeek 接下来大概率会在 Agent 产品上有更多动作。
总的来说,DeepSeek 依然是那个追求独特目标、敢于走不同路线的团队,只是在外部竞争加剧的环境下,它也在学着适应和调整。正如文章最后说的:低头做事的人不一定能在浮躁的市场里笑到最后,但只有更多这样的公司出现,中国科技才有从"复刻"到领跑的可能。
#科技先锋官##How I AI#
