#模型时代# Claude Code和Cowork负责人:AI原生产品团队是如何运作的?
Lenny's Podcast新鲜出炉的一期播客,嘉宾是Fiona Fung,负责Anthropic的Claude Code和Cowork团队的工程与产品工作。向她汇报的包括Claude Code创始人Boris Cherny和Kat Wu。加入Anthropic之前,她在Microsoft做了11年,从Visual Studio编辑器团队一路做到TypeScript;2015年加入Facebook后创建了Marketplace团队,从概念做到上线;之后在Meta经历了VR/AR、Instagram基础设施、增长、安全等多个团队,管理规模超过500人。2025年9月加入Anthropic时,她先做IC,以个人贡献者身份写代码、熟悉代码库,然后才开始带团队。
一、AI原生团队的运行逻辑
1、编码不再是瓶颈,验证才是
Anthropic内部的变化分两个拐点:2025年Claude Code从只建议代码变成能执行代码,曲线开始上扬;2026年模型能在更长时间窗口内自主工作,曲线再次陡升。工程师的日常从"自己写代码"转变为"指挥和审查Claude写的代码"。
当吞吐量翻了8倍,原来的人工代码审查立刻变成新瓶颈。Fiona的做法是把"好的标准"文档化后存入代码仓库,让Claude Code Review对照这些标准自动检查。她举了内容设计规范的例子:团队更新了设计规范后,把规范和代码放在一起维护,Claude就能自动校验代码是否还符合规范。
这本质上是测试驱动开发的进化版。TDD的理念在2000年代就流行过,先写测试、再写代码。Fiona自己当年的体验是"像先吃西兰花一样痛苦"。现在的区别是测试生成本身也被自动化了,这让一个好理念终于不再需要靠意志力来执行。
2、bad、sad和脏话:三层质量信号
面对不同产品线、不同服务各有各的指标仪表盘,Fiona引入了一个两层分类:bad是严重的、不可恢复的错误,比如CLI崩溃导致用户丢失工作;sad是可恢复的体验问题,比如界面闪烁。每个子团队自主定义什么是自己领域里的bad和sad,设定各自的改进目标。
这个框架解决的问题是:当你有大量产品表面积时,raw数字很难让人一眼判断"这到底算好还是不好"。bad/sad提供了一个人人能理解的语义层。Fiona特别提醒,sad堆积起来可以升级为bad,所以两层都需要持续关注。
除了bad和sad,团队还有一个更直接的信号来源:用户在对话中骂人的频率。2024年9月有工程师提议"我们是不是该跟踪一下脏话",Fiona觉得这个主意好,于是真的做了一个swear word dashboard。这个仪表盘不能告诉你具体哪里出了问题,但当脏话率飙升时,你知道用户体验在变差。它是一个情绪层面的前置信号,和bad/sad的技术分级互为补充。
3、各角色都在提交代码
Claude Code团队里不只是工程师在提交代码,设计师和产品经理也在check in代码。角色边界在模糊化:工程师在长产品肌肉,产品经理不再被工程带宽卡住,以前要等工程师的功能现在可以自己先做出来。
Fiona认为下一波需要Claude化的领域是设计和数据科学,这两个方向目前的工具支持还不够成熟。她还注意到一个正在发生的现象:数据科学家的工作正在变成"帮各部门review他们用AI做的分析",大部分时间花在验证别人的产出上。
二、用Claude管Claude团队:管理工具箱重建
Anthropic自己的工程管理实践可能是对"AI改变工作方式"最极端的压力测试。Fiona分享了几个已经跑通的具体做法。
1、开一个常驻Claude Code会话,接入所有仓库和Slack
Fiona有一个长期运行的Claude Code远程会话,挂载了团队所有代码仓库,接入了全部Slack频道,还能查看各项跟踪指标。每月她会打开这个会话,和团队成员一起回顾:这个月的重点方向是什么?哪些产品发布了?市场表现怎么样?反馈渠道说了什么?
它的价值在于让对话有更扎实的事实基础,面对面沟通仍然要做,只是讨论中有了更多数据可以引用。当一个季度的代码量翻8倍,靠人脑记"上季度发了什么"已经不现实。Claude把散落在仓库、Slack、指标看板里的信息拉到一个会话窗口里,管理者才有可能跟上节奏。
2、routines把晨间仪式变成了后台自动化
Fiona以前每天早上的流程是:泡咖啡,打开反馈频道,逐条浏览用户反馈,找到自己有空动手时能顺手修的问题。现在这个流程被Claude Code的routines功能接管了。Routines允许用户设定一个定时任务,在指定时间自动执行一组操作,而且它能在执行过程中自主派出多个agent并行处理子任务。她设定了一个每天早晨跑的routine:扫描反馈频道,提炼主题,甚至生成修复PR供她审核。
关键变化在于抽象层又往上提了一层。以前是人写prompt让Claude干活,现在是写一个routine,让routine帮你生成prompt并分发给不同的agent去执行。"It's almost like the level of abstraction keeps pulling up a little bit。"抽象层持续上移,每一次上移都释放出新的效率空间。Fiona认为异步、多agent并行将是工程团队接下来的主要工作方式。
3、反馈来源要全通道覆盖
团队的反馈通道不只是正式渠道。朋友在LinkedIn上随手提到的一句话、社交媒体上的吐槽、合作伙伴的邮件,团队成员都会搬到Slack里。Fiona坦言正因为反馈量太大,"我需要Claude帮我才能跟得上"。
背后是一个管理认知的转变:反馈不分官方和非官方,分的是有没有被看到。靠人力根本处理不过来的信息量,要么靠Claude帮你过滤和归纳,要么就放弃一部分关键信号。
三、两种人才画像与角色重塑
1、招人只看两个方向:有产品直觉的创意builder,和硬核系统专家
Fiona加入Claude Code团队时发现团队有很好的产品通才,但缺分布式系统方面的深度专家。她的补课方式是定向招具有系统和分布式系统背景的人。
两种画像各有分工。创意builder是"做梦的人",他们热爱某个产品想法,自己构建、收集反馈、迭代打磨,端到端拥有产品体验。系统专家解决的是"信任但要验证"中验证那一半的问题。模型写的代码在大多数场景够用,但在需要深度领域知识的地方仍然需要人类专家把关。
2、工程师的天花板被掀掉了
Fiona讲了一个例子:一个非移动端出身的工程师需要给某功能加移动端支持,放在以前他可能会说"我不是Android专家",但现在有Claude做搭档,他直接把活接了下来。
"It's lifted the ceiling of what anyone is able to do。"这句话指向的不是效率提升,而是能力边界的扩展。一个人能做的事情类型变多了,不仅仅是做同类事情更快。
3、高agency配高accountability
Fiona团队反复强调的原则是"高自主性配高问责"。团队里每个人都有很大的自由度去定义自己怎么解决问题,但同时需要明确回答:你试图验证什么假设?结果怎么样?
这看起来简单,实际上是对"agency"这个高频词的一个重要约束。只有agency没有accountability,容易变成各干各的散沙;只有accountability没有agency,退回到指令式管理。两条腿缺一不可。
4、新一代工程师怎么培养,是她没有答案的问题
Fiona没有回避这个问题:她和主持人走过的工程师成长路径,未来的人根本没法复制了。如果不需要手写代码,新人怎么理解基础设施和内存分配这些底层概念?她的建议是永远往下多看一层你的依赖,因为依赖发生变化时你需要知道意味着什么。
她提到这可能需要类似学徒制的培养模式。传统三个月的实习做小项目已经不够了,但具体的替代方案她也还在想。不过历史本身或许能提供一些安慰:她的一位前任经理,职业生涯从打孔卡开始,现在正在用Claude Code做东西,还兴奋地给她发消息展示自己的成果。从打孔卡到Claude Code,这条职业弧线横跨了整个计算机史。每一代工程师觉得重要的知识都在变,但适应力本身好像可以传递。
四、衡量产出:别把动作当进展
1、生产力指标的连环陷阱
Fiona回顾了生产力指标的演变史:先是lines of code,然后有人只是搬了个库进来就刷到最高,于是改成significant lines of code;后来框架升级导致代码量变少但产出不变,又有人提议用PR合入时间。每换一个指标,都解决了上一个指标的漏洞,又制造了新的盲区。
她把现在的token消耗量计算直接类比为当年的lines of code。"Don't forsake motion for progress",别把动作误认为进展。如果你衡量的是工具使用量,你衡量的只是行为,不是结果。
2、Facebook Marketplace的power seller教训
做Marketplace时,团队最初用"卖家数量"做扩张前的门槛指标。某个新区域的卖家数量偏低,按旧标准不该扩张。但数据一细拆,发现虽然卖家少,买家却在找到想要的东西,因为这个区域有少量power seller贡献了大部分供给。
团队差点因为指标设计的盲区放弃了一个健康的市场。教训是:任何指标,哪怕当初定得合理,也要随着对市场的理解不断校准。环境变化太快,指标本身也需要迭代。
3、与其看仪表盘,不如去听
对于正在推动AI工具落地的团队leader,Fiona建议做一轮listening tour,重点找资深工程师聊:什么在起作用,什么不起作用,怎么能更好。这些对话能触发仪表盘看不到的洞察,也是把个人经验变成团队知识的最有效方式。
五、狗粮哲学:为什么管理者必须自己用产品
Dog fooding,直译是"吃自己的狗粮",指开发团队自己日常使用自己构建的产品。这是Fiona从Visual Studio时代就养成的习惯,当年她用VS编辑器来构建VS编辑器本身,产品问题在团队内部就能被高频触发。
1、新manager先做IC,后带人
Fiona在Claude Code团队推行的规则是:新入职的manager不急着进入管理角色,先留出maker time,腾出专注编码的时间来深入代码库和产品。好处有两层:一是真正理解团队日常面对的技术和体验挑战;二是用行动建立信任,而不是靠头衔。她观察到,manager一入职就掏出"manager toolbox"做管理动作,反而不如先做队友更有效。
这条原则对她自己也适用。从Meta管500人团队到Anthropic做IC,她重新走了一遍写代码、提交PR、跑测试的完整流程。她坦言上一次提交生产代码大约是2017年,多年来一直怕"万一我搞坏了什么"。Claude Code帮她重建了这个信心:它既是onboarding buddy,帮她理解代码库、回答问题;又帮她自动生成测试、设计手动测试方案,让她重新有底气往生产环境里推代码。
2、在Marketplace卖二手电脑,上架几分钟就遇到新型诈骗
Fiona离开Marketplace团队之后,有一次想卖自己的旧MacBook Air。上架几分钟内,一个买家试图用她没见过的新手法诈骗。这个亲身经历让她意识到,fraud向量一直在演变,团队的安全策略需要持续更新。
类似的故事也发生在VR团队。她的使用环境因为某种原因特别容易触发地板高度bug,于是这个repro环境反过来帮团队定位了一个长期未解的问题。
3、智利之行发现的增长阻碍
Marketplace准备进入拉丁美洲时,在智利的数据表现远不如其他区域。所有可能的原因都排查过了。Fiona带了三个人飞到智利,买了一批当地的Android手机,落地一开机就发现了仪表盘上看不到的问题:LTE网速远低于美国,Marketplace的信息流在这个网络条件下根本加载不出来。
她用这个案例说明:当数据告诉你结果但不告诉你原因时,去现场、亲自用才能找到答案。
六、从六个月到JIT:规划方式的坍缩
1、六个月路线图三个月就废了
Fiona加入Claude Code团队后做的第一件事之一是推一个"超轻量级"六个月路线图。她认为做了最小化的规划负担。但三个月后回头看,团队几乎没有人再翻那个文档,因为实际情况变化太快,路线图已经过期了。
这给了她一个教训:规划的价值在于对齐的过程,不在于文档本身。如果文档产出之后没有人维护或引用,那个规划就已经失去意义了。
2、现在的做法:JIT月度规划 + 周检
JIT是just-in-time的缩写,借用的是制造业"即时生产"的概念。团队现在用一个轻量的电子表格对齐每月优先级,甚至没有正式文档。每周快速确认一次:"这些还是本月优先级吗?"更长期的方向以主题形式存在,每半年全团队聚一次来刷新主题,但具体执行只规划一个月。
Fiona补充说,即使这个月度对齐的流程她也在想怎么进一步自动化。她的焦虑是流程变成"税",迫使人们去更新表格却没有产生实际价值。
3、明确授权砍掉不再有用的流程
"Explicit permission to kill processes that no longer serve us",明确授权砍掉不再有用的流程,这是Claude Code和Cowork团队文化中被写出来的条款。Fiona建议所有team lead做一件事:从日常流程中挑出一个你最怕做的、或噪音最大的、或最消耗人力的,先问一句"这件事还在达成它当初的目的吗?"
如果答案不确定,尝试砍掉它观察一段时间。如果答案是肯定的,问能不能用Claude自动化。这个思维模式本身比任何具体的流程改进都重要。
七、前方路况:还没解开的题
1、异步agent带来的上下文切换超载
当你可以同时踢出20个agent异步跑任务,你的上下文切换负担反而加重了。每个agent回来都需要你重新载入上下文、审核结果、决定下一步。Fiona说她以前会专门block时间给编码,现在反而要block时间来"追赶所有异步任务的进展"。
她坦承还没有解法。一个观察是:agent可以帮你快速重建上下文,所以切换的单次成本比纯人工时代低一些,但总量的增加可能抵消了这个优势。
2、工程师开始感到孤独
当每个人都和自己的agent搭档干活,团队协作的物理感消失了。以前后端、前端、iOS的人一起构建一个功能,现在一个人加10个Claude并行就把活干了。还有一层失落更个人化:以前遇到一个棘手问题,戴上耳机进入flow state,最后解出来的那一刻有巨大的成就感。这种aha moment正在减少。
Claude Code团队的应对是pair-wise programming lunch:两人一组,边吃午饭边并行编程。不是经典结对编程那种一人写一人看,更像小孩子的"平行游戏",各干各的但在旁边。Fiona说每次看别人工作都能学到新东西,因为团队里每个人使用Claude Code和Cowork的方式都不一样。Hackathon也是保持团队连接的手段之一。
3、在模型能力边界处构建
Fiona提到一个实用的策略:有些自动化在当前模型版本上还做不好,但模型改进的速度是指数级的。她回忆早期用Sonnet 3.5的时候,模型还会犯不少错误,有些工程师据此判断"AI工具不行"然后就不再碰了。但她发现,上个月做不好的事情,这个月的模型可能已经能做了。
由此引出的建议是:如果某件事Claude几乎能做好但还差一点,值得提前把周边流程搭好。等下一个模型版本到来时,你已经站在起跑线上了,而那些等到"完全成熟"才开始的人还在画流程图。
4、iOS和Android是否还需要独立建制?
模型能力让工程师跨平台灵活切换变得可行,但深度平台专家仍然必要。Fiona的判断是不需要原来那么大的独立mobile org了,但需要保证有足够的平台专家把关。这个平衡点还在摸索中。
5、文化是最让她夜不能寐的事
技术问题和产品问题有仪表盘、有假设、有迭代路径。团队文化没有。Fiona在乎的是"one team mentality":多元视角、开放辩论、接近终点线时回头拉一把掉队的人。团队快速扩张的时候,文化会漂移,如果漂移了没察觉,等问题浮出水面时修复成本极高。
她最怕的画面是:问manager"最近怎么样",对方说"everything's fine"。那个"着火的房间里端着咖啡的猫"meme,就是她的噩梦。她对团队里所有manager的要求是:永远主动说出不顺利的部分,这样才能一起解决。Sheryl Sandberg曾在Airbnb的一次fireside chat上被问到同样的问题:规模扩张中怎么维持文化?她的回答是"这恰恰是你想要的问题,因为它说明你在增长。不增长、不招人的局面才是真正糟糕的。"Fiona觉得这个视角对所有正在高速扩张的团队都适用。
发布于 日本
