#模型时代# Claude Code创造者:给团队更少的人,但是给每个人无限的Token
Anthropic的Claude Code负责人Boris Cherny最近又出来做了一系列访谈,不知道是不是为了对冲一下OpenClaw创始人Peter说他更喜欢CodeX胜过Claude Code。但是,Boris Cherny自己说并不太关心竞品。这期笔记来自Lenny's Podcast。
对了,非常有趣的一件事儿,Lenny让Boris推荐几本书,Boris的书单之一是刘慈欣的《流浪的地球》短篇集。
Claude Code虽然现在是Anthropic的王牌产品,但是它和Google的Gmail一样,是一个副业项目。Boris Cherny是这个产品从零到一的创造者。一年前,他一个人在终端里写了个原型,内部发布时只收到两个点赞。一年后,Claude Code已经贡献了全球GitHub上4%的公开代码提交量,仅过去一个月日活就翻了一倍。Semi Analysis预测到今年底这个数字会达到五分之一。
Boris本人从2025年11月起,也没有手动编辑过一行代码,每天通过Claude Code提交10到30个PR。
一、一个"没人看好"的产品是怎么长起来的
Claude Code的起源非常偶然。Boris加入Anthropic后,先花了一个月做各种原型(大部分没有上线),又花一个月做post-training(后训练)研究来理解模型能力边界。然后他开始做一个终端工具,当时叫Claude CLI。
1、第一个让他震惊的时刻
他给模型一个bash工具,然后随口问"我现在在听什么音乐?"模型自己想办法调用系统命令,查到了正在播放的歌曲。没有任何人教它这么做。"模型拿到工具后,自己想出了如何用它来回答一个我都不确定它能回答的问题。"
2、内部发布只拿到两个点赞
Boris在内部宣布这个项目时,反响极其冷淡。原因很简单:大家对coding tool的心理模型是IDE,没人觉得一个终端工具能成事。但终端之所以成为最终形态,是因为当时只有Boris一个人,终端是最快的构建方式。
后来团队讨论是否换成其他形态,最终决定继续留在终端。核心原因是:模型进步太快了,没有其他形态能跟上这个速度。 终端的极简架构反而成了优势。
3、外部发布也不是一夜爆红
2025年2月对外发布后,有一批早期用户,但大多数人并不理解这个产品是干什么的。"它太不一样了,你必须保持开放心态去学习怎么用它。"真正的爆发点在Opus 4发布之后,增长曲线变成了指数级,而且一直在加速,每天都比前一天更陡。
二、产品决策背后的底层逻辑
Boris在播客中反复提到几个产品原则,这些原则贯穿了Claude Code和Cowork的整个开发历程。
1、Latent Demand(潜在需求):看人们怎么"滥用"你的产品
这是Boris认为产品领域最重要的原则。他举了两个经典案例:Facebook Marketplace诞生于一个发现——40%的Facebook群组帖子是买卖东西。Facebook Dating的灵感来自另一个数据——60%的非好友异性间的主页浏览量。
用在Claude Code上:团队发现大量用户用Claude Code做的事情跟编程毫无关系。有人用它种番茄,有人分析自己的基因组数据,有人恢复损坏硬盘里的婚礼照片,还有人用它分析MRI影像。这些人在终端里绕了一大圈,就为了让AI帮他们干活。"当你看到人们这样折腾你的产品时,答案就很明显了:给他们一个专门的产品。" 这就是Cowork的起源。
还有一个更新的变体:不只是观察用户想做什么,还要观察模型想做什么。Claude Code的设计理念是把模型本身当作产品,给它最少的脚手架和工具,让它自己决定调用什么、以什么顺序执行。在研究领域这叫"on distribution"(在分布上),在产品领域就是对模型的潜在需求做响应。
2、The Bitter Lesson(苦涩的教训):永远押注更通用的模型
Rich Sutton十年前那篇博文的核心观点是:更通用的模型长期总会胜过更专用的模型。Boris把这个原则应用得很彻底——不要用小模型,不要做fine-tune(微调),不要搭复杂的workflow(工作流)和orchestrator(编排器)。
"Scaffolding(脚手架)可能带来10%到20%的性能提升,但这些提升往往在下一个模型发布时就被抹平了。"给模型工具和目标,让它自己搞定,几乎总是比精心设计的流程更有效。
3、为六个月后的模型做产品
Claude Code最早的版本只能写Boris大约20%的代码,五月份也就30%左右。一直到11月才达到100%。Boris从一开始就在为未来的模型能力做产品设计。
"你的产品前六个月product-market fit会很差,但当那个更强的模型发布时,你会直接起飞。"这是他给创业者最核心的建议之一。
三、团队管理的反直觉操作
1、适度"欠资源"比资源充足更好
Boris的团队刻意让项目处于轻微欠资源的状态。比如一个项目只放一个工程师。这迫使工程师必须借助Claude来自动化工作,反而激发了更多创新。"如果你招到优秀的工程师,他们会自己想办法的。尤其是当你赋予他们使用AI的权限时。"
这个逻辑跟通常的理解相反:AI不只是让你用更少的人做同样的事,而是人少的时候反而能从AI中获得更多。
2、给工程师无限的token
Boris对各种CTO的建议是:一开始不要想着优化成本。先给工程师尽可能多的token额度,让他们自由实验。Anthropic内部每个人都可以大量使用token,一些外部公司也开始把"无限token"作为招聘福利。
"有些工程师一个月花掉几十万美元的token费用。"听起来疯狂,但对比工程师薪资和产出,这笔账算得过来。优化token消耗的时机是——先验证想法可行,规模化之后再降本。
3、鼓励每个人都写代码
在Claude Code团队里,产品经理写代码,工程经理写代码,设计师写代码,数据科学家写代码,甚至财务人员也写代码。Boris认为未来最有竞争力的人才是跨学科的通才——比如懂设计的工程师,懂商业的产品经理,喜欢跟用户聊天的技术负责人。
"到今年底,'软件工程师'这个头衔会开始消失,取而代之的是'builder'。或者反过来说,每个人都是产品经理,每个人都写代码。"
四、"编程已被解决"之后会发生什么
这是Boris在播客中最直接的判断。
1、编程作为一门技能的未来
Boris的类比是印刷术。15世纪中叶,欧洲识字率不到1%,只有抄写员能读写。古腾堡印刷术发明后的50年里,印刷品的产出超过了此前1000年的总和。但识字率的普及花了200年。
"我想象一个几年后的世界,每个人都能编程。这会释放什么?任何人可以随时构建软件。就像15世纪的人无法预测印刷术最终会带来什么一样。"
他还找到一份历史文献,记录了一位15世纪抄写员对印刷术的态度:这位抄写员其实很兴奋,因为他最不喜欢的工作是抄书,最喜欢的是画插图和装帧。Boris说自己的感受非常类似——不用再处理代码的琐碎细节,终于可以把时间花在真正重要的事上:想清楚要做什么,跟用户交流,思考系统架构。
2、下一个受冲击的职业群体
编程之后,Boris认为冲击会扩展到所有"在电脑上完成的工作"——产品经理、设计师、数据科学家都在射程范围内。Cowork就是面向非技术人群的第一个agentic AI(能动型AI)产品。
一个有趣的数据:Lenny做了一个非正式调查,70%的工程师和PM说AI让他们更享受工作了,但设计师只有55%。原因可能是设计师目前从agentic AI中获得的赋能还不够直观。
3、Claude Code现在已经能自己提出工作建议
Claude Code会浏览反馈频道、查看bug报告、分析遥测数据,然后主动提出修复建议甚至直接提交PR。"它开始有点像一个同事了。"
五、使用Claude Code的实操技巧
Boris强调没有唯一正确的用法,但分享了几个他个人觉得非常有用的习惯。
1、永远用最强的模型
目前就是Opus 4.6,并且打开maximum effort(最大努力模式)。反直觉的地方在于:用便宜模型看似省钱,但因为智能程度低,需要更多轮对话和修正,实际token消耗可能更高。用最强模型反而更快、更省。
2、80%的任务先进Plan Mode(规划模式)
操作很简单,终端里按两次Shift+Tab就行。技术上也很简单,就是在prompt里加一句"先别写代码"。模型会先跟你来回讨论方案,方案确认后再执行。Boris说用Opus 4.6的Plan Mode,几乎每次都能一次性写对。
3、多平台并行使用
Boris现在三分之一的编程在终端完成,三分之一在桌面应用,三分之一竟然是在iOS手机App上。"我早上醒来第一件事就是打开手机上的Claude Code,让agent去验证昨晚的代码是否正确。"
他通常同时运行五个agent,处理不同的任务。这种multi-quading(多Claude并行)的工作方式已经成为他的日常。
六、安全:Anthropic为什么存在
Boris在播客中多次把话题拉回安全。他离开Cursor两周后回到Anthropic的原因就是:使命感。"在Anthropic的走廊里随便拦一个人问为什么在这儿,答案永远是安全。"
1、三层安全体系
• 第一层:对齐与可解释性。 Anthropic的Mechanistic Interpretability(机械可解释性)技术现在已经能追踪模型中特定神经元的激活状态,比如跟"欺骗"相关的神经元。模型中的一个神经元可能对应十几个概念(这叫superposition,叠加态),多个神经元协同工作时代表更复杂的概念。
• 第二层:实验室评测。 在受控环境中给模型设置各种场景,观察它是否表现安全。
• 第三层:真实世界观察。 模型越复杂,前两层表现良好不代表在野外也安全。Claude Code在内部测试了四五个月才对外发布,就是为了在真实使用场景中研究安全问题。
2、Race to the Top(向上竞赛)
Anthropic开源了Claude Code的沙箱环境,这个沙箱不只兼容Claude Code,任何agent都能用。目的是降低其他团队做安全工作的门槛,让整个行业一起往安全的方向走。
七、个人生活与思维方式
Boris在加入Anthropic之前住在日本农村,是镇上唯一的工程师,也是唯一的英语使用者。他每周骑车去农贸市场,路过稻田,跟邻居交换自制味噌和泡菜。
他做味噌做得相当不错。白味噌至少要三个月,红味噌需要两到四年。"它教你用长时间尺度思考,跟工程完全不同。混合好原料之后,你只能等。"
被问到AGI之后打算干什么,他说:大概会去做味噌吧。
而他之所以离开日本加入Anthropic,恰恰是因为在那段慢节奏的生活里读了大量科幻小说,开始以长时间尺度思考AI的未来走向,觉得自己必须参与进来,让这件事往好的方向发展。
总结
Boris的故事里最打动人的一点是:Claude Code不是一个精心规划的产品,而是一个人在终端里瞎试出来的东西。它成功的原因不是资源或规模,而是一系列反直觉的选择——用最简单的形态、为未来的模型能力做设计、让产品适应模型而非控制模型、故意保持团队精简以逼出创造力。
对于当下的从业者,他的建议非常明确:不要害怕工具,做一个通才,跨越学科边界。"软件工程师"这个身份正在消融,取而代之的是一个新物种——既能跟用户聊天、又能让AI写代码、还能做产品判断的builder。
核心归纳
Q1: Claude Code为什么选择终端而不是IDE?
最初是因为只有Boris一个人,终端开发最快。后来发现终端的极简架构有一个意外优势:模型进步太快了,其他更复杂的形态反而跟不上变化速度。这个被动选择最终成了正确的产品决策。
Q2: 普通人和团队现在最应该做的一件事是什么?
给工程师(和自己)尽可能多的token额度,鼓励他们用最强模型自由实验。不要在验证阶段就想着降本。Boris的原话逻辑是:一个工程师实验阶段的token费用相对于工资来说微不足道,但一旦验证出有效方案,回报是指数级的。
Q3: Boris判断"编程已被解决"的依据是什么?
他自己从2025年11月起100%的代码由Claude Code编写,没有手动编辑过一行。Anthropic内部工程师人均产出提升了200%,而此前在Meta时,数百人团队花一年才能提升几个百分点的生产力。他把编程类比为印刷术之前的手抄——不是消失了,而是被自动化了,人类的精力从执行转向了判断和创造。
发布于 美国
