Claude Code发展历程解析

#模型时代# Claude Code创造者：给团队更少的人，但是给每个人无限的Token

Anthropic的Claude Code负责人Boris Cherny最近又出来做了一系列访谈，不知道是不是为了对冲一下OpenClaw创始人Peter说他更喜欢CodeX胜过Claude Code。但是，Boris Cherny自己说并不太关心竞品。这期笔记来自Lenny's Podcast。

对了，非常有趣的一件事儿，Lenny让Boris推荐几本书，Boris的书单之一是刘慈欣的《流浪的地球》短篇集。

Claude Code虽然现在是Anthropic的王牌产品，但是它和Google的Gmail一样，是一个副业项目。Boris Cherny是这个产品从零到一的创造者。一年前，他一个人在终端里写了个原型，内部发布时只收到两个点赞。一年后，Claude Code已经贡献了全球GitHub上4%的公开代码提交量，仅过去一个月日活就翻了一倍。Semi Analysis预测到今年底这个数字会达到五分之一。

Boris本人从2025年11月起，也没有手动编辑过一行代码，每天通过Claude Code提交10到30个PR。

一、一个"没人看好"的产品是怎么长起来的

Claude Code的起源非常偶然。Boris加入Anthropic后，先花了一个月做各种原型（大部分没有上线），又花一个月做post-training（后训练）研究来理解模型能力边界。然后他开始做一个终端工具，当时叫Claude CLI。

1、第一个让他震惊的时刻

他给模型一个bash工具，然后随口问"我现在在听什么音乐？"模型自己想办法调用系统命令，查到了正在播放的歌曲。没有任何人教它这么做。"模型拿到工具后，自己想出了如何用它来回答一个我都不确定它能回答的问题。"

2、内部发布只拿到两个点赞

Boris在内部宣布这个项目时，反响极其冷淡。原因很简单：大家对coding tool的心理模型是IDE，没人觉得一个终端工具能成事。但终端之所以成为最终形态，是因为当时只有Boris一个人，终端是最快的构建方式。

后来团队讨论是否换成其他形态，最终决定继续留在终端。核心原因是：模型进步太快了，没有其他形态能跟上这个速度。终端的极简架构反而成了优势。

3、外部发布也不是一夜爆红

2025年2月对外发布后，有一批早期用户，但大多数人并不理解这个产品是干什么的。"它太不一样了，你必须保持开放心态去学习怎么用它。"真正的爆发点在Opus 4发布之后，增长曲线变成了指数级，而且一直在加速，每天都比前一天更陡。

二、产品决策背后的底层逻辑

Boris在播客中反复提到几个产品原则，这些原则贯穿了Claude Code和Cowork的整个开发历程。

1、Latent Demand（潜在需求）：看人们怎么"滥用"你的产品

这是Boris认为产品领域最重要的原则。他举了两个经典案例：Facebook Marketplace诞生于一个发现——40%的Facebook群组帖子是买卖东西。Facebook Dating的灵感来自另一个数据——60%的非好友异性间的主页浏览量。

用在Claude Code上：团队发现大量用户用Claude Code做的事情跟编程毫无关系。有人用它种番茄，有人分析自己的基因组数据，有人恢复损坏硬盘里的婚礼照片，还有人用它分析MRI影像。这些人在终端里绕了一大圈，就为了让AI帮他们干活。"当你看到人们这样折腾你的产品时，答案就很明显了：给他们一个专门的产品。" 这就是Cowork的起源。

还有一个更新的变体：不只是观察用户想做什么，还要观察模型想做什么。Claude Code的设计理念是把模型本身当作产品，给它最少的脚手架和工具，让它自己决定调用什么、以什么顺序执行。在研究领域这叫"on distribution"（在分布上），在产品领域就是对模型的潜在需求做响应。

2、The Bitter Lesson（苦涩的教训）：永远押注更通用的模型

Rich Sutton十年前那篇博文的核心观点是：更通用的模型长期总会胜过更专用的模型。Boris把这个原则应用得很彻底——不要用小模型，不要做fine-tune（微调），不要搭复杂的workflow（工作流）和orchestrator（编排器）。

"Scaffolding（脚手架）可能带来10%到20%的性能提升，但这些提升往往在下一个模型发布时就被抹平了。"给模型工具和目标，让它自己搞定，几乎总是比精心设计的流程更有效。

3、为六个月后的模型做产品

Claude Code最早的版本只能写Boris大约20%的代码，五月份也就30%左右。一直到11月才达到100%。Boris从一开始就在为未来的模型能力做产品设计。

"你的产品前六个月product-market fit会很差，但当那个更强的模型发布时，你会直接起飞。"这是他给创业者最核心的建议之一。

三、团队管理的反直觉操作

1、适度"欠资源"比资源充足更好

Boris的团队刻意让项目处于轻微欠资源的状态。比如一个项目只放一个工程师。这迫使工程师必须借助Claude来自动化工作，反而激发了更多创新。"如果你招到优秀的工程师，他们会自己想办法的。尤其是当你赋予他们使用AI的权限时。"

这个逻辑跟通常的理解相反：AI不只是让你用更少的人做同样的事，而是人少的时候反而能从AI中获得更多。

2、给工程师无限的token

Boris对各种CTO的建议是：一开始不要想着优化成本。先给工程师尽可能多的token额度，让他们自由实验。Anthropic内部每个人都可以大量使用token，一些外部公司也开始把"无限token"作为招聘福利。

"有些工程师一个月花掉几十万美元的token费用。"听起来疯狂，但对比工程师薪资和产出，这笔账算得过来。优化token消耗的时机是——先验证想法可行，规模化之后再降本。

3、鼓励每个人都写代码

在Claude Code团队里，产品经理写代码，工程经理写代码，设计师写代码，数据科学家写代码，甚至财务人员也写代码。Boris认为未来最有竞争力的人才是跨学科的通才——比如懂设计的工程师，懂商业的产品经理，喜欢跟用户聊天的技术负责人。

"到今年底，'软件工程师'这个头衔会开始消失，取而代之的是'builder'。或者反过来说，每个人都是产品经理，每个人都写代码。"

四、"编程已被解决"之后会发生什么

这是Boris在播客中最直接的判断。

1、编程作为一门技能的未来

Boris的类比是印刷术。15世纪中叶，欧洲识字率不到1%，只有抄写员能读写。古腾堡印刷术发明后的50年里，印刷品的产出超过了此前1000年的总和。但识字率的普及花了200年。

"我想象一个几年后的世界，每个人都能编程。这会释放什么？任何人可以随时构建软件。就像15世纪的人无法预测印刷术最终会带来什么一样。"

他还找到一份历史文献，记录了一位15世纪抄写员对印刷术的态度：这位抄写员其实很兴奋，因为他最不喜欢的工作是抄书，最喜欢的是画插图和装帧。Boris说自己的感受非常类似——不用再处理代码的琐碎细节，终于可以把时间花在真正重要的事上：想清楚要做什么，跟用户交流，思考系统架构。

2、下一个受冲击的职业群体

编程之后，Boris认为冲击会扩展到所有"在电脑上完成的工作"——产品经理、设计师、数据科学家都在射程范围内。Cowork就是面向非技术人群的第一个agentic AI（能动型AI）产品。

一个有趣的数据：Lenny做了一个非正式调查，70%的工程师和PM说AI让他们更享受工作了，但设计师只有55%。原因可能是设计师目前从agentic AI中获得的赋能还不够直观。

3、Claude Code现在已经能自己提出工作建议

Claude Code会浏览反馈频道、查看bug报告、分析遥测数据，然后主动提出修复建议甚至直接提交PR。"它开始有点像一个同事了。"

五、使用Claude Code的实操技巧

Boris强调没有唯一正确的用法，但分享了几个他个人觉得非常有用的习惯。

1、永远用最强的模型

目前就是Opus 4.6，并且打开maximum effort（最大努力模式）。反直觉的地方在于：用便宜模型看似省钱，但因为智能程度低，需要更多轮对话和修正，实际token消耗可能更高。用最强模型反而更快、更省。

2、80%的任务先进Plan Mode（规划模式）

操作很简单，终端里按两次Shift+Tab就行。技术上也很简单，就是在prompt里加一句"先别写代码"。模型会先跟你来回讨论方案，方案确认后再执行。Boris说用Opus 4.6的Plan Mode，几乎每次都能一次性写对。

3、多平台并行使用

Boris现在三分之一的编程在终端完成，三分之一在桌面应用，三分之一竟然是在iOS手机App上。"我早上醒来第一件事就是打开手机上的Claude Code，让agent去验证昨晚的代码是否正确。"

他通常同时运行五个agent，处理不同的任务。这种multi-quading（多Claude并行）的工作方式已经成为他的日常。

六、安全：Anthropic为什么存在

Boris在播客中多次把话题拉回安全。他离开Cursor两周后回到Anthropic的原因就是：使命感。"在Anthropic的走廊里随便拦一个人问为什么在这儿，答案永远是安全。"

1、三层安全体系
• 第一层：对齐与可解释性。 Anthropic的Mechanistic Interpretability（机械可解释性）技术现在已经能追踪模型中特定神经元的激活状态，比如跟"欺骗"相关的神经元。模型中的一个神经元可能对应十几个概念（这叫superposition，叠加态），多个神经元协同工作时代表更复杂的概念。
• 第二层：实验室评测。在受控环境中给模型设置各种场景，观察它是否表现安全。
• 第三层：真实世界观察。模型越复杂，前两层表现良好不代表在野外也安全。Claude Code在内部测试了四五个月才对外发布，就是为了在真实使用场景中研究安全问题。

2、Race to the Top（向上竞赛）

Anthropic开源了Claude Code的沙箱环境，这个沙箱不只兼容Claude Code，任何agent都能用。目的是降低其他团队做安全工作的门槛，让整个行业一起往安全的方向走。

七、个人生活与思维方式

Boris在加入Anthropic之前住在日本农村，是镇上唯一的工程师，也是唯一的英语使用者。他每周骑车去农贸市场，路过稻田，跟邻居交换自制味噌和泡菜。

他做味噌做得相当不错。白味噌至少要三个月，红味噌需要两到四年。"它教你用长时间尺度思考，跟工程完全不同。混合好原料之后，你只能等。"

被问到AGI之后打算干什么，他说：大概会去做味噌吧。

而他之所以离开日本加入Anthropic，恰恰是因为在那段慢节奏的生活里读了大量科幻小说，开始以长时间尺度思考AI的未来走向，觉得自己必须参与进来，让这件事往好的方向发展。

总结

Boris的故事里最打动人的一点是：Claude Code不是一个精心规划的产品，而是一个人在终端里瞎试出来的东西。它成功的原因不是资源或规模，而是一系列反直觉的选择——用最简单的形态、为未来的模型能力做设计、让产品适应模型而非控制模型、故意保持团队精简以逼出创造力。

对于当下的从业者，他的建议非常明确：不要害怕工具，做一个通才，跨越学科边界。"软件工程师"这个身份正在消融，取而代之的是一个新物种——既能跟用户聊天、又能让AI写代码、还能做产品判断的builder。

核心归纳

Q1: Claude Code为什么选择终端而不是IDE？
最初是因为只有Boris一个人，终端开发最快。后来发现终端的极简架构有一个意外优势：模型进步太快了，其他更复杂的形态反而跟不上变化速度。这个被动选择最终成了正确的产品决策。

Q2: 普通人和团队现在最应该做的一件事是什么？
给工程师（和自己）尽可能多的token额度，鼓励他们用最强模型自由实验。不要在验证阶段就想着降本。Boris的原话逻辑是：一个工程师实验阶段的token费用相对于工资来说微不足道，但一旦验证出有效方案，回报是指数级的。

Q3: Boris判断"编程已被解决"的依据是什么？
他自己从2025年11月起100%的代码由Claude Code编写，没有手动编辑过一行。Anthropic内部工程师人均产出提升了200%，而此前在Meta时，数百人团队花一年才能提升几个百分点的生产力。他把编程类比为印刷术之前的手抄——不是消失了，而是被自动化了，人类的精力从执行转向了判断和创造。

发布于美国