默庵·超级个体 26-05-19 20:42
微博认证:微博新知博主 科技博主 头条文章作者 微博原创视频博主

Andrej Karpathy 说过一句话:Claude 犯的错,90% 是因为上下文没给够,跟模型本身的能力没关系。

数据很直观。没有 CLAUDE.md 的时候,错误率 41%。加上 4 条基础规则,降到 11%。用下面这套 12 条规则,直接降到 3%。

这是资深工程师反复踩坑之后沉淀出来的东西。

1、写代码前先把假设说清楚。模型不会读心术,你不说,它就猜,猜就容易错。

2、简单优先,最少代码。别让 Claude 为了所谓的未来灵活性加东西,大概率多出 200 行下季度就要删的代码。

3、外科手术式修改,只动必须动的地方。别让它顺手优化旁边的代码,PR 膨胀就是这么来的。

4、先定义成功标准,再让它执行。没有明确的验证条件,Claude 要么无限循环,要么提前收工。

5、模型只用来做判断型任务。分类、草稿、总结、抽取,这些适合它。路由、重试、状态码处理、确定性转换,这些让代码来。代码能回答的问题,别问模型。

6、Token 预算是硬约束。单任务 4000,单会话 30000。调试到第 40 条消息的时候,Claude 会重新建议你在第 5 条消息就已经否掉的方案,因为它忘了。

7、代码库里有两种模式?选一种,别折中。Claude 把两种混在一起写,错误会被吞两次。

8、先读再写。先看 exports、调用方、共享工具。Claude 经常在一个已有相同函数的旁边,再加一个重复函数,就因为它没读到那个文件。

9、测试要验证意图,不只是验证行为。如果业务逻辑变了测试却不会挂,这个测试就是摆设。Claude 写的 12 个测试可能全部通过,哪怕函数实际只返回一个常量。

10、每个重要步骤都要 checkpoint。Claude 可能在第 4 步已经坏掉的状态上继续跑第 5 步、第 6 步,没人发现,浪费一小时。

11、匹配代码库约定。项目用 class components,就别默默改成 hooks。测试模式可能依赖 componentDidMount,hooks 会破坏它,但不一定马上暴露问题。

12、失败要大声喊出来。报告说成功完成,但 14% 的记录被静默跳过了,这是最糟糕的一类 bug。不确定的地方要暴露,不要藏。

真正能复利增长的东西,从来都跟下一个框架无关。

把 CLAUDE.md 当作跨会话的组织记忆来维护。改进要基于 eval 的结果,别凭感觉。重视 checkpoint,别一味追求速度。冲突要明确暴露出来,别静默混合。纪律永远比框架重要。一个仓库,一个规则文件,没有例外。

趁这件事还没变成大众共识,先把这几条规则用起来。

#科技先锋官##How I AI#

发布于 山东