Claude Sonnet 4.5 如何能“连续作战”30小时，完成类似Slack这样的大型应用？🤯Carlos E. Perez 深度拆解了其“秘密武器”——系统提示词（prompt）设计，揭秘了大模型如何稳健构建万行代码级别的复杂应用：1. 模块化产出持久工件超过20行代码必须作为“工件”输出，且一条回复只能产出一个

Claude Sonnet 4.5 如何能“连续作战”30小时，完成类似Slack这样的大型应用？🤯

Carlos E. Perez 深度拆解了其“秘密武器”——系统提示词（prompt）设计，揭秘了大模型如何稳健构建万行代码级别的复杂应用：

1. 模块化产出持久工件
超过20行代码必须作为“工件”输出，且一条回复只能产出一个工件。模型通过追加式写入，避免上下文截断，保证大项目代码全貌。

2. 迭代更新 vs 重写流程
明确区分小改动（≤20行）和结构性重写，安全演进11k行代码，长期保持状态不丢失。

3. 运行时限制保证稳定
禁止localStorage/sessionStorage，要求内存状态管理，封锁HTML表单，确保React沙盒环境多小时迭代不崩溃。

4. 依赖与打包白名单
限定工件类型和导入规则（单文件HTML、React组件、CDN），防止工具链漂移，顺利搭建认证、频道、消息等功能模块。

5.“研究模式”支持产品级任务
设计≥5次的工具调用循环，结合规划-调研-构建流程，满足Slack般复杂协议、UI、presence模型的多轮查询。

6. 工具使用治理
模型被引导用工具调查事实，避免盲猜，提高框架、存储方案选择的准确性。

7.“思考-执行”模式切换
先规划（Deliberation），再执行（Action），用户控制节奏，防止半成品代码泛滥，保持开发节奏稳定。

8. 长远规划与反馈循环
借鉴Voyager、Generative Agents架构，结合状态、工具调用、反思、计划，支持模型数十小时持续进展。

9. 完整对话状态传递
每次调用都带完整历史和状态，保证聊天应用UI、presence、消息历史在多轮生成中一致。

10. 错误处理与上下文清理
内置“错误仪式”和“幽灵上下文清理”，遇到集成错误自动重试，保持构建过程稳健。

11. 采用成熟主流技术栈
推荐React、Flask、REST等文档齐全的框架，明确UI与API分层，提升开发效率和正确率。

12.“Claude-in-Claude”自我协作
允许工件内调用LLM API，自生成开发辅助工具（如代码助手、迁移器），自动提升自身能力。

13. 机器可解析输出
严格JSON格式支持自动化测试和持续集成，实现无人值守的长时迭代。

总结：这些设计让Claude Sonnet 4.5在沙盒环境中，借助模块化输出、迭代更新、合理规划与工具治理，实现了构建万行代码级Slack类应用的可能性，真正突破了大规模代码生成的瓶颈。

这不仅是一次技术突破，更为未来持续、复杂的AI驱动软件开发树立了范式。期待更多领域借鉴这些模式，推动智能自动化进入新阶段。

原文链接：x.com/IntuitMachine/status/1972793278744461627

---

💡思考：
- 持续状态管理和迭代更新是长时AI项目的核心挑战。
- 结合工具治理与规划分离，有效防止模型“胡乱生成”。
- 这种方法论对复杂系统构建、教育课程设计等多领域都有启发意义。
- 未来AI不只是帮写代码，更能自主演进、优化开发流程。

发布于北京