爱可可-爱生活 25-09-30 16:30
微博认证:AI博主 2025微博新锐新知博主

Claude Sonnet 4.5 如何能“连续作战”30小时,完成类似Slack这样的大型应用?🤯

Carlos E. Perez 深度拆解了其“秘密武器”——系统提示词(prompt)设计,揭秘了大模型如何稳健构建万行代码级别的复杂应用:

1. 模块化产出持久工件
超过20行代码必须作为“工件”输出,且一条回复只能产出一个工件。模型通过追加式写入,避免上下文截断,保证大项目代码全貌。

2. 迭代更新 vs 重写流程
明确区分小改动(≤20行)和结构性重写,安全演进11k行代码,长期保持状态不丢失。

3. 运行时限制保证稳定
禁止localStorage/sessionStorage,要求内存状态管理,封锁HTML表单,确保React沙盒环境多小时迭代不崩溃。

4. 依赖与打包白名单
限定工件类型和导入规则(单文件HTML、React组件、CDN),防止工具链漂移,顺利搭建认证、频道、消息等功能模块。

5.“研究模式”支持产品级任务
设计≥5次的工具调用循环,结合规划-调研-构建流程,满足Slack般复杂协议、UI、presence模型的多轮查询。

6. 工具使用治理
模型被引导用工具调查事实,避免盲猜,提高框架、存储方案选择的准确性。

7.“思考-执行”模式切换
先规划(Deliberation),再执行(Action),用户控制节奏,防止半成品代码泛滥,保持开发节奏稳定。

8. 长远规划与反馈循环
借鉴Voyager、Generative Agents架构,结合状态、工具调用、反思、计划,支持模型数十小时持续进展。

9. 完整对话状态传递
每次调用都带完整历史和状态,保证聊天应用UI、presence、消息历史在多轮生成中一致。

10. 错误处理与上下文清理
内置“错误仪式”和“幽灵上下文清理”,遇到集成错误自动重试,保持构建过程稳健。

11. 采用成熟主流技术栈
推荐React、Flask、REST等文档齐全的框架,明确UI与API分层,提升开发效率和正确率。

12.“Claude-in-Claude”自我协作
允许工件内调用LLM API,自生成开发辅助工具(如代码助手、迁移器),自动提升自身能力。

13. 机器可解析输出
严格JSON格式支持自动化测试和持续集成,实现无人值守的长时迭代。

总结:这些设计让Claude Sonnet 4.5在沙盒环境中,借助模块化输出、迭代更新、合理规划与工具治理,实现了构建万行代码级Slack类应用的可能性,真正突破了大规模代码生成的瓶颈。

这不仅是一次技术突破,更为未来持续、复杂的AI驱动软件开发树立了范式。期待更多领域借鉴这些模式,推动智能自动化进入新阶段。

原文链接:x.com/IntuitMachine/status/1972793278744461627

---

💡思考:
- 持续状态管理和迭代更新是长时AI项目的核心挑战。
- 结合工具治理与规划分离,有效防止模型“胡乱生成”。
- 这种方法论对复杂系统构建、教育课程设计等多领域都有启发意义。
- 未来AI不只是帮写代码,更能自主演进、优化开发流程。

发布于 北京