洪定坤谈AI Coding挑战

字节跳动技术副总裁洪定坤在火山引擎 Force 原动力大会上做了一场关于 AI Coding 的分享，内容很实在，聊的都是他们在真实业务里踩过的坑和摸索出来的经验。

过去一年，字节内部 AI 代码贡献率涨了 6 倍多，token 消耗涨了 5 倍，看起来数据很漂亮。但洪定坤很坦诚地说，数字好看不代表事情做得好，反而是用得越多，越能感受到挑战有多大。

他提了三个核心问题。第一个是指标陷阱。很多团队把"AI 代码贡献率"当成 KPI 去追，觉得 AI 写的代码越多越好。但他拿 TRAE 团队举例，90% 的代码都是 AI 写的，按理说效率应该提升好几倍，实际上人均需求吞吐只提升了 60%。中间的巨大落差说明，光看代码生成量根本衡量不了真实的效率提升。

第二个是 Vibe Coding 的问题。现在很流行那种"有想法就让 AI 写，跑一下能用就行"的开发方式，看起来很快。但他们做了个实验，用三个主流模型配三个框架，同一个需求跑了 900 次。功能正确率都能到 80% 以上，但一看可维护性、性能、兼容性这些维度，分数直接腰斩。也就是说，AI 写出来的东西能跑，但离真正能上线还差得远。后来他们加上了"Harness"，就是上下文工程、架构约束、团队知识沉淀这些基础建设，可交付性从四五十分直接拉到了 80 分。所以感觉快了，如果基建没跟上，实际可能更慢。

第三个是协作问题。AI 让产品、设计、运营都能写代码了，这本身是好事，但不代表谁写出来就能直接上线。他举了个例子，一个产品同学用 AI 做了个功能，页面能跑流程也通，但研发一看，性能、安全、扩展性全有问题。所以真正的挑战是怎么让更多角色参与进来，同时保证产出能进入统一的工程规范和交付流程。

针对这些问题，他们的做法是：用原型驱动开发替代传统的文档驱动，先快速做出可交互的原型再讨论；让 AI 参与全流程，从写 Spec 到自动验证再到自动发布；把个人的 AI 使用经验沉淀成组织级的标准和工具，让整个团队都能受益。

最后他也提到 TRAE 的 token 日均消耗已经到了 5.6 万亿，比去年涨了 50 倍，用户也从工程师扩展到了非技术人群。他们推出了 TRAE Work，准备和火山引擎一起做企业版，深入企业场景去打磨。整体来看，AI Coding 还在很早期，没有标准答案，但方向已经很清楚了：光追求"用了多少 AI"没用，关键是让 AI 真正融入工程体系，带来全局效率的提升。

#科技先锋官##How I AI#

发布于山东