AIGC·非著名程序员
26-06-26 11:14 微博认证:微博新知博主 科技博主 头条文章作者 微博原创视频博主

字节跳动技术副总裁洪定坤在火山引擎 Force 原动力大会上做了一场关于 AI Coding 的分享,内容很实在,聊的都是他们在真实业务里踩过的坑和摸索出来的经验。

过去一年,字节内部 AI 代码贡献率涨了 6 倍多,token 消耗涨了 5 倍,看起来数据很漂亮。但洪定坤很坦诚地说,数字好看不代表事情做得好,反而是用得越多,越能感受到挑战有多大。

他提了三个核心问题。第一个是指标陷阱。很多团队把"AI 代码贡献率"当成 KPI 去追,觉得 AI 写的代码越多越好。但他拿 TRAE 团队举例,90% 的代码都是 AI 写的,按理说效率应该提升好几倍,实际上人均需求吞吐只提升了 60%。中间的巨大落差说明,光看代码生成量根本衡量不了真实的效率提升。

第二个是 Vibe Coding 的问题。现在很流行那种"有想法就让 AI 写,跑一下能用就行"的开发方式,看起来很快。但他们做了个实验,用三个主流模型配三个框架,同一个需求跑了 900 次。功能正确率都能到 80% 以上,但一看可维护性、性能、兼容性这些维度,分数直接腰斩。也就是说,AI 写出来的东西能跑,但离真正能上线还差得远。后来他们加上了"Harness",就是上下文工程、架构约束、团队知识沉淀这些基础建设,可交付性从四五十分直接拉到了 80 分。所以感觉快了,如果基建没跟上,实际可能更慢。

第三个是协作问题。AI 让产品、设计、运营都能写代码了,这本身是好事,但不代表谁写出来就能直接上线。他举了个例子,一个产品同学用 AI 做了个功能,页面能跑流程也通,但研发一看,性能、安全、扩展性全有问题。所以真正的挑战是怎么让更多角色参与进来,同时保证产出能进入统一的工程规范和交付流程。

针对这些问题,他们的做法是:用原型驱动开发替代传统的文档驱动,先快速做出可交互的原型再讨论;让 AI 参与全流程,从写 Spec 到自动验证再到自动发布;把个人的 AI 使用经验沉淀成组织级的标准和工具,让整个团队都能受益。

最后他也提到 TRAE 的 token 日均消耗已经到了 5.6 万亿,比去年涨了 50 倍,用户也从工程师扩展到了非技术人群。他们推出了 TRAE Work,准备和火山引擎一起做企业版,深入企业场景去打磨。整体来看,AI Coding 还在很早期,没有标准答案,但方向已经很清楚了:光追求"用了多少 AI"没用,关键是让 AI 真正融入工程体系,带来全局效率的提升。

#科技先锋官##How I AI#

发布于 山东