Harness Engineering 在硅谷彻底火了。
最近在海外 AI 圈子里,有一个词被频繁提起,叫 Harness Engineering。
可能有人会觉得,硅谷又在造新词了。
但我的观察是,这两年 AI 发展过程中,一个词突然火起来,背后往往是某种行业共识正在形成。所以理解这个词代表什么,还是挺重要的。
今天聊聊我的看法。
要是一句话总结的话,Harness Engineering 这个概念的出现,意味着模型本身的重要性在下降,而系统设计能力的重要性在快速上升。
这让我想起智能手机早期的故事。还记得吧,2012 年移动互联网刚爆发那会儿,智能手机发布会都在比硬件。每一场发布会都是参数大战。
但后来呢?硬件越过某个临界点之后,用户对这些参数已经无感了。因为够用了。
这两年苹果的 A 系列芯片越来越强,跑分越来越高,但对大多数人来说,完全无感。真正影响换机决策的,是整体的产品体验。
AI 正在经历同样的转变。过去两年,行业的注意力都在模型上。各家都在拼 benchmark 分数。
但从去年四季度开始,Benchmark 明显已经没那么重要了。因为大家觉得,更重要的是模型在实际场景中的表现。
什么是 Harness?
可以这样理解。模型是引擎,Harness 是围绕引擎造的那辆车。引擎马力再大,车本身不行,照样跑不动。
Harness Engineering 做的事情,说白了就是给 AI 搭工作环境、设计流程、建立规则、构建验证机制。http://t.cn/AXfFz3ZL
发布于 北京
