默庵·超级个体 26-01-05 11:12
微博认证:微博新知博主 科技博主 头条文章作者 微博原创视频博主

28天做出App Store第一名:OpenAI产品负责人揭秘Codex爆发式增长背后的故事

一、一个让人震惊的数字

18 天开发,10 天后公开发布,28 天登顶 App Store 第一名。

这是 OpenAI 的 Sora Android 应用创造的速度记录。如果你觉得这个数字听起来有点夸张,那你可能还没意识到,这背后站着的是一个叫 Codex 的 AI 编程助手。

Alexander Embiricos 是 OpenAI Codex 的产品负责人。在最近的一次访谈中,他分享了一些让人重新思考 AI 时代的故事。这些故事不只是关于技术有多厉害,更多的是关于我们该如何与 AI 共事,以及这个世界正在以什么样的速度改变。

二、活在未来的公司

Alexander 在加入 OpenAI 之前,自己做了 5 年创业公司,也在 Dropbox 这样的大公司待过。他说,OpenAI 的速度和野心让他重新定义了什么叫快。

这话听起来有点像每个创业者都会说的场面话。毕竟谁不觉得自己公司动作快、人才强、目标大?但当你听到具体数字,就会明白他为什么这么说了。

Codex 从今年 8 月到现在,增长了 20 倍。每周服务的 tokens 数量是万亿级别。这个增长速度放在任何一家公司都算是疯狂的,但在 OpenAI,这似乎只是日常。

更夸张的是,他们现在做事的方式已经变了。Alexander 说,在 OpenAI 工作之后,他觉得自己回不去了。如果以后再去做产品,无论是什么领域,都必须达到这个速度和规模,否则就感觉在浪费时间。

这种心态的转变其实挺有意思。我们每个人在工作中都会有一些隐形的标准,比如什么叫做得好,什么叫做得快。但这些标准往往是基于我们过去的经验形成的。当你进入一个完全不同的环境,看到了新的可能性,那些旧标准就会被彻底打破。

三、一个过于超前的开始

Codex 最初的版本叫 Codex Cloud。这个产品的设计理念很前卫:它是一个云端的编程助手,你可以把任务委托给它,它会在云端的计算机上工作,你可以同时运行很多任务。

听起来很酷对吧?但问题是,这个产品太超前了。

想象一下,你新招了一个远程实习生,但你永远不能和他视频通话,只能通过邮件异步沟通。这个实习生可能很聪明,但你要给他布置任务,等他做完,再看结果,发现问题,再修改。这个流程走下来,效率其实并不高。

更关键的是,你需要给这个远程实习生配置环境。他需要访问哪些服务?需要什么权限?这些事情都要事先设置好。对于习惯了在本地开发的工程师来说,这个门槛实在太高了。

有意思的是,OpenAI 内部的人用得挺好。因为他们天天训练推理模型,已经习惯了这种先想清楚、大量并行运行、等待结果的工作方式。但对于外面的普通工程师来说,这种体验就太陌生了。

这个故事让我想到很多产品失败的原因。不是技术不够好,也不是方向不对,而是和用户现有的工作方式差得太远。用户需要跨越的鸿沟太大,就算产品再好,也很难被接受。

四、回到用户身边

意识到这个问题之后,Codex 团队做了一个关键的调整。他们把 Codex 做成了 IDE 扩展和命令行工具。

这个版本的 Codex 就在你的电脑上工作,在你的 VS Code 里运行。它可以访问你的代码库,可以在沙盒环境里执行命令,遇到不确定的事情还会直接问你。你们就像两个人坐在一起结对编程,可以实时反馈,可以快速迭代。

这个转变带来了爆发式的增长。从 8 月到现在,用户量翻了 20 倍。Codex 现在是 OpenAI 服务 token 数最多的编程模型,不仅在自家产品里,在 API 层面也是最受欢迎的编程模型。

这里有个很微妙的洞察。作为产品负责人,Alexander 说他们的目标确实是让 Codex 成为一个真正的队友,能够独立工作,能够主动发现问题。但他们意识到,你不能一上来就把用户扔到终局里。

就像你不可能刚认识一个人,就让他独自去完成重要的工作。你需要先和他一起工作,了解他的能力,建立信任,顺便把环境配置好。等到这些都完成了,才能慢慢放手让他独立承担更多。

五、从工具到队友的跨越

Codex 现在能做的事情已经很多了。它能回答代码问题,能写代码,能运行测试,能执行命令。基本上开发过程中那些琐碎的、重复的工作,它都能帮你搞定。

但 Alexander 说,这只是开始。他们想做的是一个真正的软件工程队友。

什么叫真正的队友?不只是你叫它干活它就干,而是它能参与整个开发生命周期。从最开始的需求讨论、任务规划,到中间的编码实现,再到最后的测试部署、维护监控,它都能参与。

他用了一个很生动的比喻。现在的 Codex 就像一个聪明的实习生,但它拒绝看 Slack 消息,也不会主动检查 Datadog 或者 Sentry 的报警。不管它多聪明,你敢让它独自去写代码吗?你肯定还是要盯着它。

但未来的 Codex 应该是什么样的?就像你新招了一个员工,刚开始你需要带着他,告诉他团队怎么工作,哪些事情重要,怎么和其他人沟通。然后你会给他一些简单的任务,看他怎么完成。慢慢地,你就可以把更复杂的任务交给他,甚至不用明确指派,他自己就能发现该做什么。

这种主动性,是 Codex 团队现在最关注的方向。

想想看,今天我们用 AI 产品,基本上都是主动去找它帮忙。你打开 ChatGPT,你问它问题,它才会回答。但如果 AI 真的聪明到可以当你的助手,它应该能够主动帮你。你不用时刻想着什么时候该用它,它应该随时准备好,在你需要的时候自动出现。

这个转变听起来简单,但实现起来非常难。因为这意味着 AI 需要理解你的工作上下文,需要知道什么时候该插手,什么时候该保持沉默。

六、编码:所有 AI Agent 的核心技能

Alexander 提出了一个很有意思的观点。他说,如果要做一个超级助手,它必须能够执行任务,能够做事情。而模型要做事情,最有效的方式就是使用计算机。

那模型应该怎么使用计算机呢?

你可以让它点击鼠标,但这样太慢,也不够可靠。你可以让它调用各种 API 和工具,但每个工具的接口都不一样,学习成本太高。

最好的方式,其实就是写代码。

这个结论乍一听有点反直觉。我们一直在说 AI 会取代编程,结果现在发现,AI 自己也需要通过编程来完成任务。

但仔细想想就会明白。代码是通用的、可组合的、可重用的。你写一段代码,可以随时调用。别人也可以用你写的代码。如果 AI 通过写代码来完成任务,那它做过的事情就可以被记录下来,被其他人或其他 AI 复用。

这就像人类社会的知识积累一样。我们不是每次都从零开始,而是站在前人的肩膀上。如果 AI 也能这样,那它的能力就会指数级增长。

所以 Alexander 说,也许未来所有的 AI Agent 都应该首先是一个编码 Agent。不管你要做什么,金融分析、数据处理、内容创作,如果能用代码解决,就应该用代码。

对于不懂编程的普通用户来说,他们甚至不需要知道 AI 在背后写代码。就像我们不需要知道互联网是怎么工作的,只需要知道 Wi-Fi 有没有连上就行了。

七、瓶颈在哪里

有一个问题现在变得越来越明显。以前工程师的瓶颈是写代码,现在瓶颈变成了审查 AI 写的代码。

这听起来像是个好消息,因为说明 AI 确实能帮忙写代码了。但对很多工程师来说,这其实挺痛苦的。

为什么?因为写代码是软件工程里最有创造性、最有趣的部分。而审查代码,尤其是审查 AI 写的代码,往往比较枯燥。你得一行一行看,确保它没有引入 bug,确保它符合团队的编码规范,确保它的逻辑是对的。

所以 Codex 团队现在在想办法解决这个问题。他们推出了代码审查功能,帮助你更快地建立对 AI 代码的信心。他们也在让 Agent 更擅长验证自己的工作,在提交代码之前先自己检查一遍。

还有一些更细节的设计。比如,当 Agent 完成一个网页开发任务时,你应该先看到网页的效果预览,还是先看到代码的 diff?答案是先看预览。因为如果预览就不对,你根本不需要去看代码。这样就能节省大量时间。

这些细节背后反映的是一个核心理念:AI 应该让人感觉更强大,而不是让人觉得自己被边缘化了。

这个理念其实适用于所有涉及人机协作的场景。当我们引入新工具、新技术的时候,不应该只想着它能替代人做什么,更应该想着它能让人做成什么以前做不成的事情。

八、OpenAI 的工作方式

Alexander 说,OpenAI 最让他震惊的是极度自下而上的工作方式。

很多公司也说自己自下而上,但 OpenAI 是真的自下而上。因为他们面对的问题太新了,没人知道什么会有用,什么不会有用。与其花时间做详细的规划,不如快速尝试,看看效果。

这种工作方式需要两个前提。第一是人才素质要非常高,每个人都要有极强的自驱力和判断力。第二是要接受失败,要允许试错。

Alexander 提到一个细节。在 OpenAI,他们可以很好地讨论一年以后的愿景,也可以很好地讨论几周或几个月内的具体工作。但是那种 6 个月到 1 年的中期规划,反而很难讨论清楚。

为什么?因为 AI 领域变化太快了。你很难预测半年后会有什么新能力出现,市场会有什么反应。与其花时间做不靠谱的规划,不如把精力放在更短期的执行和更长期的愿景上。

这种工作方式可能不适合所有公司。如果你的团队没有那么强的人才密度,如果你的业务不是那么快速变化,可能还是需要更多的规划和管理。但至少它提醒我们,在快速变化的环境里,灵活性比计划更重要。

九、AGI 还有多远

访谈的最后,Alexander 被问到一个所有人都关心的问题:我们离 AGI 还有多远?

他的回答很有意思。他说,现在真正的瓶颈可能是人类的打字速度和多任务处理能力。

这个回答乍一听有点奇怪。我们一直在担心 AI 能力不够,结果现在说瓶颈在人类身上?

但仔细想想确实如此。如果 AI 已经能够快速完成大量任务,但人类需要一个一个地去检查、去批准、去调整,那整体效率还是上不去。

这就回到了前面说的主动性问题。我们需要 AI 能够更独立地工作,而不是每一步都等待人类的指令。但这又涉及到信任问题。我们怎么知道 AI 不会犯错?怎么知道它理解了我们的意图?

Alexander 设想了一个挺科幻的未来场景。也许以后会有一个手机应用,就像 TikTok 和 Tinder 的结合体。AI 会主动给你推送它觉得应该做的任务,以竖屏视频的形式展示。你只需要左滑或右滑来决定要不要做这件事,如果想了解更多,就长按说话给 AI 反馈。

这个想法听起来有点荒诞,但它描绘的未来其实挺合理的。在 AI 能力足够强的情况下,人类的角色可能就是做决策,而不是做执行。我们的工作变成了不断地对 AI 的建议说 yes 或 no,偶尔给一些指导。

十、写在最后

这次访谈让我印象最深的,其实不是 Codex 有多厉害,而是 OpenAI 团队思考问题的方式。

他们没有沉浸在技术本身有多酷,而是一直在想用户需要什么,怎么让 AI 真正有用,怎么让人和 AI 的协作更顺畅。

从云端产品调整到本地工具,从被动响应到主动帮助,从独立工具到团队队友,这些转变背后都是对真实需求的深刻理解。

对于我们普通人来说,这个故事的启发可能不是去学怎么用 Codex,而是去思考在 AI 时代我们应该扮演什么角色。

我们不需要和 AI 竞争写代码的速度,也不需要和 AI 比拼记忆力。我们需要的是理解系统的架构,理解业务的本质,做出关键的判断,以及学会如何更好地和 AI 协作。

就像 Alexander 说的,未来的工程师应该是行动者。你要知道现在有什么工具可用,要能快速学会使用这些工具,然后用它们去完成以前完不成的事情。

这个世界正在以惊人的速度改变。18 天开发一个应用,28 天登顶榜单,这样的速度在几年前是不可想象的。而这仅仅是个开始。

我们站在一个巨大转折点上。选择跟上这个变化,还是被它甩在后面,可能就在一念之间。

#科技先锋官##AI创造营##微博年度新知博主#

发布于 山东