完整版: Sam Altman主旨演讲| OpenAI开发者日2025
奥特曼在开场所言,这次活动的核心议题是:“让使用人工智能进行构建变得更加容易。”
核心观点摘要
“人工智能已经从人们玩乐的东西变成了人们每天构建的东西。”
“我们正在进入一个改变软件编写方式的新时代。任何有想法的人都可以为自己、家人或社区构建应用程序。”
“我们希望从个人开发者到大型企业,每个人都能从中(AgentKit)获得很多价值。”
“如今,OpenAI几乎所有新编写的代码都由Codex用户编写。我们使用Codex的工程师每周完成的pull request数量增加70%。”
“构建软件曾经需要数月甚至数年,现在只需要几分钟。要用人工智能来构建,你不需要一个庞大的团队,只需要一个好主意。”
“现在唯一的限制是你的想象力。”
1、开启ChatGPT“应用商店”时代:Apps SDK
OpenAI的第一个重磅发布,瞄准了其拥有数亿用户的旗舰产品——ChatGPT。官方正式向开发者开放ChatGPT,推出了Apps SDK,意图将其打造成为一个类似于苹果App Store的全新生态平台。“这将催生新一代的交互式、自适应和个性化的应用程序,大家可以通过聊天方式使用它们。”
这一举措意味着开发者不再仅仅是API的调用者,而是可以直接在ChatGPT内部构建拥有完整前端UI和后端逻辑的原生应用。通过Apps SDK,应用可以连接数据、触发外部操作,并渲染完全交互式的界面。
现场演示生动地展示了其潜力。Coursera应用让用户可以在观看教学视频的同时,直接向ChatGPT提问视频中的内容,实现了“与应用对话”。Canva应用则能根据对话内容,即时生成符合要求的设计海报和演示文稿。而Zillow应用更是将房产搜索、筛选、地图浏览等复杂体验无缝嵌入到对话流中。
对于开发者而言,这不仅仅是一个新的技术栈,更是一个巨大的分发渠道。OpenAI承诺,“当大家使用Apps SDK构建时,大家的应用程序可以覆盖数亿Chat GPT用户。” 同时,平台将支持多种盈利模式,包括未来的“代理商务协议”,允许在ChatGPT内实现即时结账。这无疑是在宣告一个以对话为核心的全新应用生态的诞生。
2、从原型到生产:AgentKit赋能“智能体”开发
如果说Apps SDK是构建“人机交互”的新界面,那么AgentKit则是打造“自主任务”执行者的核心引擎。OpenAI观察到,尽管业界对AI代理(Agent)充满期待,但实际上很少有代理能够投入生产和大规模使用,其背后的复杂性——如编排、评估、工具连接和UI构建——让许多开发者望而却步。
为了解决这一痛点,OpenAI推出了AgentKit,一个旨在将代理开发从原型快速推向生产环境的“全家桶”工具集。它包含三大核心组件:
• • AgentBuilder:一个可视化的画布,开发者可以通过拖拽节点的方式,无需编写大量代码即可设计、测试和发布代理的逻辑流程。
• • ChatKit:一个可轻松嵌入任何应用的可定制聊天界面,开发者可以融入自己的品牌和工作流。
• • 代理评估(Evals):一套专门用于衡量代理性能的工具,包括决策追踪、数据集评估和自动提示优化。
零售巨头艾伯森(Albertsons)和客户平台HubSpot的案例,展示了AgentKit的商业价值。艾伯森利用它构建了一个商业分析代理,当冰淇淋销量下降时,代理能自动分析季节性、历史趋势等所有相关数据,并给出调整建议,将过去漫长的报告流程压缩为一次简单的提问。
为了展示AgentKit的开发速度,OpenAI的工程师克里斯蒂娜在现场发起了一项挑战:在8分钟内为开发者日网站构建并部署一个交互式AI代理。她通过可视化的AgentBuilder,迅速连接了分类器、会话代理、文件搜索工具、安全护栏,并自定义了视觉小部件。最终,在倒计时结束前,一个名为“问问弗罗伊”的AI助手成功上线,现场观众可以立即扫码体验。“仅仅几分钟内,我们就以可视化的方式设计了一个代理工作流程……现在你们都可以使用它了。” 这一演示有力地证明了AgentKit正在极大地降低构建复杂AI代理的门槛。
3、 重塑软件工程:Codex与GPT-5 Codex的进化
本次发布会的高潮,无疑是关于软件工程未来的演示。OpenAI宣布其AI编程助手Codex正式结束研究预览,进入正式发布(GA)阶段。更重要的是,它现在由一个专门为编码任务训练的全新模型——GPT-5 Codex——驱动。
Codex已经深度融入OpenAI自身的开发流程。一组惊人的内部数据显示:“如今,OpenAI几乎所有新编写的代码都由Codex用户编写。我们使用Codex的工程师每周完成的pull request数量增加70%,而且几乎每个OpenAI的PR都经过Codex的审查。” 现场演示将这一理念推向了极致。工程师通过自然语言,指挥Codex完成了一系列令人瞠目结舌的任务。首先,他要求Codex创建一个控制面板来操作舞台上方的索尼摄像机,Codex不仅搭建了界面,还自主学习了拥有30多年历史的VSCA协议,并生成了连接摄像头的Node服务器代码。
随后,任务难度升级:
1. 1. 连接Xbox手柄控制摄像头:Codex自动制定计划、浏览文件并完成了集成。
2. 2. 通过语音控制全场灯光:工程师要求Codex连接到一个MCP服务器来控制场馆的照明系统。Codex在执行过程中甚至能自主发现需要额外信息,并主动去GitHub查找相关文档来解决问题,展现了惊人的类代理行为。
3. 3. 实时编程、动态修改:最令人震撼的一幕是,工程师通过语音指令,要求Codex“显示一个像电影结尾那样的演职员表叠加层,但演员是所有参会者”。借助新发布的Codex SDK,语音代理接收到指令后,竟然实时修改了当前应用的React代码,自动重新加载,并在屏幕上滚动播放出演职员表。
“为了实现这个,我仍然没有写一行代码,” 演示者总结道。这不仅仅是代码补全,而是AI作为一个不知疲倦、理解上下文并能自主解决问题的“队友”,正在从根本上改变软件的创建过程。
4、底层引擎全面升级:GPT-5 Pro与Sora 2开放API
支撑这一切上层应用的,是OpenAI强大的基础模型。此次,OpenAI也带来了多项关键的模型API更新:
• • GPT-5 Pro:正式在API中发布。该模型**“非常适合协助完成非常困难的任务,在金融、法律、医疗保健等领域,以及更多需要高准确性和深度推理的领域。”** 这为需要顶级智能的专业应用提供了新的动力。
• • GPT Realtime Mini:一款更小、更经济的语音模型,价格比之前的版本便宜70%,但保持了同样高质量的语音和表现力,旨在推动语音成为人机交互的主流方式。
• • Sora 2 API:备受瞩目的文生视频模型Sora的升级版正式开放API预览。Sora 2最大的飞跃在于其**“可控性”**,能够遵循详细指令,并完美结合声音与视觉效果,包括同步的音景和环境音频。它甚至可以将真实世界的片段(如一张狗的照片)无缝融入生成的视频中。
玩具巨头美泰(Mattel)的合作案例展示了Sora 2在创意工作流中的颠覆性。设计师可以从一张草图开始,利用Sora 2迅速将其转化为可供分享和反馈的动态产品概念视频。“用人工智能观看创意如何快速转化为可分享、可行的设计,真是令人难以置信。”
从Apps SDK的生态构想,到AgentKit的智能体工厂,再到Codex的软件工程革命,以及底层模型的全面进化,OpenAI正在全方位加速AI的应用落地。正如其在活动结尾所强调的,一个全新的构建时代已经到来。在这个时代里,“构建软件曾经需要数月甚至数年,现在只需要几分钟。” 对于全球数百万开发者和创业者而言,唯一的限制,或许真的只剩下他们的想象力了。
http://t.cn/AXzZ7Hy8
发布于 广东
