完整版: Sam Altman主旨演讲| OpenAI开发者日2025奥特曼在开场所言，这次活动的核心议题是：“让使用人工智能进行构建变得更加容易。”核心观点摘要“人工智能已经从人们玩乐的东西变成了人们每天构建的东西。”“我们正在进入一个改变软件编写方式的新时代。任何有想法的人都可以为自己、家人或社

完整版: Sam Altman主旨演讲| OpenAI开发者日2025
奥特曼在开场所言，这次活动的核心议题是：“让使用人工智能进行构建变得更加容易。”
核心观点摘要
“人工智能已经从人们玩乐的东西变成了人们每天构建的东西。”
“我们正在进入一个改变软件编写方式的新时代。任何有想法的人都可以为自己、家人或社区构建应用程序。”
“我们希望从个人开发者到大型企业，每个人都能从中（AgentKit）获得很多价值。”
“如今，OpenAI几乎所有新编写的代码都由Codex用户编写。我们使用Codex的工程师每周完成的pull request数量增加70%。”
“构建软件曾经需要数月甚至数年，现在只需要几分钟。要用人工智能来构建，你不需要一个庞大的团队，只需要一个好主意。”
“现在唯一的限制是你的想象力。”

1、开启ChatGPT“应用商店”时代：Apps SDK
OpenAI的第一个重磅发布，瞄准了其拥有数亿用户的旗舰产品——ChatGPT。官方正式向开发者开放ChatGPT，推出了Apps SDK，意图将其打造成为一个类似于苹果App Store的全新生态平台。“这将催生新一代的交互式、自适应和个性化的应用程序，大家可以通过聊天方式使用它们。”
这一举措意味着开发者不再仅仅是API的调用者，而是可以直接在ChatGPT内部构建拥有完整前端UI和后端逻辑的原生应用。通过Apps SDK，应用可以连接数据、触发外部操作，并渲染完全交互式的界面。
现场演示生动地展示了其潜力。Coursera应用让用户可以在观看教学视频的同时，直接向ChatGPT提问视频中的内容，实现了“与应用对话”。Canva应用则能根据对话内容，即时生成符合要求的设计海报和演示文稿。而Zillow应用更是将房产搜索、筛选、地图浏览等复杂体验无缝嵌入到对话流中。
对于开发者而言，这不仅仅是一个新的技术栈，更是一个巨大的分发渠道。OpenAI承诺，“当大家使用Apps SDK构建时，大家的应用程序可以覆盖数亿Chat GPT用户。” 同时，平台将支持多种盈利模式，包括未来的“代理商务协议”，允许在ChatGPT内实现即时结账。这无疑是在宣告一个以对话为核心的全新应用生态的诞生。

2、从原型到生产：AgentKit赋能“智能体”开发
如果说Apps SDK是构建“人机交互”的新界面，那么AgentKit则是打造“自主任务”执行者的核心引擎。OpenAI观察到，尽管业界对AI代理（Agent）充满期待，但实际上很少有代理能够投入生产和大规模使用，其背后的复杂性——如编排、评估、工具连接和UI构建——让许多开发者望而却步。
为了解决这一痛点，OpenAI推出了AgentKit，一个旨在将代理开发从原型快速推向生产环境的“全家桶”工具集。它包含三大核心组件：
• • AgentBuilder：一个可视化的画布，开发者可以通过拖拽节点的方式，无需编写大量代码即可设计、测试和发布代理的逻辑流程。
• • ChatKit：一个可轻松嵌入任何应用的可定制聊天界面，开发者可以融入自己的品牌和工作流。
• • 代理评估（Evals）：一套专门用于衡量代理性能的工具，包括决策追踪、数据集评估和自动提示优化。
零售巨头艾伯森（Albertsons）和客户平台HubSpot的案例，展示了AgentKit的商业价值。艾伯森利用它构建了一个商业分析代理，当冰淇淋销量下降时，代理能自动分析季节性、历史趋势等所有相关数据，并给出调整建议，将过去漫长的报告流程压缩为一次简单的提问。
为了展示AgentKit的开发速度，OpenAI的工程师克里斯蒂娜在现场发起了一项挑战：在8分钟内为开发者日网站构建并部署一个交互式AI代理。她通过可视化的AgentBuilder，迅速连接了分类器、会话代理、文件搜索工具、安全护栏，并自定义了视觉小部件。最终，在倒计时结束前，一个名为“问问弗罗伊”的AI助手成功上线，现场观众可以立即扫码体验。“仅仅几分钟内，我们就以可视化的方式设计了一个代理工作流程……现在你们都可以使用它了。” 这一演示有力地证明了AgentKit正在极大地降低构建复杂AI代理的门槛。

3、重塑软件工程：Codex与GPT-5 Codex的进化
本次发布会的高潮，无疑是关于软件工程未来的演示。OpenAI宣布其AI编程助手Codex正式结束研究预览，进入正式发布（GA）阶段。更重要的是，它现在由一个专门为编码任务训练的全新模型——GPT-5 Codex——驱动。
Codex已经深度融入OpenAI自身的开发流程。一组惊人的内部数据显示：“如今，OpenAI几乎所有新编写的代码都由Codex用户编写。我们使用Codex的工程师每周完成的pull request数量增加70%，而且几乎每个OpenAI的PR都经过Codex的审查。” 现场演示将这一理念推向了极致。工程师通过自然语言，指挥Codex完成了一系列令人瞠目结舌的任务。首先，他要求Codex创建一个控制面板来操作舞台上方的索尼摄像机，Codex不仅搭建了界面，还自主学习了拥有30多年历史的VSCA协议，并生成了连接摄像头的Node服务器代码。
随后，任务难度升级：
1. 1. 连接Xbox手柄控制摄像头：Codex自动制定计划、浏览文件并完成了集成。
2. 2. 通过语音控制全场灯光：工程师要求Codex连接到一个MCP服务器来控制场馆的照明系统。Codex在执行过程中甚至能自主发现需要额外信息，并主动去GitHub查找相关文档来解决问题，展现了惊人的类代理行为。
3. 3. 实时编程、动态修改：最令人震撼的一幕是，工程师通过语音指令，要求Codex“显示一个像电影结尾那样的演职员表叠加层，但演员是所有参会者”。借助新发布的Codex SDK，语音代理接收到指令后，竟然实时修改了当前应用的React代码，自动重新加载，并在屏幕上滚动播放出演职员表。
“为了实现这个，我仍然没有写一行代码，” 演示者总结道。这不仅仅是代码补全，而是AI作为一个不知疲倦、理解上下文并能自主解决问题的“队友”，正在从根本上改变软件的创建过程。

4、底层引擎全面升级：GPT-5 Pro与Sora 2开放API
支撑这一切上层应用的，是OpenAI强大的基础模型。此次，OpenAI也带来了多项关键的模型API更新：
• • GPT-5 Pro：正式在API中发布。该模型**“非常适合协助完成非常困难的任务，在金融、法律、医疗保健等领域，以及更多需要高准确性和深度推理的领域。”** 这为需要顶级智能的专业应用提供了新的动力。
• • GPT Realtime Mini：一款更小、更经济的语音模型，价格比之前的版本便宜70%，但保持了同样高质量的语音和表现力，旨在推动语音成为人机交互的主流方式。
• • Sora 2 API：备受瞩目的文生视频模型Sora的升级版正式开放API预览。Sora 2最大的飞跃在于其**“可控性”**，能够遵循详细指令，并完美结合声音与视觉效果，包括同步的音景和环境音频。它甚至可以将真实世界的片段（如一张狗的照片）无缝融入生成的视频中。
玩具巨头美泰（Mattel）的合作案例展示了Sora 2在创意工作流中的颠覆性。设计师可以从一张草图开始，利用Sora 2迅速将其转化为可供分享和反馈的动态产品概念视频。“用人工智能观看创意如何快速转化为可分享、可行的设计，真是令人难以置信。”

从Apps SDK的生态构想，到AgentKit的智能体工厂，再到Codex的软件工程革命，以及底层模型的全面进化，OpenAI正在全方位加速AI的应用落地。正如其在活动结尾所强调的，一个全新的构建时代已经到来。在这个时代里，“构建软件曾经需要数月甚至数年，现在只需要几分钟。” 对于全球数百万开发者和创业者而言，唯一的限制，或许真的只剩下他们的想象力了。
http://t.cn/AXzZ7Hy8

发布于广东