OpenAI发布Sora 2模型

#OpenAI最新发布模型Sora2#
http://t.cn/AX7jBanx 北京时间10月1日凌晨（当地时间9月30日），OpenAI发布了新一代视频生成模型Sora 2，并同步推出iOS社交应用Sora（安卓版本仍在开发中）。这一发布标志着视频生成技术在多个方面取得显著进展，被OpenAI形容为视频生成领域的“GPT - 3.5时刻”。

模型特点

• 物理精准与逼真度提升：Sora 2在遵循物理定律方面表现出色，能让生成的视频更具真实感。例如，以往的视频生成模型在呈现“篮球运动员投篮未中”的场景时，可能会让篮球突然“瞬移”进篮筐；而Sora 2中，篮球会从篮板上弹开，符合真实物理轨迹。它还能处理复杂的动作场景，如捕捉奥运会体操动作、滑板特技、从跳板跃入水中的“炮弹式”跳水等，在模拟真实世界动态方面有很大进步。

• 音频生成能力：该模型首次支持与画面匹配的AI音频生成，可创建复杂的背景音景、语音和音效，并且具有高度的真实感，实现了画面与环境音、物体交互声及对话的匹配。

• 可控性增强：Sora 2在可控性方面有巨大飞跃，能够遵循跨越多个镜头的复杂指令，同时准确地保持世界状态的一致，还可以直接将现实世界的元素注入其中。

配套应用Sora

• “入镜”功能：用户可通过全新“入镜”（Cameo）功能，将自己或好友置入生成视频中。用户只需在应用中进行一次简短的音视频录制，即可验证身份并捕捉相似之处，然后以极高的保真度将自己或他人置身于任何Sora生成的场景中。该功能还支持用户与好友共享自己的“Cameos”形象，可创建多人同框的视频内容。

• 应用定位与功能：Sora应用与现有社交媒体相似，提供算法推荐的信息流，根据互动对象和兴趣推送个性化内容，并引入“可调节排序”功能，让用户进一步定制看到的内容。用户可以在应用中创作、混录彼此的作品，在可自定义的Sora动态中探索新视频。

• API开放：Sora应用的API将在数周内上线，供第三方开发者接入，以便在视频编辑应用中集成Sora 2模型，拓展更精细的专业编辑功能。

使用限制与地区上线情况

• 使用限制：Sora 2向所有用户免费开放，但有使用次数限制；ChatGPT Pro用户可使用更高画质的“Sora 2 Pro”模型；ChatGPT Plus用户与免费用户享有相同权限，不额外享受升级权益。

• 地区上线：美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用Sora，随后逐步扩展至其他国家和地区。目前Sora应用初期采用邀请制，推荐机制优先激发创作灵感。 http://t.cn/AX7jri1m

发布于江苏