#OpenAI最新发布模型Sora2#
http://t.cn/AX7jBanx 北京时间10月1日凌晨(当地时间9月30日),OpenAI发布了新一代视频生成模型Sora 2,并同步推出iOS社交应用Sora(安卓版本仍在开发中)。这一发布标志着视频生成技术在多个方面取得显著进展,被OpenAI形容为视频生成领域的“GPT - 3.5时刻”。
模型特点
• 物理精准与逼真度提升:Sora 2在遵循物理定律方面表现出色,能让生成的视频更具真实感。例如,以往的视频生成模型在呈现“篮球运动员投篮未中”的场景时,可能会让篮球突然“瞬移”进篮筐;而Sora 2中,篮球会从篮板上弹开,符合真实物理轨迹。它还能处理复杂的动作场景,如捕捉奥运会体操动作、滑板特技、从跳板跃入水中的“炮弹式”跳水等,在模拟真实世界动态方面有很大进步。
• 音频生成能力:该模型首次支持与画面匹配的AI音频生成,可创建复杂的背景音景、语音和音效,并且具有高度的真实感,实现了画面与环境音、物体交互声及对话的匹配。
• 可控性增强:Sora 2在可控性方面有巨大飞跃,能够遵循跨越多个镜头的复杂指令,同时准确地保持世界状态的一致,还可以直接将现实世界的元素注入其中。
配套应用Sora
• “入镜”功能:用户可通过全新“入镜”(Cameo)功能,将自己或好友置入生成视频中。用户只需在应用中进行一次简短的音视频录制,即可验证身份并捕捉相似之处,然后以极高的保真度将自己或他人置身于任何Sora生成的场景中。该功能还支持用户与好友共享自己的“Cameos”形象,可创建多人同框的视频内容。
• 应用定位与功能:Sora应用与现有社交媒体相似,提供算法推荐的信息流,根据互动对象和兴趣推送个性化内容,并引入“可调节排序”功能,让用户进一步定制看到的内容。用户可以在应用中创作、混录彼此的作品,在可自定义的Sora动态中探索新视频。
• API开放:Sora应用的API将在数周内上线,供第三方开发者接入,以便在视频编辑应用中集成Sora 2模型,拓展更精细的专业编辑功能。
使用限制与地区上线情况
• 使用限制:Sora 2向所有用户免费开放,但有使用次数限制;ChatGPT Pro用户可使用更高画质的“Sora 2 Pro”模型;ChatGPT Plus用户与免费用户享有相同权限,不额外享受升级权益。
• 地区上线:美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用Sora,随后逐步扩展至其他国家和地区。目前Sora应用初期采用邀请制,推荐机制优先激发创作灵感。 http://t.cn/AX7jri1m
发布于 江苏
