在Sora应用刚登顶App Store免费榜、力压Gemini与ChatGPT等竞品后,OpenAI趁热打铁抛出重磅更新——推出AI视频生成模型Sora 2 Pro,将高保真视频创作的门槛再向前推进一步。这款定位高端的模型目前仅向ChatGPT Pro用户开放,核心升级直击创作者痛点:不仅将视频生成时长从初代的10秒延长至15秒,更实现了分辨率的显著提升,让画面细节的呈现力再上台阶。
相较于单纯的参数升级,Sora 2 Pro的真正突破藏在“真实感”的进化里。它延续了Sora 2系列“世界模拟器”的核心定位,能精准遵循物理定律模拟现实场景:体操运动员后空翻落地时的踉跄、跳水时符合流体力学的水花飞溅、篮球投篮不中后从篮板自然反弹的轨迹,这些曾让AI视频露怯的细节,如今都变得自然可信。更令人惊喜的是声画同步能力——生成“猫踩键盘”的画面时,会同步匹配不满的喵喵声;模拟雪地探险场景时,能还原登山者的呼喊与风雪声,这种音画联动让视频真正有了“灵魂”。
创作灵活性的提升同样值得关注。用户在生成界面可自由选择横屏或竖屏格式,搭配不同分辨率与时长组合,无论是适配社交平台的短视频,还是用于创作构思的短片片段,都能精准满足需求。官方发布的城市科幻夜景、维京船航行等示例视频,已展现出极强的叙事张力:车内追逐的动感节奏、人物细腻的情绪表达,连现实主义电影制片人Taher Dhanerawala都惊叹“AI生成的商业电影真的要来了”。
不过,这款尖端模型仍难逃“成长的烦恼”。目前生成一段15秒高分辨率视频需耗时20至30分钟,漫长的等待时间暴露了算力消耗的巨大成本。同时,其仅限ChatGPT Pro用户体验的门槛,以及Sora应用当前仅以邀请制登陆美加地区iOS平台的限制,也让普通创作者暂时难以触及。
从OpenAI的布局来看,Sora 2 Pro更像是技术探索的“先锋”——一边用15秒高保真视频验证AI模拟现实的能力边界,一边通过Pro版本的试水打磨商业化路径。正如其将Sora 2系列称作“视频领域的GPT-3.5时刻”,当下的算力瓶颈或许只是暂时的阻碍,当效率与成本问题得到破解,这款模型或许真能成为开启“AI视频工厂”时代的钥匙。 #科技# http://t.cn/AX7uDWKW
发布于 福建
