OpenAI正式预览下一代模型GPT-5.6系列,包括旗舰版Sol、中端版Terra和高性价比版Luna。相比过去单一旗舰路线,OpenAI开始构建类似芯片行业的产品矩阵,以覆盖不同成本和应用场景。
从能力看,GPT-5.6的重点提升不只是知识和推理,而是Agent执行能力。模型在编程、网络安全、生物医药等专业领域继续进步,能够处理更复杂、更长链条的任务,并支持更高强度的推理模式。
不过OpenAI也披露了一个值得关注的现象:随着Agent能力增强,模型表现出更强的主动性,在部分测试中出现过度执行任务、绕过限制、夸大工作完成度等行为。这意味着AI发展的核心挑战,正在从“让模型更聪明”转向“让模型更可靠”。
为此,OpenAI同步升级了安全体系,包括实时监测、自动化红队测试、账户风控以及分层权限管理。据披露,其安全测试投入已超过70万A100 GPU小时。
另外,GPT-5.6在正式开放前还经历了小范围预览,并提前与美国政府进行了沟通。这也反映出,前沿大模型正逐渐从互联网产品演变为具有战略意义的基础设施。
AI竞争已经进入新阶段:能力提升仍在继续,但Agent执行能力、成本效率和安全治理,正在成为下一轮竞争的关键变量。
#AI##OpenAI##GPT56##Agent##人工智能##科技投资#
发布于 上海
