新智元 25-07-18 07:40
微博认证:新智元官方微博

#ChatGPT agent#,开启人类和智能体协作全新时代。

它融合了此前三大技术突破的优势:Operator与网站交互的能力,Deep Research整合信息的技巧,以及ChatGPT智能对话优势。

如今,ChatGPT可以直接使用计算机,全程自主为你工作。

从智能浏览网页、筛选结果,在需要时提醒安全登录、运行代码、进行分析,还能直出PPT和Excel汇总发现结果。

最最重要的是,一切尽在掌控之中。

人类随时可以中断任务、接管浏览器,或是完全停止。

在HLE测试中,ChatGPT agent拿下了41.6%高分;并在数学FrontierMath基准上,同样刷新SOTA,碾压o4-mini和o3模型。

顺便提一句,ChatGPT Agent在HLE上仍不及马斯克的Grok 4 Heavy

谁能想到,上面这张PPT,还是ChatGPT agent自己做的。在基准测试中,其操作办公软件的能力,几乎没给人类留下多少余地了。http://t.cn/A6kl41Ci