#Agent能力每7个月翻一番##AI智能体已能完成200分钟任务#Agent能力每7个月翻一番！根据非营利研究机构METR最新发布的报告，这一规律已在9项基准测试中得到了验证。这些任务涉及编程、数学、计算机使用、自动驾驶等领域，表明大模型正在不断向着高度自动化迈进。【图1】报告指出：在软件开发、

#Agent能力每7个月翻一番##AI智能体已能完成200分钟任务#

Agent能力每7个月翻一番！

根据非营利研究机构METR最新发布的报告，这一规律已在9项基准测试中得到了验证。

这些任务涉及编程、数学、计算机使用、自动驾驶等领域，表明大模型正在不断向着高度自动化迈进。【图1】

报告指出：在软件开发、数学竞赛、科学问答等任务中，agent已能完成相当于人类花费50–200分钟才能完成的任务，并且这种能力还在快速提升——大约每2–6个月就能翻一番。

在计算机操作任务中，虽然任务时长较短，但增长率与软件开发等任务一致。

Agent在自动驾驶任务的性能增长速度则较慢，约20个月翻一番。

在视频理解任务中，模型能够在时长1小时的视频上取得50%的成功率。

作为一家致力于研究前沿人工智能系统能力及其风险的研究团队，METR此次的报告又进一步拉近了AI自主化的时间线，快来和我们看看报告有哪些内容吧：http://t.cn/A6k9yDD2