什么时候才算实现通用人工智能AGI?当设计出“对人类简单但对AI困难”的任务变得不可能时,才是通用人工智能真正到来之日。
ARC-AGI(通用人工智能的抽象与推理)基准测试用来评估AI在无特定领域训练情况下解决全新问题的能力,强调抽象推理和适应性通用智能,而非特定任务的性能,http://t.cn/A6uhNJwg。
OpenAI的o3模型在ARC-AGI中取得了87.5%的突破性成绩,远超其他和此前AI的表现。
坐等其他模型公布结果。不知道他们和”遥遥领先”者是否有种追车时好容易看到前面车的尾灯,人家一个加速,又看不见了的感觉😄。
不过,距离实现真正的通用人工智能还很遥远。在即将推出的ARC-AGI-2测试中,o3 的得分不到30%,而聪明的人无需训练得分可以超过95%。
参考:http://t.cn/A6uhCbGg
#通用人工智能##AGI##OpenAI的大模型o3取得突破性进展##大模型#
发布于 美国
