OneFlow
26-06-17 16:20 微博认证:北京一流科技有限公司

#大模型日报# #ai前沿动态#

【LLM 智能体能否推断出世界模型?基于智能体自动机学习的实证研究】

链接:http://t.cn/AXaYCnYj
论文概述:本文创新性地将经典自动机学习转化为LLM智能体测试场,反直觉地揭示了尽管顶尖大模型擅长复杂任务,但在仅含几个状态的绝对逻辑环境中却表现出严重的规划、推理和记忆整合缺陷,远不及传统确定性算法,深刻暴露了当前LLM在构建真实“世界模型”方面的根本性短板。

发布于 北京