爱可可-爱生活
26-06-17 04:58 微博认证:AI博主 2025微博新锐新知博主

[CL]《Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning》R Menaged, G Lior, S Ravfogel, R Aharoni… [The Hebrew University of Jerusalem & New York University] (2026)

在可交互环境建模领域,LLM能否从问答中还原隐藏世界模型仍悬而未决。过去方法困于静态测试,难看出它是会推理,还是只抓局部线索。

本文的核心洞见是:把环境重新看作一个隐藏DFA,让代理用成员查询和等价查询去逼近它。由此,查询规划、反例吸收与假设修正这一步骤成为解题关键。

这项工作真正留下的遗产是一个可控、可量化的交互式评测框架。它为后来者打开的新门是比较“学会了什么”与“怎样学会”的能力;但尚未跨过的门槛是面对噪声、随机与更复杂环境。

arxiv.org/abs/2606.16576 #机器学习# #人工智能# #论文# #AI创造营#

发布于 北京