[CL]《Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning》R Menaged, G Lior, S Ravfogel, R Aharoni… [The Hebrew University of Jerusalem & New York University] (2026)
在可交互环境建模领域,LLM能否从问答中还原隐藏世界模型仍悬而未决。过去方法困于静态测试,难看出它是会推理,还是只抓局部线索。
本文的核心洞见是:把环境重新看作一个隐藏DFA,让代理用成员查询和等价查询去逼近它。由此,查询规划、反例吸收与假设修正这一步骤成为解题关键。
这项工作真正留下的遗产是一个可控、可量化的交互式评测框架。它为后来者打开的新门是比较“学会了什么”与“怎样学会”的能力;但尚未跨过的门槛是面对噪声、随机与更复杂环境。
arxiv.org/abs/2606.16576 #机器学习# #人工智能# #论文# #AI创造营#
发布于 北京
