LLM代理还原隐藏模型

[CL]《Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning》R Menaged, G Lior, S Ravfogel, R Aharoni… [The Hebrew University of Jerusalem & New York University] (2026)

在可交互环境建模领域，LLM能否从问答中还原隐藏世界模型仍悬而未决。过去方法困于静态测试，难看出它是会推理，还是只抓局部线索。

本文的核心洞见是：把环境重新看作一个隐藏DFA，让代理用成员查询和等价查询去逼近它。由此，查询规划、反例吸收与假设修正这一步骤成为解题关键。

这项工作真正留下的遗产是一个可控、可量化的交互式评测框架。它为后来者打开的新门是比较“学会了什么”与“怎样学会”的能力；但尚未跨过的门槛是面对噪声、随机与更复杂环境。

arxiv.org/abs/2606.16576 #机器学习# #人工智能# #论文# #AI创造营#

发布于北京