爱可可-爱生活
26-04-28 05:24 微博认证:AI博主 2025微博新锐新知博主

[CL]《Contexts are Never Long Enough: Structured Reasoning for Scalable Question Answering over Long Document Sets》H Joshi, P Shethia, J Dao, M S. Lam [Stanford University] (2026)

在长文档问答中,信息分散于海量文本且超出上下文。过去方法依赖分块再拼接,本质原因是仍需在文本层聚合证据,规模一大即失效。

本文的核心洞见是:把“长文本推理”重新看作“数据库操作”。由此,将关键信息抽取为结构化表并经一致性修复,使问题转化为SQL查询而非文本拼接。

这项工作真正留下的遗产是将推理与表示彻底解耦。它为后来者打开的新门是持久化结构状态上的可扩展推理,但尚未跨过的门槛是对非结构化、主观问题的表达能力。

arxiv.org/abs/2604.22294

#机器学习# #人工智能# #论文# #AI创造营#

发布于 北京