爱可可-爱生活
26-06-25 05:31 微博认证:AI博主 2025微博新锐新知博主

[CL]《Cross-Lingual Exploration for Parametric Knowledge》E Diskind, I Trainin, U Shaham, L Choshen… [The Hebrew University of Jerusalem & Google Research] (2026)

在多语言大模型领域,参数知识的“提取不均”是一个悬而未决的难题。过去的方法受困于单语推理或简单的翻译转译,本质原因是模型内部知识被“锁”在特定的语言语境中,标准查询无法触达这些处于潜伏状态的客观事实。

本文的核心洞见是:把语言看作推理空间的一个搜索维度。由此,跨语言探索这一关键操作使问题得以解开:通过自主路由至与知识背景相关的语言路径,模型能绕过高资源语言的认知偏差,从不同语言的参数叠加中召回那些被掩埋的孤立事实。

这项工作真正留下的遗产是证明了“语言切换”是比“增加算力”更高效的推理缩放曲线。它为后来者打开的新门是利用推理时搜索来弥补模型预训练阶段的知识鸿沟,但尚未跨过的门槛是如何在多语言冲突时精准聚合出唯一的正确答案。

arxiv.org/abs/2606.24579 #机器学习# #人工智能# #论文# #AI创造营#

发布于 北京