蚁工厂 26-01-12 08:43
微博认证:科技博主

mack.work/blog/recursive-language-models
一篇介绍最近比较火的递归语言模型 (Recursive Language Models, RLMs)技术原理的文章,这类模型期望能解决大语言模型在处理超长上下文时面临的“上下文腐烂(Context Rot)”和高昂成本问题。
递归语言模型不再强行将海量数据塞入模型的上下文窗口,而是将文本视为外部编程环境中的变量,让 LLM 像程序员一样通过编写代码来分块读取、检查数据,并递归调用自身的副本采用“分治法”处理信息。

#科技先锋官#

发布于 山东