蚁工厂 25-04-24 08:33
微博认证:科技博主

http://t.cn/A6dqRrYt
一篇介绍推理模型的 test-time scaling 技术的文章。 test-time scaling 是指在模型部署期间分配更多计算资源以提升其推理性能。文章指出,推理任务需要大量思考和计算资源,如高级数学运算和多模态推理等。为了提升大型语言模型(LLMs)在推理任务中的性能,研究人员开发了基于搜索的技术,如蒙特卡洛树搜索、n选优和多数表决等。这些技术虽然能提升性能,但会增加基础设施成本。文章还介绍了几种 test-time scaling 方法,包括思维链作为推理数据、树形思维、自我一致性与集成投票、蒙特卡洛树搜索等方法。这些方法通过增加计算资源和推理步骤,使模型能够更好地处理复杂推理任务。

发布于 山东