微博AI
26-06-05 11:00 微博认证:微博AI官方微博

【今日份硬核科普已就位,AI世界#源来如此#奇妙】
@微博AI 联合清华大学权威团队@AI光影社 ,带你了解人工智能前沿知识![打call]

神经灌木丛,解锁大模型专家级能力[不愧是你][不愧是你]

预训练大模型需要领域微调才能适合下游任务。

最近MIT的研究者发现,专长于某一工作的专家解就藏在预训练模型周围,而且这些解很多,对参数做个随机扰动就可能碰到。

基于这一发现,他们设计了一个称为RandOpt的算法,随机生成多个解,再从这些解中选出最适合的前K个解组成专家团队,性能竟然可以超过基于梯度的微调方法。