Recursive Superintelligence,AI自我改进的闭环,直到超级智能。
他们给出的路线图中的第 一步,是先训练一个具备“50000名博士”能力的系统,自动化AI科学研究本身。
再把这台”尤里卡机器”指向药物研发、电池材料和核聚变物理。
1、300亿砸向下一条Scaling Law
RSI的成立基于一条核心判断:
预训练Scaling Law仍然重要,但如果只靠更多数据、更多算力、更多参数,边际收益已经没有过去那么陡。
AI行业正在找新的增长曲线。
RSI押的就是其中最激进的一条,recursive self-improvement,递归式自我改进。
这刚好打中了AI行业现在最焦虑的问题,也就是大模型之后,下一次能力跃迁从哪里来?
CEO Richard Socher在访谈中给出解释:
“AI是代码,而现在AI可以写代码。”
过去,AI研发的循环大体还是人类主导。研究员提出想法,工程师写实验,团队跑训练,评估模型,再根据结果调下一轮方向。
RSI把这个循环的一部分交给AI。
它们设想中的系统,不只是回答问题,也不只是帮人写代码。它要能发现自己的能力短板,设计新的实验,写新的benchmark,然后主动重写自己的代码库,让下一版系统更强。
传统AI优化像是在固定考卷上刷分,考到100分就算到头。RSI要的是另一条路:像生物进化一样,永远不停下来,永远有新发明。
一个AI改进另一个AI;改进后的AI继续改进后面的AI。
http://t.cn/AXiiNLj7
发布于 江苏
