默庵·超级个体 26-03-22 08:55
微博认证:微博新知博主 科技博主 头条文章作者 微博原创视频博主

卡帕西又开源了一个项目,叫 autoresearch,不到一周在 GitHub 上拿了 4.4 万颗星,全网都在讨论。

这个项目做的事情说起来很简单:让 AI 自己搞科研。但它厉害的地方在于,整个过程是全自动闭环的。AI 自己写 PyTorch 代码,自己跑实验,自己看结果,觉得不行就自己改代码再跑一轮。你只需要给它一个方向,比如"帮我把模型跑得更稳一点",然后就可以该干嘛干嘛去了。等你回来,它已经跑了几百轮实验,把最优的模型架构和训练参数整理好了,直接递到你手上。

卡帕西自己说,他写完代码就去蒸桑拿了,回来 AI 已经把实验跑完了。

整个项目只有 630 行 Python 代码,单张 GPU 就能跑。卡帕西再一次证明了一件事:真正有杀伤力的东西,往往极其简洁。不需要成千上万行代码堆出来,核心逻辑想清楚了,几百行就够了。

而且它跑出来的效果是真的能打。有人用它一夜之间训出来的 0.8B 小模型,效果直接超过了人类精心微调的 1.6B 模型。这说明它在做实验的时候不是瞎撞,是有逻辑地在推演和优化,像一个经验丰富的工程师一样在思考。

这个项目之所以让这么多人兴奋,是因为它代表了一种科研范式的转变。以前是人类研究 AI,设计实验,调参数,看结果,再改方案。现在这套流程 AI 自己就能跑通了。人的角色从执行者变成了方向的制定者,你负责想清楚要解决什么问题,剩下的交给 AI 去试。

往大了说,这可能是科研效率的一次质变。往小了说,如果你今天还在手动调参、熬夜盯 Loss 曲线,那确实该看看这个项目了。未来的研究者可能不是在写代码,而是在指挥 AI 写代码。

仓库地址:github.com/karpathy/autoresearch

#How I AI##科技先锋官#

发布于 山东