Karpathy发布AI研究项目

Karpathy深夜炸出自动化AI研究新项目：autoresearch ，让AI帮你做自动化循环LLM训练，你给指令然后躺着等结果

5分钟即完成一次训练，单卡能跑

人工不用在苦哈哈的去改Python代码、调参数、改神经网络架构，只给Prompt，AI自己去修改代码优化模型

给AIAgent一个真实的LLM训练环境，让它通宵达旦自主进行实验研究，人类给Prompt来指导AI思考和研究

Karpathy把这个项目打包成一个独立的迷你代码库，方便上手体验，这个项目本质上是nanochat模型训练核心的精简版，被压缩成一个630行的单文件代码，能在单GPU上运行

然后人训练LLM就变成了AI训练LLM
你告诉AI：去改改训练代码，看能不能让模型效果更好
AI收到指令：修改train.py，跑5分钟训练，看结果
如果结果变好，保留修改
如果结果变差，丢弃重新改
然后重复循环……

这个项目里可以看到AI自主做研究的可行性，AI不仅写代码能开始接管最硬核的AI算法研究本身了

或许谁能写出更好的Prompt，谁能调教出更聪明的AI智能体才是核心竞争力，在这个范式中，Prompt就是新的源代码

github：http://t.cn/AXVtrJLJ

#autoresearch##AI训练LLM##AI自主研究#

发布于山西