Karpathy深夜炸出自动化AI研究新项目:autoresearch ,让AI帮你做自动化循环LLM训练,你给指令然后躺着等结果
5分钟即完成一次训练,单卡能跑
人工不用在苦哈哈的去改Python代码、调参数、改神经网络架构,只给Prompt,AI自己去修改代码优化模型
给AIAgent一个真实的LLM训练环境,让它通宵达旦自主进行实验研究,人类给Prompt来指导AI思考和研究
Karpathy把这个项目打包成一个独立的迷你代码库,方便上手体验,这个项目本质上是nanochat模型训练核心的精简版,被压缩成一个630行的单文件代码,能在单GPU上运行
然后人训练LLM就变成了AI训练LLM
你告诉AI:去改改训练代码,看能不能让模型效果更好
AI收到指令: 修改train.py,跑5分钟训练,看结果
如果结果变好,保留修改
如果结果变差,丢弃重新改
然后重复循环……
这个项目里可以看到AI自主做研究的可行性,AI不仅写代码能开始接管最硬核的AI算法研究本身了
或许谁能写出更好的Prompt,谁能调教出更聪明的AI智能体才是核心竞争力,在这个范式中,Prompt就是新的源代码
github:http://t.cn/AXVtrJLJ
#autoresearch##AI训练LLM##AI自主研究#
发布于 山西
