本地LLM实验管理工具开源

【在笔记本上训练自己的小型LLM：一个本地实验管理工具的诞生】

最近有开发者分享了一个有趣的开源项目——LLM Madness，一个专为本地LLM实验设计的Web UI管理工具。

故事的起点是Karpathy的经典项目minGPT。作者在用它做各种训练实验时，脚本越写越多，数据集越下越杂，配置文件散落各处，很快就陷入了"实验管理地狱"。于是他决定自己动手，打造一个能统一管理数据集构建、配置文件、训练流程和模型输出的本地工具。

这个工具的定位很清晰：面向研究者和爱好者，专注于小规模LLM实验的本地化管理。它不只是一个前端界面，而是完整管理了从tokenizer词表、数据集到checkpoint和权重文件的整个构建产物链。底层基于PyTorch，代码全Python实现。

硬件门槛并不高。作者在M1 MacBook Pro（16GB内存）上使用MPS加速，可以从零预训练约1000万参数的模型。当然，稍作修改也能适配GPU环境。

这让我想到一个被低估的方向：在个人设备上跑"微型LLM实验"的价值。用几百万token的数据喂给几百万参数的小模型，快速验证想法、观察什么有效什么无效——这种低成本的探索循环，可能比直接上大模型更能培养对语言模型的直觉。

不是所有实验都需要H100集群。有时候，一台笔记本、一个清晰的实验框架，就足以让你触摸到LLM的本质。

项目地址：github.com/MaxHastings/llm-madness
minGPT原项目：github.com/karpathy/minGPT

reddit.com/r/LocalLLaMA/comments/1q1ntkh/i_built_a_simple_web_ui_for_training_and_running

发布于北京