蚁工厂
25-02-21 18:37 微博认证:科技博主

之前介绍过的微型语言模型项目"大道至简"出了个新的视觉版:MiniMind-V。
带你从0开始,仅用1.3块钱成本 + 1小时,即可训练出26M参数的超小多模态视觉语言模型MiniMind-V!
项目地址:github.com/jingyaogong/minimind-v

MiniMind-V是MiniMind纯语言模型的视觉能力额外拓展。项目同时包含了VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。这不仅是一个开源VLM模型的最小实现,也是入门视觉语言模型的简明教程。

#ai创造营#

发布于 山东