爱可可-爱生活 24-01-21 17:13
微博认证:AI博主 2025微博新锐新知博主

【GPT Core:用于创建和训练先进的大型语言模型(LLM),着重强调了其快速性能,可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失】’GPT Core - Fast modular code to create and train cutting edge LLMs' GitHub: github.com/SmerkyG/gptcore #开源# #机器学习# #人工智能#

发布于 北京