蚁工厂
25-07-09 08:22 微博认证:科技博主

huggingface发布了3B参数里的SoTA模型 smollm3
huggingface.co/blog/smollm3
支持 think / no_think 模式,默认不支持汉语。
后续还会发布 SmolLM3 及其工程蓝图。它包含架构细节、精确的数据混合,展示了我们如何通过三阶段预训练方法逐步提升跨领域性能,以及构建混合推理模型的方法。
#AI创造营##微博兴趣创作计划#

发布于 山东