美团,你不能说它搞AI是随便说说。
美团已经推出了LongCat系列的图像模型,视频模型,大语言模型,并且都开源了。
这肯定是认真搞的。
虽然现在还没有达到第一梯队,但是这需要一个过程。
最近又推出了LongCat-2.0,是在国产算力上训练的。
这是一个大规模混合专家(MoE)语言模型,总参数量达 1.6 万亿,每个 token 激活约 480 亿参数,1M 上下文长度。
这又是一个1.6T规模的模型,1M上下文,至少规模是上来了。
具体性能,还要看开源之后,大家的测试结果。
这至少说明,用国产算力训练这个规模的模型,完全没有问题。
模型还没有上传开源,但是已经准备开源了。
地址在这里。
模型地址:www.modelscope.cn/models/meituan-longcat/LongCat-2.0
发布于 江苏
