不是牛油果是缪斯! Meta刚刚发布了新模型!
Meta 刚刚终于发布了他们继Llama4后的首个大模型 Muse Spark! (我不确定到底应不应该翻译成缪斯哈) 这是一个原生多模态推理模型, 支持文本+图片输入.
从性能上看, 目前这个模型并不是 SOTA 级别的, 官方放出的分数表格很鸡贼, 我给大家画了一下哪个是最高的, 大家就可以看出, 这个模型更对是面向图像理解, 健康与医疗任务, 代理搜索类任务优化的(这三个SOTA了).而 Agent, 多任务编排, 并行推理, 视觉推理链这些虽然是这次的主打功能, 但是相关测试评分没有到达 SOTA 级别.
目前上下文窗口和参数量都没有公开, 不过官方报道里面提了一嘴 "The results are clear: we can reach the same capabilities with over an order of magnitude less compute than our previous model, Llama 4 Maverick"
并且说 "With larger models in development", 所以我们可以推测, 这并不是个旗舰模型, 而是系列模型中的先导模型, 并且从Blog中的技术介绍 "scaling Muse Spark with multi-agent thinking enables superior performance with comparable latency" 可以推测, 想表达的是 "跑 N 个小模型并行推理,而不是跑 1 个大模型长时间思考", 这个策略通常只对单模型足够小, 推理足够快时才有意义, 否则成本会爆炸.
所以大胆猜一波模型本身可能只有 Llama 4 Maverick 一半甚至1/3 参数量大小, 即 Muse-Spark-200B-A15B 或者 Muse-Spark-100B-A10B? 如果是这样, 得分这么高反而是优势了(成本巨低).
当然模型无论多大都跟大家没太大关系了, 因为暂时没有开放权重, 而且你必须要有fb或者ins账号才能用, API 则是受邀用户才能用. 所以我这边的测试只能等它什么时候上 openrouter 才能给大家测了.
#HOW I AI##muse##musespark##meta##llama##原生多模态推理模型#
