子夜梦廊 26-04-09 10:32
微博认证:科技博主 微博原创视频博主

#Meta推出超级智能实验室首款AI模型#
扎克伯格的亿元重金没白花,Meta的技术天团终于放出了他们手搓9个月的大模型Muse Spark。

十月怀胎憋出来的大招一出,效果非同凡响:Meta股价应声暴涨,当日整体涨6%,盘中一度飙超10%。

值得一提的是,除了带头人亚历山大·王外,团队的核心成员清一色的华人:思维链作者Jason Wei、o1核心贡献者Hyung Won Chung、余家辉、扩散模型核心人物宋飏。。。

第三方测评结果非常棒:性能直接杀进全球第一梯队,关键指标仅次于GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6,彻底洗刷了Llama 4的拉胯帽子。

多模态能力封神,看论文图表、屏幕内容,得分要么第一,要么和GPT、Gemini打得有来有回,尤其图片转代码堪称绝活。

文科情商也在线,光速通关新版弱智吧洗车测试,接梗能力拉满。

医学能力是王牌!和1000+医生合作,健康问答拿下42.8最高分,多模态医学问答稳居行业前列。

推理能力正面硬刚顶流,专门推出了“沉思模式”,对标Gemini Deep Think、GPT Pro极限推理,在“人类最后的考试”环节里还压了对手一头。

此外,Muse Spark还偷偷卷了购物模式,结合用户社媒偏好做个性化推荐,提前堵死挨骂的口子。

训练效率更是离谱到家:相同性能下,预训练算力比Llama 4少10.3倍,一分算力可以掰成好几份花。

强化学习训练也稳得出奇,能力提升线性可预测,还靠“思考时间惩罚+多智能体协作”,逼模型学会思维压缩,从而用更少的token搞定问题。

不过,Musk Spark也绝非完美模型:编程、Agent类任务是硬伤,上线第一天就翻了大车:生成网站3个请求全崩,Python代码直接跑不通,被网友吐槽白瞎了算力。

最反差的是,这次Meta不硬吹SOTA了,主动自曝短板,坦言编程和长时自主运行不如顶尖模型,主打一个被Llama 4骂出心理阴影了。

另外值得一提的是:向来走开源路线的Meta,这次真闭源了!模型仅上线官网和APP,API只对合作伙伴开放,只留了句“未来可能开源后续版本”的活口。#科技先锋官#

发布于 上海