是煦煦哟 25-10-10 08:00
微博认证:科技博主 超话小主持人(科技超话)

2025年Algonauts大脑建模竞赛中,Meta FAIR团队的10亿参数多模态模型TRIBE(Trimodal Brain Encoder),从全球263支队伍中胜出夺冠。这一成果既刷新大脑建模精准度纪录,也推动AI与脑科学交叉研究进入深度融合阶段。

Algonauts竞赛自2019年起聚焦“探索人机智能边界”,2025年核心任务是让模型预测人类观看多模态电影时的大脑响应,尤其看重“分布外泛化能力”——即应对训练外场景的能力,这是模拟真实人脑认知的关键。竞赛依托当前最大规模人类大脑数据集CNeuroMod(含受试者观影时的全脑fMRI数据),设1.7万欧元奖金,冠军可在CCN大会展示成果,吸引全球顶尖力量参与。

TRIBE的核心突破在于打破传统脑建模“分而治之”局限,实现跨模态、跨皮层区域、跨个体的大脑响应精准预测。其架构设计聚焦“三模态深度融合”:以电影的视频、音频、文字脚本为输入,通过Meta的Llama 3.2解析文本、Wav2Vec2-BERT捕捉音频、V-JEPA 2感知视频时空变化,再经Transformer架构端到端动态融合,模拟人脑处理复杂信息的逻辑;同时针对fMRI数据时序特性优化建模能力,精准匹配大脑从初级感知皮层到高级联合皮层的活动变化。消融实验显示,TRIBE在高级皮层区域表现远超单模态模型,三模态联合训练编码得分提升显著,且随脑数据量增加,预测性能呈系统性提升。

此次夺冠意义深远:对脑科学而言,TRIBE如同“可拆解的数字大脑”,能帮助科学家验证认知理论,快速获取脑区功能定位线索,助力破解记忆、决策等认知机制;对AI发展而言,TRIBE的多模态融合思路为开发贴近人类思维的智能系统提供新范式,未来AI或能像人脑般自然整合多模态信息,提升环境理解与决策能力。

目前TRIBE已在大脑感知领域展现潜力,未来将进一步纳入行为、记忆等高级认知组件。这款10亿参数模型正架起桥梁,既助力人类探索自身智能奥秘,也为AI“下一代进化”指明方向。#科技# http://t.cn/AXzfjDjY

发布于 福建