业内探讨了大型世界模型与大语言模型的算力需求差异,提出疑问:二者算力消耗是否相近,还是世界模型算力需求更低,并推测世界模型当前规模有限,或源于训练数据供给不足。
世界模型可分为两类,一类面向机器人、游戏、设计场景,采用显式3D/4D架构;另一类主打视频生成。相关研究人员表示,其团队研发的Marble模型规模相较GPT-5等顶尖大语言模型相差多个数量级,GPT-5训练所需浮点运算量约为10²⁶次。该模型现阶段体量受限,一方面是训练数据不足,另一方面是该领域仍处于发展初期,同时研究人员十分看好该领域短期内实现快速突破。#一分钟精选视频扶持计划##科技先锋官# http://t.cn/AXS4BYHz
发布于 福建
