算力需求差异探讨

业内探讨了大型世界模型与大语言模型的算力需求差异，提出疑问：二者算力消耗是否相近，还是世界模型算力需求更低，并推测世界模型当前规模有限，或源于训练数据供给不足。
世界模型可分为两类，一类面向机器人、游戏、设计场景，采用显式3D/4D架构；另一类主打视频生成。相关研究人员表示，其团队研发的Marble模型规模相较GPT-5等顶尖大语言模型相差多个数量级，GPT-5训练所需浮点运算量约为10²⁶次。该模型现阶段体量受限，一方面是训练数据不足，另一方面是该领域仍处于发展初期，同时研究人员十分看好该领域短期内实现快速突破。#一分钟精选视频扶持计划##科技先锋官# http://t.cn/AXS4BYHz

发布于福建