#LumaAI##Uni1##图像生成##多模态大模型##科技动态##AIGC#
【行业前沿:Luma AI 发布全新图像模型 Uni-1,逻辑基准测试登顶榜首】
近日,Luma AI 正式推出了其首款将图像理解与图像生成结合于单一架构的全新模型 Uni-1。该模型在基于逻辑的图像处理基准测试(RISEBench)中表现优异,综合得分击败了谷歌的 Nano Banana 2 和支撑 ChatGPT 的 GPT Image 1.5,位列第一。
与传统的扩散模型不同,Uni-1 基于自回归 Transformer 架构构建,通过逐个 token 的序列来生成内容,使文本与图像能够共享同一处理管道。进而能够在生成前和生成过程中对提示词进行深度推理,拆解复杂指令并规划场景,从而实现极高准确度的指令遵循。例如,它可以将多张普通宠物照片精准融合为一个充满细节的全新构图。
同时,Uni-1 能够在多轮对话中保持上下文以微调生成主体,支持超过 76 种艺术风格的转换,并能接受草图或视觉指令作为输入。通过单张参考图像,该模型甚至能生成如“钢琴家从童年到老年”这样主体身份和物理规律高度一致的连贯序列。得益于图像生成能力的加持,其视觉理解水平也得到显著提升,在对象识别任务上已几乎与谷歌的 Gemini 3 Pro 旗鼓相当,并全面支持多语言。
据 Luma 官方透露,Uni-1 很快将通过其新推出的创意助手 Luma Agents 以及 Luma API 向用户开放,目前尚未公布具体的产品定价。
发布于 北京
