诺贝尔奖得主发布Gemini Omni

诺贝尔奖得主发布了Gemini Omni。
真正意义上的多模态旗舰模型。

Google DeepMind 在本届 I/O 正式推出 Gemini Omni，这是 Gemini 模型家族迄今为止能力最为全面的版本。「Omni」顾名思义，意指「全能」——该模型在处理文字、图像、视频、音频等多种模态信息时，展示出前所未有的流畅性与深度。

在演示素材中，Gemini Omni 展现了多项令人印象深刻的能力：面对用户手绘的一条鱼，它不仅能够识别并与之互动，还能实时生成流动动画；在「弹珠世界知识」（Marble World Knowledge）演示中，它将各类知识点具象化为弹珠穿行于复杂管道的视觉叙事；面对天文级别的「黑洞素描」，Omni 能精准识别物理概念并展开深度讲解；在蛋白质折叠演示中，则直观呈现了其在科学领域的推理与可视化潜力。

Gemini Omni 还被深度集成至 Gemini App，成为用户每日与 AI 交互的「默认智能引擎」，为后续所有基于 Gemini 的服务提供统一的模型底座。
#google# #谷歌[超话]# #英超#

发布于美国