小米发布MiMo-V2-Omni

Xiaomi MiMo-V2-Omni正式发布了！

MiMo-V2-Omni 专为现实世界中复杂的多模态交互与执行场景而生。小米从底层构建了融合文本、视觉、语音的全模态基座，并以统一架构将“感知”与“行动”深度绑定。这不仅打破了传统模型“重理解、轻执行”的局限，更让模型原生具备了多模态感知、工具调用、函数执行及 GUI 操作能力。MiMo-V2-Omni 可无缝接入各大智能体框架，实现了从理解到操控的跨越，大幅降低了全模态 Agent 的落地门槛。