Xiaomi MiMo-V2-Omni正式发布了!
MiMo-V2-Omni 专为现实世界中复杂的多模态交互与执行场景而生。小米从底层构建了融合文本、视觉、语音的全模态基座,并以统一架构将“感知”与“行动”深度绑定。这不仅打破了传统模型“重理解、轻执行”的局限,更让模型原生具备了多模态感知、工具调用、函数执行及 GUI 操作能力。MiMo-V2-Omni 可无缝接入各大智能体框架,实现了从理解到操控的跨越,大幅降低了全模态 Agent 的落地门槛。
发布于 山东
