粮厂研究员Will 26-03-06 10:19
微博认证:投资内容创作者

#Will的小米基本面研究#

小米今天推了一个叫 Xiaomi miclaw 的产品,开始小范围封测。它的定义是移动端 Agent。我想借这个机会,把一个经常被混用的概念厘清楚:Agent、物理 AI、机器人,到底是什么关系?

先说 miclaw 是什么。它基于小米 MiMo 大模型,以系统应用身份运行,拥有 50+ 系统级工具调用能力——可以帮你订票、控制米家设备、读短信、管日历、创建子智能体,还能自主写脚本、设计记忆结构,越用越懂你。文章里有一句话我觉得说到点子上了:

当大模型真正长进手机系统里,手机本身就变成了 AI 的身体的一部分。

这句话是理解三者关系的钥匙。

Agent,是有行动能力的 AI。它不只是回答问题的对话框,它能感知环境、制定计划、调用工具、执行任务、从反馈中迭代。miclaw 就是这样的东西:用户说半小时后我带朋友贝贝回家,帮我准备一下,AI 自主判断该做什么——开灯、调温度、播音乐,一步步串联多个工具完成。这背后是一个推理-执行循环,模型在每一步自己决定下一步。这就是 Agent 的本质:大脑 + 工具 + 执行闭环。

物理 AI,是 Agent 长了身体之后的形态。当同样的感知-推理-行动架构,不再运行在手机或服务器上,而是嵌入一个有传感器、有关节、能在三维空间里移动的机械体,它就变成了物理 AI,也叫具身智能。小米几天前公布的人形机器人工厂试验就是这个——在 EV 冲压车间安装自攻螺母,76 秒一个循环,3 小时自主运行,90.2% 成功率。它和 miclaw 的大脑架构是同源的:VLA(视觉-语言-行动)模型 + 强化学习,同样是感知输入、推理决策、执行动作。只不过执行的手,从调用 API 变成了驱动机械臂。

机器人,是物理 AI 的硬件载体。它本身不等于 AI——一台传统工业机械臂只是按程序动作,没有推理能力,不是 AI。物理 AI 是当大模型和具身感知被整合进机器人硬件之后才出现的东西。所以机器人是壳,物理 AI 是魂,两者的结合才是现在大家说的人形机器人所指的对象。

把三者放在一起:Agent 是纯软件的 AI 执行体,手机/云端是它的身体;物理 AI 是拥有真实物理形态的 AI 执行体,机械躯体是它的身体;机器人是硬件平台,没有大模型加持之前,它只是机器,不是 AI。三者共享同一个底层逻辑——推理驱动执行——只是执行的介质不同:一个在数字世界动手,一个在物理世界动手。

miclaw 的价值在于,它把这套 Agent 架构第一次真正嵌进了手机操作系统底层,而不是跑在沙箱里。这一步,和人形机器人进工厂一样,都是同一件事的不同侧面:大模型从会说话到会动手的跃迁。#小米科技[超话]#

发布于 中国香港