小米AI技术进展汇总

#will的小米基本面研究#

小米在资本市场的叙事已经明显转向AI —— 近期很多机构的AI研究员都开始重新审视小米，我也因此系统整理了一份2025年至今的小米AI及硬核技术发布图谱，供大家参考。

2024年底 — 万卡GPU集群立项，MiMo自研启动：小米正式启动万卡GPU集群建设，以「Core」为内部代号成立大模型核心团队，雷军亲自主导方向，初始资源约6500卡GPU，向万卡规模持续扩建。

2025年2月26日 — HAD端到端辅助驾驶推送：小米汽车正式向SU7用户全量推送端到端全场景HAD，训练数据规模300万clips，实现从出发到目的地自动泊车的全流程覆盖，成为中国首批完成端到端辅助驾驶全量交付的车企之一。

2025年4月30日 — MiMo-7B大模型发布：小米首个开源大语言模型，7B参数。AIME 2025数学推理得分55.4，超越OpenAI o1-mini 4.7分，代码生成超越参数量是其4倍以上的阿里云Qwen-32B-Preview。

2025年5月 — 小米玄戒O1（XRing O1）芯片发布：中国大陆首款自主研发设计的3nm手机SoC芯片，集成自研AI NPU，实现端侧AI推理加速。小米由此成为中国消费电子中极少数同时拥有自研芯片、OS、大模型（MiMo）三项核心能力的公司。

2025年7月 — HAD 1000万clips版本OTA升级：小米汽车推送HAD重大OTA，训练数据从300万clips扩充至1000万clips，辅助驾驶能力大幅跃升；同月开放全国门店「零接管」端到端体验试驾，标志着端到端系统进入公开验证阶段。

2025年11月 — Xiaomi Miloco发布（全屋智能AI）：专为家居场景优化的视觉-语言多模态模型，基于MiMo构建，支持本地运行，连接米家平台超10亿台设备，摆脱传统智能家居「规则预设」模式，AI根据实时上下文自主判断执行动作。

2025年11月12日 — 罗福莉官宣加入小米，任MiMo大模型团队负责人：前DeepSeek核心研究员罗福莉正式官宣加入小米，出任Xiaomi MiMo大模型负责人。她曾主导阿里达摩院多语言模型VECO研发，并参与DeepSeek-V2关键架构设计。

2025年11月21日 — Xiaomi HAD Enhanced版发布：小米在端到端基础上引入强化学习，发布HAD增强版，进一步提升复杂路况下的决策质量与行驶平顺性，是国内量产辅助驾驶系统中首批将RL纳入训练闭环的产品之一。

2025年11月22日 — MiMo-Embodied具身基础模型发布：小米首个跨具身域视觉-语言基础模型，同步覆盖具身智能与自动驾驶两大方向，涵盖环境感知、状态预测、驾驶规划等核心任务，在29项基准测试中达到同类最优。第一个将自动驾驶与具身AI统一建模的开源VLM。

2025年12月16日 — MiMo-V2-Flash发布：混合专家架构（MoE），总参数309B，每次推理仅激活15B参数，支持256K超长上下文。AIME 2025得分94.1%，与GPT-5 High（94.6%）持平，8项主要测试中7项超越DeepSeek-R1-0528，开源模型SWE-bench Verified排名全球第一。

2025年12月17日 — 小米首次公布MiMo API商业化定价：在「人车家全生态」合作伙伴大会上，小米正式公布MiMo-V2-Flash等模型的API定价方案（输入0.7元/百万token），标志着小米大模型服务正式进入商业化阶段，向120万全球开发者开放接入。

2026年2月5日 — HySparse混合稀疏注意力架构发布：小米AI团队发布HySparse，通过在标准全注意力层与稀疏注意力层之间交替排列、并共享KV Cache，在大幅降低推理计算量和显存占用的同时保持模型性能。在80B MoE模型上，仅5层保留全注意力，KV Cache存储减少近10倍。这一架构是MiMo-V2-Pro支持1M超长上下文、同时保持低推理成本的关键技术基础之一。

2026年2月12日 — Xiaomi-Robotics-0开源VLA模型发布：小米首个开源视觉-语言-动作（VLA）基础模型，专为机器人具身控制设计，4.7B参数，支持双臂机器人实时控制，将推理与运动控制分离，实现平滑、类人化的实时动作。选择开源路线，向开发者生态开放，对标英伟达Isaac平台的生态策略。

2026年3月2日 — 小米人形机器人进汽车工厂实测：小米人形机器人在汽车工厂压铸车间完成连续3小时自主作业，自攻螺母双侧安装成功率90.2%，满足76秒产线节拍，首次在真实工业环境中完成量产级可靠性验证，而非受控展示场景。

2026年3月 — 雷军宣布AIOS，提交机器人提案：雷军在全国人大公开宣布小米正在研发AIOS——从OS架构底层融入AI能力的下一代操作系统，将取代HyperOS，MiMo为其AI底层基座。他预判「2026年是L3/L4自动驾驶元年」和「具身智能大模型元年」，提交5份两会建议，首份为通用人形机器人监管框架。

2026年3月6日 — 小米Miclaw发布：中国首款系统级“手机龙虾”，以系统应用身份运行于HyperOS底层，底层推理引擎为MiMo，拥有50+系统级工具的原生API调用权限（非模拟点击），支持接入米家平台超10亿台IoT设备，实现跨设备任务执行。

2026年3月19日 — MiMo-V2-Pro、Omni、TTS三模型同步发布：MiMo-V2-Pro总参数超1万亿（激活42B），7:1混合注意力架构，支持1M超长上下文，在Artificial Analysis Intelligence Index全球排名第八（49分）。发布前以「Hunter Alpha」匿名身份在OpenRouter登顶日榜多天，累计调用量超1万亿token；正式发布后迅速登顶OpenRouter周榜第一，成为该平台有史以来首个单周token消耗量突破3万亿的模型，当周前六名全部被中国模型包揽。API定价$1/百万token，约为Claude Sonnet 4.6的五分之一。

2026年3月27日 — 机器人灵巧手全面重设计发布：小米将灵巧手尺寸从228mm×105mm×64mm压缩至187mm×88mm×36mm，主动自由度提升83%，总自由度提升50%。仿生汗腺液冷散热每分钟蒸发0.5mL水，提供约10瓦主动散热能力。全掌触觉传感器覆盖8200平方毫米，支持视觉遮挡时的掌内操作。抓握循环寿命从1万次量级提升至15万次以上，并提供61小时无加速原始测试视频。

读完这份图谱，简单总结几句。

我们可以看出小米从2024年底正式确定通用大模型战略，到今天不过15个月，已经推出了覆盖大模型、辅助驾驶、智能家居、Agent、具身智能的密集AI进展。我想，大部分投资者都低估了雷军和小米在AI领域的决心和投入——小米本质上是一家AI生态公司。

第一，技术底座决定上限。 MiMo是整个AI体系的技术底座，不是附属品。小米想明白了哪些技术是不能通过采购获取的，哪怕再难也要自己做。在MiMo之前，小米AI能力主要体现在端侧小模型，本质是特定场景的规则化响应，能力天花板低。

MiMo-7B标志着小米正式进入基座大模型赛道；今天的OpenRouter周榜数据，是市场对这条路线最直接的验证。没有MiMo，Miclaw和Miloco都无从建立——这是小米AI从依赖外部API到自主可控的技术分水岭。

第二，执行方式决定可信度。很多公司的机器人故事停留在发布会、展示视频、远期规划。小米选择了一条更难走但更扎实的路：用自有工厂作为测试场，把机器人直接放进真实产线，用实际成功率、节拍合规率来说话。

90.2%、3小时连续、76秒节拍——这些是可以被第三方核验的工业指标，不是公关数字。从工厂3小时连续作业到今天灵巧手15万次寿命测试，每次亮相都是上一个问题的针对性解答，而不是重新立一个新flag。

第三，物理AI是终极护城河。当前绝大多数AI仍停留在数字世界——处理文字、代码、图像。但AI的下一阶段必然指向感知、理解并直接作用于物理世界。

小米拥有全球独特的硬件组合：自研基座大模型提供推理能力、10亿+IoT连接设备构成感知网络、SU7/YU7是移动端物理AI的最高维度载体、人形机器人进工厂则是AI执行层能力的最前沿探索。全球几乎没有第二家公司能同时在智能手机、IoT、汽车三个维度落地物理AI。

对投资者而言，小米不只是AI叙事的弹性标的。它是中国AI生态中，极少数能同时覆盖技术层（大模型/SoC芯片/OS系统）、应用层（MiLoco / MiClaw）、硬件层（手机/IoT/汽车）、制造层（自有工厂）的全栈公司。

我们正处于中美AI两套生态平行演化的早期阶段，在这个框架下，能够同时握有技术底座、应用入口、硬件生态、制造能力的公司，是极其稀缺的。

AI领域的竞赛不会停止，也不存在自然收敛的终点 —— 小米在中国AI生态中的战略价值，只会随时间累积，而不会随某一轮热点消退。#小米科技[超话]#

发布于中国香港