#will的小米基本面研究#
小米在资本市场的叙事已经明显转向AI —— 近期很多机构的AI研究员都开始重新审视小米,我也因此系统整理了一份2025年至今的小米AI及硬核技术发布图谱,供大家参考。
2024年底 — 万卡GPU集群立项,MiMo自研启动:小米正式启动万卡GPU集群建设,以「Core」为内部代号成立大模型核心团队,雷军亲自主导方向,初始资源约6500卡GPU,向万卡规模持续扩建。
2025年2月26日 — HAD端到端辅助驾驶推送:小米汽车正式向SU7用户全量推送端到端全场景HAD,训练数据规模300万clips,实现从出发到目的地自动泊车的全流程覆盖,成为中国首批完成端到端辅助驾驶全量交付的车企之一。
2025年4月30日 — MiMo-7B大模型发布:小米首个开源大语言模型,7B参数。AIME 2025数学推理得分55.4,超越OpenAI o1-mini 4.7分,代码生成超越参数量是其4倍以上的阿里云Qwen-32B-Preview。
2025年5月 — 小米玄戒O1(XRing O1)芯片发布:中国大陆首款自主研发设计的3nm手机SoC芯片,集成自研AI NPU,实现端侧AI推理加速。小米由此成为中国消费电子中极少数同时拥有自研芯片、OS、大模型(MiMo)三项核心能力的公司。
2025年7月 — HAD 1000万clips版本OTA升级:小米汽车推送HAD重大OTA,训练数据从300万clips扩充至1000万clips,辅助驾驶能力大幅跃升;同月开放全国门店「零接管」端到端体验试驾,标志着端到端系统进入公开验证阶段。
2025年11月 — Xiaomi Miloco发布(全屋智能AI):专为家居场景优化的视觉-语言多模态模型,基于MiMo构建,支持本地运行,连接米家平台超10亿台设备,摆脱传统智能家居「规则预设」模式,AI根据实时上下文自主判断执行动作。
2025年11月12日 — 罗福莉官宣加入小米,任MiMo大模型团队负责人:前DeepSeek核心研究员罗福莉正式官宣加入小米,出任Xiaomi MiMo大模型负责人。她曾主导阿里达摩院多语言模型VECO研发,并参与DeepSeek-V2关键架构设计。
2025年11月21日 — Xiaomi HAD Enhanced版发布:小米在端到端基础上引入强化学习,发布HAD增强版,进一步提升复杂路况下的决策质量与行驶平顺性,是国内量产辅助驾驶系统中首批将RL纳入训练闭环的产品之一。
2025年11月22日 — MiMo-Embodied具身基础模型发布:小米首个跨具身域视觉-语言基础模型,同步覆盖具身智能与自动驾驶两大方向,涵盖环境感知、状态预测、驾驶规划等核心任务,在29项基准测试中达到同类最优。第一个将自动驾驶与具身AI统一建模的开源VLM。
2025年12月16日 — MiMo-V2-Flash发布:混合专家架构(MoE),总参数309B,每次推理仅激活15B参数,支持256K超长上下文。AIME 2025得分94.1%,与GPT-5 High(94.6%)持平,8项主要测试中7项超越DeepSeek-R1-0528,开源模型SWE-bench Verified排名全球第一。
2025年12月17日 — 小米首次公布MiMo API商业化定价:在「人车家全生态」合作伙伴大会上,小米正式公布MiMo-V2-Flash等模型的API定价方案(输入0.7元/百万token),标志着小米大模型服务正式进入商业化阶段,向120万全球开发者开放接入。
2026年2月5日 — HySparse混合稀疏注意力架构发布:小米AI团队发布HySparse,通过在标准全注意力层与稀疏注意力层之间交替排列、并共享KV Cache,在大幅降低推理计算量和显存占用的同时保持模型性能。在80B MoE模型上,仅5层保留全注意力,KV Cache存储减少近10倍。这一架构是MiMo-V2-Pro支持1M超长上下文、同时保持低推理成本的关键技术基础之一。
2026年2月12日 — Xiaomi-Robotics-0开源VLA模型发布:小米首个开源视觉-语言-动作(VLA)基础模型,专为机器人具身控制设计,4.7B参数,支持双臂机器人实时控制,将推理与运动控制分离,实现平滑、类人化的实时动作。选择开源路线,向开发者生态开放,对标英伟达Isaac平台的生态策略。
2026年3月2日 — 小米人形机器人进汽车工厂实测:小米人形机器人在汽车工厂压铸车间完成连续3小时自主作业,自攻螺母双侧安装成功率90.2%,满足76秒产线节拍,首次在真实工业环境中完成量产级可靠性验证,而非受控展示场景。
2026年3月 — 雷军宣布AIOS,提交机器人提案:雷军在全国人大公开宣布小米正在研发AIOS——从OS架构底层融入AI能力的下一代操作系统,将取代HyperOS,MiMo为其AI底层基座。他预判「2026年是L3/L4自动驾驶元年」和「具身智能大模型元年」,提交5份两会建议,首份为通用人形机器人监管框架。
2026年3月6日 — 小米Miclaw发布:中国首款系统级“手机龙虾”,以系统应用身份运行于HyperOS底层,底层推理引擎为MiMo,拥有50+系统级工具的原生API调用权限(非模拟点击),支持接入米家平台超10亿台IoT设备,实现跨设备任务执行。
2026年3月19日 — MiMo-V2-Pro、Omni、TTS三模型同步发布:MiMo-V2-Pro总参数超1万亿(激活42B),7:1混合注意力架构,支持1M超长上下文,在Artificial Analysis Intelligence Index全球排名第八(49分)。发布前以「Hunter Alpha」匿名身份在OpenRouter登顶日榜多天,累计调用量超1万亿token;正式发布后迅速登顶OpenRouter周榜第一,成为该平台有史以来首个单周token消耗量突破3万亿的模型,当周前六名全部被中国模型包揽。API定价$1/百万token,约为Claude Sonnet 4.6的五分之一。
2026年3月27日 — 机器人灵巧手全面重设计发布:小米将灵巧手尺寸从228mm×105mm×64mm压缩至187mm×88mm×36mm,主动自由度提升83%,总自由度提升50%。仿生汗腺液冷散热每分钟蒸发0.5mL水,提供约10瓦主动散热能力。全掌触觉传感器覆盖8200平方毫米,支持视觉遮挡时的掌内操作。抓握循环寿命从1万次量级提升至15万次以上,并提供61小时无加速原始测试视频。
读完这份图谱,简单总结几句。
我们可以看出小米从2024年底正式确定通用大模型战略,到今天不过15个月,已经推出了覆盖大模型、辅助驾驶、智能家居、Agent、具身智能的密集AI进展。我想,大部分投资者都低估了雷军和小米在AI领域的决心和投入——小米本质上是一家AI生态公司。
第一,技术底座决定上限。 MiMo是整个AI体系的技术底座,不是附属品。小米想明白了哪些技术是不能通过采购获取的,哪怕再难也要自己做。在MiMo之前,小米AI能力主要体现在端侧小模型,本质是特定场景的规则化响应,能力天花板低。
MiMo-7B标志着小米正式进入基座大模型赛道;今天的OpenRouter周榜数据,是市场对这条路线最直接的验证。没有MiMo,Miclaw和Miloco都无从建立——这是小米AI从依赖外部API到自主可控的技术分水岭。
第二,执行方式决定可信度。 很多公司的机器人故事停留在发布会、展示视频、远期规划。小米选择了一条更难走但更扎实的路:用自有工厂作为测试场,把机器人直接放进真实产线,用实际成功率、节拍合规率来说话。
90.2%、3小时连续、76秒节拍——这些是可以被第三方核验的工业指标,不是公关数字。从工厂3小时连续作业到今天灵巧手15万次寿命测试,每次亮相都是上一个问题的针对性解答,而不是重新立一个新flag。
第三,物理AI是终极护城河。 当前绝大多数AI仍停留在数字世界——处理文字、代码、图像。但AI的下一阶段必然指向感知、理解并直接作用于物理世界。
小米拥有全球独特的硬件组合:自研基座大模型提供推理能力、10亿+IoT连接设备构成感知网络、SU7/YU7是移动端物理AI的最高维度载体、人形机器人进工厂则是AI执行层能力的最前沿探索。全球几乎没有第二家公司能同时在智能手机、IoT、汽车三个维度落地物理AI。
对投资者而言,小米不只是AI叙事的弹性标的。 它是中国AI生态中,极少数能同时覆盖技术层(大模型/SoC芯片/OS系统)、应用层(MiLoco / MiClaw)、硬件层(手机/IoT/汽车)、制造层(自有工厂)的全栈公司。
我们正处于中美AI两套生态平行演化的早期阶段,在这个框架下,能够同时握有技术底座、应用入口、硬件生态、制造能力的公司,是极其稀缺的。
AI领域的竞赛不会停止,也不存在自然收敛的终点 —— 小米在中国AI生态中的战略价值,只会随时间累积,而不会随某一轮热点消退。#小米科技[超话]#
