【千问大模型家族首个完整的具身智能模型系列】6月16日，阿里巴巴发布千问具身智能大模型Qwen-Robot系列，包含VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld三大模型。据了解，这是千问大模型家族首个完整的具身智能模型系列，三个模型分别为机器人装上灵巧的手

【千问大模型家族首个完整的具身智能模型系列】

6月16日，阿里巴巴发布千问具身智能大模型Qwen-Robot系列，包含VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld三大模型。

据了解，这是千问大模型家族首个完整的具身智能模型系列，三个模型分别为机器人装上灵巧的手、认路的脚和会思考的大脑。#人工智能#

Qwen-RobotNav：物理智能体的行动入口 — 通过可控观测编码和工具接口，把视觉语言能力接入移动控制，统一了指令跟随、点 / 目标导航、目标追踪和自动驾驶四类任务。

Qwen-RobotManip：物理智能体的交互基石 — 通过规范状态-动作空间和相机坐标系下的末端执行器增量位姿，把视觉语言能力接入操作控制，基于完全由开源数据构建的 >38,100 小时语料库实现了大规模多机型训练。

Qwen-RobotWorld：物理智能体的无限世界 — 通过自然语言动作接口，把视觉语言能力接入世界动态预测，让同一个世界模型能够跨操作、驾驶和导航场景预测符合物理规律的未来。

大语言模型（LLM）是在数字世界里对话和生成内容，而具身智能（Embodied Intelligence）则将这一能力延展到现实物理世界中。当前，全球具身智能行业正处于从“实验室研发”向“真实场景商业化”跨越的临界点，能否在陌生环境里听懂指令、稳定执行，是这道门槛的关键。

发布于山东