Xiaomi-Robotics-0模型官网首页入口,小米开源的首代机器人VLA(视觉-语言-动作)大模型

Xiaomi-Robotics-0模型是小米开源的首代机器人VLA(视觉-语言-动作)大模型,搭载47亿参数,创新采用MoT混合架构——以Qwen3-VL多模态模型为“大脑”,负责解析视觉与语言指令、理解场景意图;以Diffusion Transformer(DiT)为“小脑”,专注生成高频平滑动作块。

Qwen3-VL小米开源AI机器人VLA模型