UnifoLM-VLA-0:宇树科技开源的通用视觉-语言-动作大模型

UnifoLM-VLA-0是宇树科技开源的通用视觉-语言-动作(VLA)大模型,基于Qwen2.5-VL-7B架构完成持续预训练,核心通过融合2D/3D空间感知、轨迹预测等多维监督信号,实现从视觉语言理解到具身智能体的技术进化。

AI通用机器人宇树科技
UnifoLM-WMA-0:宇树科技开源跨机器人架构,赋能通用机器人自主学习与决策

UnifoLM-WMA-0架构已成功部署于真实机器人,实现动作可控生成与长期交互生成的双重突破,显著提升机器人在复杂动态环境中的自主学习与决策能力。

宇树科技机器人框架