Helix是由Figure AI发布的新型通用视觉-语言-动作(VLA)模型,旨在通过自然语言指令控制人形机器人的动作。该模型标志着人形机器人技术的重大突破,能够实现对机器人上半身的高速连续控制,并支持多机器人协作。
Helix功能特点:
1、全上半身控制:
– Helix是首个能够对人形机器人上半身(包括手腕、躯干、头部和单个手指)进行高速率(200Hz)连续控制的VLA模型,实现高精度的动作协调。
2、多机器人协作:
– Helix支持两台机器人同时运行同一套神经网络权重,实现协作完成任务,例如共同搬运或整理物品。
3、自然语言理解与执行:
– 机器人能够基于自然语言指令完成各种任务,例如拿起从未见过的物品、操作抽屉或冰箱等。
4、强大的泛化能力:
– Helix能够处理数千种形状、大小和材质各异的物品,无需针对具体任务进行微调。
5、低功耗高效能:
– Helix是首个完全在嵌入式低功耗GPU上运行的VLA模型,具备即时商业部署的能力。
6、单一神经网络权重:
– Helix使用一组神经网络权重来学习所有行为,无需针对具体任务进行微调,大大简化了机器人的训练和部署过程。
7、技术创新:
– 双系统架构:Helix采用“系统1”和“系统2”的双系统架构。系统1负责快速反应和动作执行,系统2则处理高层次的视觉和语言理解,两者协同工作,实现高效的任务执行。
– 高效训练:Helix仅用500小时的高质量监督数据进行训练,数据量不到之前VLA数据集的5%,且无需多机器人数据或多阶段训练。
8、应用前景:
– Helix的发布为家庭服务机器人、工业自动化和医疗辅助等领域带来了新的可能性。Figure AI表示,Helix的目标是攻克通用机器人技术,让每个家庭都能拥有一台机器人。
一款由浙大阿里巴巴等多家机构联合开发的先进医学视觉语言模型——HealthGPT
上面是“Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型”的全面内容,想了解更多关于 手机应用 内容,请继续关注web建站教程。
当前网址:https://m.ipkd.cn/webs_17708.html
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!