Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型

57 ℃

Helix是由Figure AI发布的新型通用视觉-语言-动作(VLA)模型,旨在通过自然语言指令控制人形机器人的动作。该模型标志着人形机器人技术的重大突破,能够实现对机器人上半身的高速连续控制,并支持多机器人协作。

Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型1

Helix功能特点:

1、全上半身控制

– Helix是首个能够对人形机器人上半身(包括手腕、躯干、头部和单个手指)进行高速率(200Hz)连续控制的VLA模型,实现高精度的动作协调。

2、多机器人协作

– Helix支持两台机器人同时运行同一套神经网络权重,实现协作完成任务,例如共同搬运或整理物品。

3、自然语言理解与执行

– 机器人能够基于自然语言指令完成各种任务,例如拿起从未见过的物品、操作抽屉或冰箱等。

4、强大的泛化能力

– Helix能够处理数千种形状、大小和材质各异的物品,无需针对具体任务进行微调。

Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型2

5、低功耗高效能

– Helix是首个完全在嵌入式低功耗GPU上运行的VLA模型,具备即时商业部署的能力。

6、单一神经网络权重

– Helix使用一组神经网络权重来学习所有行为,无需针对具体任务进行微调,大大简化了机器人的训练和部署过程。

7、技术创新

– 双系统架构:Helix采用“系统1”和“系统2”的双系统架构。系统1负责快速反应和动作执行,系统2则处理高层次的视觉和语言理解,两者协同工作,实现高效的任务执行。

– 高效训练:Helix仅用500小时的高质量监督数据进行训练,数据量不到之前VLA数据集的5%,且无需多机器人数据或多阶段训练。

8、应用前景

– Helix的发布为家庭服务机器人、工业自动化和医疗辅助等领域带来了新的可能性。Figure AI表示,Helix的目标是攻克通用机器人技术,让每个家庭都能拥有一台机器人。

一款由浙大阿里巴巴等多家机构联合开发的先进医学视觉语言模型——HealthGPT

标签: AI视觉语言模型, 人形机器人

上面是“Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型”的全面内容,想了解更多关于 手机应用 内容,请继续关注web建站教程。

当前网址:https://m.ipkd.cn/webs_17708.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

js判断用户是否开启AdBlock Plus
vue如何利用路由改变地址栏的参数
去掉织梦DedeCMS Tag标签12字节数的限制的方法
百度echarts如何在legend中显示数字百分比
wordpress如何在页面中显示当前浏览器版本