Helix：一款由Figure AI发布的新型通用视觉语言动作(VLA)模型

Helix是由Figure AI发布的新型通用视觉-语言-动作（VLA）模型，旨在通过自然语言指令控制人形机器人的动作。该模型标志着人形机器人技术的重大突破，能够实现对机器人上半身的高速连续控制，并支持多机器人协作。

Helix：一款由Figure AI发布的新型通用视觉语言动作(VLA)模型1

1、全上半身控制：

– Helix是首个能够对人形机器人上半身（包括手腕、躯干、头部和单个手指）进行高速率（200Hz）连续控制的VLA模型，实现高精度的动作协调。

2、多机器人协作：

– Helix支持两台机器人同时运行同一套神经网络权重，实现协作完成任务，例如共同搬运或整理物品。

3、自然语言理解与执行：

– 机器人能够基于自然语言指令完成各种任务，例如拿起从未见过的物品、操作抽屉或冰箱等。

4、强大的泛化能力：

– Helix能够处理数千种形状、大小和材质各异的物品，无需针对具体任务进行微调。

Helix：一款由Figure AI发布的新型通用视觉语言动作(VLA)模型2

5、低功耗高效能：

– Helix是首个完全在嵌入式低功耗GPU上运行的VLA模型，具备即时商业部署的能力。

6、单一神经网络权重：

– Helix使用一组神经网络权重来学习所有行为，无需针对具体任务进行微调，大大简化了机器人的训练和部署过程。

7、技术创新：

– 双系统架构：Helix采用“系统1”和“系统2”的双系统架构。系统1负责快速反应和动作执行，系统2则处理高层次的视觉和语言理解，两者协同工作，实现高效的任务执行。

– 高效训练：Helix仅用500小时的高质量监督数据进行训练，数据量不到之前VLA数据集的5%，且无需多机器人数据或多阶段训练。

8、应用前景：

– Helix的发布为家庭服务机器人、工业自动化和医疗辅助等领域带来了新的可能性。Figure AI表示，Helix的目标是攻克通用机器人技术，让每个家庭都能拥有一台机器人。

上面是“Helix：一款由Figure AI发布的新型通用视觉语言动作(VLA)模型”的全面内容，想了解更多关于 AI应用 内容，请继续关注web建站教程。

当前网址：https://m.ipkd.cn/webs_17708.html

声明：本站提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请发送到邮箱：admin@ipkd.cn，我们会在看到邮件的第一时间内为您处理！