
Helix是由Figure AI发布的新型通用视觉-语言-动作(VLA)模型,旨在通过自然语言指令控制人形机器人的动作。该模型标志着人形机器人技术的重大突破,能够实现对机器人上半身的高速连续控制,并支持多机器人协作。

Helix功能特点:
1、全上半身控制:
– Helix是首个能够对人形机器人上半身(包括手腕、躯干、头部和单个手指)进行高速率(200Hz)连续控制的VLA模型,实现高精度的动作协调。
2、多机器人协作:
– Helix支持两台机器人同时运行同一套神经网络权重,实现协作完成任务,例如共同搬运或整理物品。
3、自然语言理解与执行:
– 机器人能够基于自然语言指令完成各种任务,例如拿起从未见过的物品、操作抽屉或冰箱等。
4、强大的泛化能力:
– Helix能够处理数千种形状、大小和材质各异的物品,无需针对具体任务进行微调。

5、低功耗高效能:
– Helix是首个完全在嵌入式低功耗GPU上运行的VLA模型,具备即时商业部署的能力。
6、单一神经网络权重:
– Helix使用一组神经网络权重来学习所有行为,无需针对具体任务进行微调,大大简化了机器人的训练和部署过程。
7、技术创新:
– 双系统架构:Helix采用“系统1”和“系统2”的双系统架构。系统1负责快速反应和动作执行,系统2则处理高层次的视觉和语言理解,两者协同工作,实现高效的任务执行。
– 高效训练:Helix仅用500小时的高质量监督数据进行训练,数据量不到之前VLA数据集的5%,且无需多机器人数据或多阶段训练。
8、应用前景:
– Helix的发布为家庭服务机器人、工业自动化和医疗辅助等领域带来了新的可能性。Figure AI表示,Helix的目标是攻克通用机器人技术,让每个家庭都能拥有一台机器人。
Actio Ui 7b Rlvr GGUF:Uniphore官方发布的70亿参数GUI自动化视觉语言模型
Thinker:优必选开源具身智能视觉语言大模型 专为机器人场景打造
白虎-VTouch:一个跨本体视触觉多模态的机器人操作数据集
FG-CLIP 2:360推出的新一代开源双语细粒度视觉语言对齐模型
DeepSeek-OCR:DeepSeek团队开源的高效长文本视觉语言处理模型
上面是“Helix:一款由Figure AI发布的新型通用视觉语言动作(VLA)模型”的全面内容,想了解更多关于 AI应用 内容,请继续关注web建站教程。
当前网址:https://m.ipkd.cn/webs_17708.html
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

帝国cms(EmpireCMS6.0)排行榜的调用方法总结
Trace APP最新版
网站加载中loading..样式五代码介绍
考试宝官网首页入口,支持多种格式的题库导入
一款专为科研人员设计的AI深度文献检索工具——Ai2 PaperFinder