网易首页 > 网易号 > 正文 申请入驻

断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身

0
分享至

白交 发自 凹非寺
量子位 | 公众号 QbitAI

与OpenAI断交之后,Figure首个成果出炉:

Helix,一个端到端通用控制模型,它能让机器人像人一样感知、理解和行动。

只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西,比如这个活泼的小仙人掌。

从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。

“机器人站着不语,只是一味地执行指令”

两个机器人也可以共同协作,但有意思的一点是,他们竟然共用同一组神经网络

△加速2倍

来看看具体是怎么一回事。

像人类一样思考的AI

从技术报告上看,这个通用“视觉-语言-动作” (VLA) 模型完成了一系列的首创:

整个上身控制,Helix是首个能对整个上身(包括手腕、躯干、头部和各个手指)进行高速率(200Hz)连续控制的VLA。

多机器人协作,第一个同时在两个机器人上运行的 VLA,使它们能够使用从未见过的物品解决共享的、远程操作任务。

拿起任何东西,只需按照自然语言提示,就能拿起几乎任何小型家居物品,包括数千种它们从未遇到过的物品。

一个神经网络,与之前的方法不同,Helix 使用一组神经网络权重来学习所有行为(挑选和放置物品、使用抽屉和冰箱以及跨机器人交互),而无需任何针对特定任务的微调。

可立即商业化部署,第一款完全在嵌入式低功耗 GPU 上运行的 VLA,可立即进行商业部署。

Helix由两个系统组成,两个系统经过端到端训练,并且可以进行通信。

系统2:VLM主干,基于在互联网规模数据上预训练的7B开源VLM,它将单目机器人图像和机器人状态信息(包括手腕姿势和手指位置)投射到视觉语言嵌入空间后进行处理。

工作频率为 7-9 Hz,用于场景理解和语言理解,可对不同对象和语境进行广泛的泛化。

系统1:80M参数的交叉注意力Transformer,用于处理底层控制。它依靠一个完全卷积、多尺度的视觉骨干网进行视觉处理,该骨干网由完全在模拟中完成的预训练初始化而成。

将 S2 生成的潜在语义表征转化为精确的连续机器人动作,包括所需的手腕姿势、手指弯曲和外展控制,以及躯干和头部方向目标。速度为200Hz。

他们在动作空间中附加了一个合成的 “任务完成百分比 ”动作,使 Helix 能够预测自己的终止条件,从而更容易对多个任务进行排序。

这种解耦架构允许每个系统在其最佳时间尺度上运行。S2可以“慢慢思考”高级目标,而 S1 可以“快速思考”以实时执行和调整动作。

训练过程是完全端到端,从原始像素和文本命令映射到具有标准回归损失的连续动作。

并且Helix 不需要针对特定任务进行调整;它保持单个训练阶段和单个神经网络权重集,无需单独的动作头或每个任务的微调阶段。

人形机器人的Scaling Law

CEO透露,这项工作他们花费了一年多的时间,旨在解决通用机器人问题——

像人类一样,Helix可以理解语音、推理问题并能抓住任何物体。

而就在两周前,他们宣布取消与OpenAI之间的合作关系,当时就透露会在接下来的30天展示“没人在人形机器人上见过的东西”

如今已经揭晓,就是Helix。

值得一提的是,Helix还代表着一种新型的Scaling Law。

他们认为,家庭是机器人面临的最大挑战。与受控的工业环境不同,家里堆满了无数的物品。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。

当前,教机器人一种新行为需要大量的人力。要么是数小时的博士级专家手动编程,要么是数千次演示。

这两种方式成本都很高,所以都是行不通的(dont work)。

与早期的机器人系统不同,Helix能够即时生成长视界、协作、灵巧的操作,而无需任何特定任务的演示或大量的手动编程。

Helix 表现出强大的对象泛化能力,能够拾取数千种形状、大小、颜色和材料特性各异的新奇家居用品,而这些物品在训练中从未见过,只需用自然语言询问即可。

这意味着,这代表 Figure 在扩展人形机器人行为方面迈出了变革性的一步。

到时候,当Helix 扩大1000倍、机器人扩展到十亿级别,会是什么样子?有点子期待。

参考链接:
[1]https://www.figure.ai/news/helix
[2]https://x.com/adcock_brett/status/1892577936869327233

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你抛美债,我抛中债!外资纷纷减持中国债,大量资金流向美国?

你抛美债,我抛中债!外资纷纷减持中国债,大量资金流向美国?

掉了颗大白兔糖
2026-04-22 11:57:00
毒打运动员独吞上百万奖金,体坛狠心教练,放狼狗盯着运动员

毒打运动员独吞上百万奖金,体坛狠心教练,放狼狗盯着运动员

何揎室内设计
2026-04-20 15:48:29
14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

大鱼简科
2026-02-07 09:52:29
王为念近况:一头紫发祭拜老母,被腿伤折磨多年,今66岁孤身一人

王为念近况:一头紫发祭拜老母,被腿伤折磨多年,今66岁孤身一人

以茶带书
2026-04-21 17:18:08
“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

妍妍教育日记
2026-04-15 09:30:09
我退伍后去女战友家里开的工厂应聘,她红着脸说:你娶我好吗?

我退伍后去女战友家里开的工厂应聘,她红着脸说:你娶我好吗?

千秋文化
2026-04-18 19:07:07
公司突然取消外包保安,安排两员工24小时轮流值班,堪称极致降本

公司突然取消外包保安,安排两员工24小时轮流值班,堪称极致降本

捣蛋窝
2026-04-21 21:58:20
“我是宣威人为何不能卖火腿?”云南一商家网售“宣威火腿”被诉侵权

“我是宣威人为何不能卖火腿?”云南一商家网售“宣威火腿”被诉侵权

封面新闻
2026-04-21 18:15:02
睡遍好莱坞的种马影帝:性欲成瘾每天与情人交欢,私生子多达25人

睡遍好莱坞的种马影帝:性欲成瘾每天与情人交欢,私生子多达25人

钱小刀娱乐
2026-04-15 21:30:57
高温正在偷走巴西孩子的身高

高温正在偷走巴西孩子的身高

薛定谔的BUG
2026-04-21 15:01:19
总部人去楼空!上千家供应商被欠4亿货款,这场骗局精心设计仅7天

总部人去楼空!上千家供应商被欠4亿货款,这场骗局精心设计仅7天

小祁谈历史
2026-04-20 22:09:33
依靠武器,可全歼3万中国军队,美解密文件:一个印军少校的电报

依靠武器,可全歼3万中国军队,美解密文件:一个印军少校的电报

正观历史
2026-04-21 12:03:38
2200万美元成本,《木乃伊》夺得季军,温子仁和华纳兄弟小赚一笔

2200万美元成本,《木乃伊》夺得季军,温子仁和华纳兄弟小赚一笔

电影票房预告片
2026-04-21 23:32:00
四川一车主因在临时占道停车场累计停车2411次,拖欠停车费13268元,长期拒不缴纳,被法院判决全额支付欠款,并承担逾期利息

四川一车主因在临时占道停车场累计停车2411次,拖欠停车费13268元,长期拒不缴纳,被法院判决全额支付欠款,并承担逾期利息

潇湘晨报
2026-04-21 15:19:11
时长超三小时的6部史诗级电影,全程无尿点,看完直接封神

时长超三小时的6部史诗级电影,全程无尿点,看完直接封神

小微看电影
2026-04-21 14:15:03
“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

巢客HOME
2026-04-08 15:48:09
AI时代最贵的“布”,到底有多抢手?

AI时代最贵的“布”,到底有多抢手?

钛媒体APP
2026-04-21 16:56:54
身材丰满女生,这样打扮既显瘦显腿长,又有女人味

身材丰满女生,这样打扮既显瘦显腿长,又有女人味

美女穿搭分享
2026-04-20 13:54:46
日本再放大招,赌我们不会先动手!人民日报发声,对其称呼都变了

日本再放大招,赌我们不会先动手!人民日报发声,对其称呼都变了

一口娱乐
2026-04-22 11:47:50
青岛多名车主在金盾加油站加油后   遇“问题油”:能启动、跑不动,油表失灵

青岛多名车主在金盾加油站加油后 遇“问题油”:能启动、跑不动,油表失灵

西莫的艺术宫殿
2026-04-22 00:31:03
2026-04-22 13:27:00
量子位 incentive-icons
量子位
追踪人工智能动态
12511文章数 176457关注度
往期回顾 全部

科技要闻

凌晨突发!ChatGPT Images 2.0发布

头条要闻

KTV服务员被指强奸14岁女生 官方通报

头条要闻

KTV服务员被指强奸14岁女生 官方通报

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

复婚无望!baby黄晓明陪小海绵零交流

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

四款全球首秀+AI落地 大众汽车集团在华转型全面提速

态度原创

房产
游戏
本地
艺术
公开课

房产要闻

狂抢284轮!中海海口再拿重磅宅地!

预计680元起 黑旗RE典藏版内容曝光!雕像等超多好礼

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

艺术要闻

无花不风景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版