网易首页 > 网易号 > 正文 申请入驻

MIT开发新方法,无需从头训练机器人即可执行复杂任务

0
分享至

在经典动画《杰森一家》中,机器人女佣 Rosie 可以轻松地从打扫房间切换到做饭、倒垃圾。然而在现实中,训练一个通用机器人却是极大的挑战。

通常,工程师会为某一特定的机器人和任务收集专门的数据,在一个受控环境中对其进行训练。然而,这种数据收集不仅成本高昂且耗时,并且机器人在陌生环境或新任务下往往难以适应。

为了训练更高效的通用机器人,MIT 的研究人员开发了一种灵活的技术,将来自多种来源的大量异质数据整合到一个系统中,以此来教授机器人多种任务。

这种方法通过对来自不同领域的数据(如仿真数据和实际机器人数据)以及多种模态(如视觉传感器和机械臂位置编码器)进行对齐,将它们转化为一种“通用语言”,使得生成式 AI 模型可以处理。

通过整合大量数据,这一方法可以用于训练机器人执行多种任务,而不必每次都从头开始训练。

这种方法不仅比传统技术更快速、成本更低,而且在模拟和现实实验中,相比从零开始的训练提高了超过 20% 的性能。

“在机器人学领域,大家常说训练数据不足。但在我看来,另一个大问题是数据来自于太多不同的领域、模态和机器人硬件。我们的研究展示了如何将这些数据整合起来训练机器人。”电气工程与计算机科学(EECS)专业的研究生、论文第一作者 Lirui Wang 说道。

Wang 的合作者包括同为 EECS 研究生的 Jialiang Zhao、Meta 研究科学家Xinlei Chen,以及资深作者、EECS 副教授和计算机科学与人工智能实验室(CSAIL)成员 Kaiming He。该研究将在神经信息处理系统会议上展示。

借鉴 LLM

机器人“策略”会接收来自传感器的观测数据,例如摄像头图像或机械臂的速度和位置测量数据,进而指导机器人如何移动、去往何处。

通常,策略通过模仿学习进行训练,即由人类演示操作或远程控制机器人生成数据,再将这些数据输入 AI 模型中进行学习。然而,由于这种方法使用的任务数据量较少,机器人在环境或任务发生变化时往往表现不佳。

为此,Wang 和他的团队借鉴了 GPT-4 等大型语言模型的理念。

这些模型在训练初期使用大量多样化的语言数据进行预训练,随后再通过少量的任务数据进行微调,如此大量的预训练数据使得模型能适应多种任务。

“语言领域中的数据都是句子,而机器人数据的多样性极大。如果想以类似的方式进行预训练,我们就需要不同的架构。”他说道。

机器人的数据形式多样,从摄像头图像到语言指令,再到深度图像。同时,每台机器人在机械上也各不相同,臂数、夹持器和传感器的排列各异,数据收集的环境也千差万别。

MIT 的研究人员因此开发了一种新架构,称为异质预训练变换器(HPT),将这些不同模态和领域的数据统一起来。

他们在架构的核心部分引入了一种名为变换器的机器学习模型,用于处理视觉和本体感受(proprioception)输入。变换器正是大型语言模型的基础。

研究人员将视觉和本体感受数据对齐为一种统一的输入形式,称为“token”,变换器可以处理,每种输入都以相同数量的 token 表示。

接着,变换器将所有输入映射到一个共享空间中,随着数据处理和学习量的增加,逐渐发展为一个大型预训练模型。变换器的规模越大,其表现也越好。

用户只需向 HPT 提供少量关于机器人设计、设置和目标任务的数据,HPT 便能将预训练期间获得的知识转移,学习新的任务。

实现灵活操作

开发 HPT 面临的最大挑战之一是建立用于预训练的庞大数据集,涵盖了 52 个数据集,包含超过 20 万条机器人轨迹,分为四个类别,包括人类示范视频和仿真数据。

研究人员还需要开发一种高效的方法,将来自传感器阵列的原始本体感受信号转化为变换器可处理的数据。

“本体感受对于实现很多灵巧的动作至关重要。由于在我们的架构中 token 数量总是相同,我们赋予本体感受和视觉相同的重要性,”Wang 解释道。

在测试中,HPT 在模拟和现实任务中的机器人表现相比每次从零开始的训练提升了超过 20%。即使任务与预训练数据差异较大,HPT 的性能仍然得到了提升。

“这篇论文为跨多种机器人结构训练单一策略提供了新的方法。这使得能够在多样的数据集上进行训练,并大幅扩大了机器人学习方法的数据集规模。同时,这种方法还能快速适应新的机器人结构,这对于新型机器人设计的不断出现尤为重要。”未参与该研究的卡内基梅隆大学机器人研究所副教授 David Held 说道。

未来,研究人员希望探索数据多样性对 HPT 性能的提升作用,同时计划增强 HPT,使其能够像 GPT-4 和其他大型语言模型一样处理无标注数据。

“我们的梦想是拥有一个通用的机器人‘大脑’,用户无需任何训练就能直接下载使用。虽然我们现在还处在起步阶段,但会继续努力,希望像大型语言模型的突破一样,在机器人策略上取得突破性进展。”他表示。

该研究部分由亚马逊大波士顿技术计划和丰田研究院资助。

https://news.mit.edu/2024/training-general-purpose-robots-faster-better-1028

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
许家印不是在宴请何小鹏,他是在演示什么叫权力

许家印不是在宴请何小鹏,他是在演示什么叫权力

超先声
2026-04-18 09:48:51
邱国渭在大陆生活三十年,78年分批将家人迁往美国,尽显坚韧执着

邱国渭在大陆生活三十年,78年分批将家人迁往美国,尽显坚韧执着

唠叨说历史
2026-04-01 10:40:04
魏建军发布会现场痛批营销团队5分钟:无法转化工程师成果“相当于犯罪”

魏建军发布会现场痛批营销团队5分钟:无法转化工程师成果“相当于犯罪”

三言科技
2026-04-18 20:55:06
广西全面进入汛期!大暴雨+9级雷暴大风+冰雹来袭,柳州天气即将“变脸”

广西全面进入汛期!大暴雨+9级雷暴大风+冰雹来袭,柳州天气即将“变脸”

鲁中晨报
2026-04-18 21:44:05
张本智和怒了:我是自愿退出中国籍加入日本籍,凭啥让我滚出中国

张本智和怒了:我是自愿退出中国籍加入日本籍,凭啥让我滚出中国

拳击时空
2026-04-18 13:11:30
山西医科大学二院事件:医师医德为何如此败坏

山西医科大学二院事件:医师医德为何如此败坏

原某报记者
2026-04-18 14:16:54
张雪峰公司又爆新情况,员工又走两人,新任接班人直言,撑不住了

张雪峰公司又爆新情况,员工又走两人,新任接班人直言,撑不住了

魔都姐姐杂谈
2026-04-18 21:10:20
黄蜂附加赛不敌魔术,创下NBA尴尬历史纪录!

黄蜂附加赛不敌魔术,创下NBA尴尬历史纪录!

夜白侃球
2026-04-18 21:07:43
第二波警告!美不准中国船只通行否则严厉制裁,五角大楼已增兵

第二波警告!美不准中国船只通行否则严厉制裁,五角大楼已增兵

叹知
2026-04-17 22:27:20
伊朗在核问题上忽悠国际二十多年,直到遇上不按常理出牌的川普

伊朗在核问题上忽悠国际二十多年,直到遇上不按常理出牌的川普

壹家言
2026-04-18 06:07:05
同曦告别季后赛,山东五连败濒临崩盘,队内矛盾爆发

同曦告别季后赛,山东五连败濒临崩盘,队内矛盾爆发

梦忆之浅
2026-04-19 01:19:38
禁令的苦果出现了!中国加速替代后,日媒哀嚎:我们的根被弄断了

禁令的苦果出现了!中国加速替代后,日媒哀嚎:我们的根被弄断了

大卫聊科技
2026-04-18 12:08:17
费迪南德:海文只要100万英镑这笔引援必须好好夸一夸

费迪南德:海文只要100万英镑这笔引援必须好好夸一夸

懂球帝
2026-04-19 05:29:08
国内或将逐渐停止肠镜检查?做检查对身体有影响?医生告诉您真相

国内或将逐渐停止肠镜检查?做检查对身体有影响?医生告诉您真相

健康科普365
2026-04-17 20:05:08
苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

川渝视觉
2026-04-17 22:13:14
我醉后对女上司说:再扣工资我就娶了你,第二天她把我叫到办公室

我醉后对女上司说:再扣工资我就娶了你,第二天她把我叫到办公室

千秋文化
2026-04-16 20:15:29
19分大翻盘!广东83-95福建,杜锋赛后发言:我不理解

19分大翻盘!广东83-95福建,杜锋赛后发言:我不理解

隐于山海
2026-04-19 02:32:28
71.5%!历史性暴跌,以贷养贷的泡沫崩了

71.5%!历史性暴跌,以贷养贷的泡沫崩了

月满大江流
2026-04-16 13:54:38
花了1万5和梅根合照,结果梅根却对着粉丝大倒苦水:我生活真难啊!

花了1万5和梅根合照,结果梅根却对着粉丝大倒苦水:我生活真难啊!

英国那些事儿
2026-04-18 23:20:17
蓝营内斗升级!超20位蓝委集体倒戈,公开反对郑丽文!

蓝营内斗升级!超20位蓝委集体倒戈,公开反对郑丽文!

瞻史
2026-04-18 17:47:28
2026-04-19 05:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16595文章数 514889关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华回应潘宏彬去世,拒谈丧礼细节

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

艺术
游戏
家居
旅游
公开课

艺术要闻

夜色下的欧洲

让老粥批直呼“计划有变”的岁兽代理人,到底是什么东西?

家居要闻

法式线条 时光静淌

旅游要闻

申城周末开启“繁花”模式:前滩800米欧式花街变身庄园 全城百个橱窗联动“拥抱”春天

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版