网易首页 > 网易号 > 正文 申请入驻

机器人会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

0
分享至

研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨专业研究者组成,致力于具身智能领域的前沿研究。团队成员在开发高效、智能的通用机器人技术,特别是机械灵巧手操作方面,拥有丰富的研究经验。一作为北京通用人工智能研究院研究员李恺林,其它作者为清华大学博士生李浦豪、北京通用人工智能研究院研究员刘腾宇、北京大学博士生李宇飏;通讯作者为北京通用人工智能研究院研究员黄思远。

近年来,具身智能领域发展迅猛,使机器人在复杂任务中拥有接近人类水平的双手操作能力,不仅具有重要的研究与应用价值,也是迈向通用人工智能的关键一步。

目前,数据驱动的具身智能算法仍需要精确、大规模且高度灵活的灵巧手动作序列。然而,传统的强化学习或真机遥操作方法通常难以高效获取此类数据。

为了解决这一问题,北京通用人工智能研究院联合清华大学、北京大学的研究人员提出了一种两阶段方法——ManipTrans,可在仿真环境中高效地将人类双手操作技能迁移至机器人灵巧手。

  • 论文地址:MANIPTRANS: Efficient Dexterous Bimanual Manipulation Transfer via Residual Learning
  • 论文链接:https://arxiv.org/pdf/2503.21860
  • 项目主页:https://maniptrans.github.io
  • 代码与数据集:https://github.com/ManipTrans/ManipTrans

ManipTrans首先利用通用轨迹模仿器的预训练模型模仿人类手部动作;然后针对不同的操作技能,引入残差学习模块,结合基于物理的交互约束进行精细调整(如图 1 所示)。该方法将动作模仿与物理约束分离,使复杂的双手任务学习更加高效,执行更加精准。

基于ManipTrans,研究团队同时发布了大规模灵巧手操作数据集DexManipNet,涵盖了如盖笔帽、拧瓶盖等此前未曾深入探索的任务。

图1. 基于ManipTrans实现相同操作技能的跨型号灵巧手技能迁移

研究背景

人类双手在与环境交互中发挥着关键作用,这激发了对机器人灵巧手操作的广泛研究。如何快速获取大规模、精确且接近人类水平的灵巧手操作数据,已成为亟待解决的问题。

现有的基于强化学习的方法需要精心设计针对特定任务的奖励函数,这通常限制了任务的复杂性,并可能导致机器人动作的不自然;另一类基于遥操作的方法成本高昂、效率低下,且所采集的数据通常针对特定的本体,缺乏通用性。

目前,一种有潜力的解决方案是通过模仿学习,将人类的操作动作迁移到仿真环境中的灵巧手上,以生成自然的「手-物交互」。然而,实现精确且高效的迁移并非易事。由于人手和机器人手在形态上的差异,直接进行姿态重定向的效果并不理想。并且,尽管动作捕捉得到的数据相对准确,但在高精度任务中,误差的累积仍可能导致任务失败。此外,双手操作引入了高维度的动作空间,显著增加了高效策略学习的难度,因此,先前的大多数工作通常止步于单手的抓取任务。

研究方法

图2. 本文提出的ManipTrans方法框架图

针对上述挑战,本文提出了一种简洁而有效的方法——ManipTrans(如图 2 所示),旨在实现操作技能,特别是双手协同技能,在仿真环境下从人手向机械灵巧手的迁移。核心思想是将迁移过程划分为两个阶段:第一阶段,实现手部运动的轨迹模仿;第二阶段,在满足物理交互约束的前提下,对动作进行微调。

具体而言,首先预训练一个通用模型,以准确模仿人类手指的运动;在此基础上,引入残差学习模块,对灵巧手的动作进行微调,着重针对以下两点:1)确保手指与物体表面的稳定接触;2)协调双手,保证复杂情况下双手操作的高精度和高保真执行。

本文将该问题建模为隐式马尔可夫决策过程(MDP),在两个阶段均采用 PPO 算法以最大化折扣回报。在第一阶段,设计奖励函数,约束灵巧手跟随参考的人手轨迹,同时确保动作的稳定性和平滑性。其中,手指模仿奖励函数「鼓励」灵巧手的关键点位置与人手保持一致,特别是与物体接触最频繁的拇指、食指和中指的指尖位置是否对齐,此设计有效解决了形态不一致的问题。

在第二阶段,残差模块输出动作的补偿项,通过与第一阶段的动作相加,实现微调。该模块额外考虑了以下信息:1)物体的质心位置和所受重力,以增强对力矩的感知;2)基于空间基点集(BPS)表示的物体形状;3)灵巧手关键点与物体的空间位置关系;4)仿真环境提供的指尖接触力。第二阶段特别加入了接触力奖励函数,鼓励更加稳定的手物接触。在训练过程中,引入了随机参考状态初始化和课程学习策略,提高了收敛速度和训练稳定性。

综上,ManipTrans的设计在第一阶段缓解人手与灵巧手之间的形态差异,在第二阶段捕捉细微的交互动作。通过将手指模仿与物理交互约束解耦,显著降低了动作空间的复杂度,同时提升了训练效率。本文在一系列复杂的单手和双手操作任务中,验证了该方法的有效性和高效性,任务甚至涵盖了铰链物体的操作。为评估该方法的泛化能力,本文进行了跨本体的实验,验证了ManipTrans可应用于具有不同自由度和形态的灵巧手,无需额外参数调节。此外,基于ManipTrans方法得到的双手操作数据,也在真机部署中得到了验证。

DexManipNet 数据集

图3. 灵巧手白板写字

图4. 双手舀取物体

基于ManipTrans方法,本研究将两个大型「手-物交互」数据集(OakInk V2 和 FAVOR)迁移至灵巧手,构建了DexManipNet数据集。该数据集涵盖了 61 种具有挑战性的任务,包含对 1200 多件物体的 3300 条灵巧手操作序列,总计约 134 万帧的数据量。其中,约有 600 个序列涉及复杂的双手操作任务(如图 3、图 4 所示),充分展示了机器人在高难度操作场景下的能力。

图5. 灵巧手拨开牙膏盖

图6. 双手协同完成倾倒入试管操作

此外,研究人员在真机平台上重放(replay)了DexManipNet的数据轨迹,使用了两台有 7 个自由度的机械臂和一对灵巧手,部署结果展示了此前未曾实现的精细灵巧操作能力。例如,在「拨开牙膏盖」的任务中,左手稳固握持牙膏管,右手的拇指和食指灵巧地拨开小巧的牙膏盖,这些细微而复杂的动作往往难以通过遥操作精确捕捉(如图 5、图 6 所示)。

实验结果

表1.ManipTrans与基线方法定量对比

本文将ManipTrans与两大类现有方法——基于强化学习的方法和基于优化的方法,进行了对比评估。结果显示,ManipTrans在各项指标上均优于基线方法,展现了在单手和双手操作任务中的高精度(如表 1 所示)。定性和定量分析证实了,ManipTrans的两阶段迁移框架能够有效捕捉手指的细微运动并与物体的交互,提高了任务成功率和运动的真实感。

图7. 跨本体迁移实验

图8. 双手操作铰链物体

此外,研究展示了ManipTrans不同型号灵巧手上的可扩展性。该框架仅依赖人类手指与灵巧手关键点之间的对应关系,无需过多参数调整即可适配不同形态和自由度的灵巧手(如图 7 所示)。文章还在铰链物体操作数据集 ARCTIC 上进行了验证。通过对奖励函数的微调,添加铰链物体运动角度奖励,成功实现了灵巧手对铰链物体的指定角度旋转操作(如图 8 所示),展现了ManipTrans方法在复杂操作任务中的潜力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股进入第三阶段!三个实战信号出现之前,千万不要轻举妄动

A股进入第三阶段!三个实战信号出现之前,千万不要轻举妄动

小白鸽财经
2026-05-27 10:51:29
“未经审批私自赈灾”?民间救援机构散发出官僚气味

“未经审批私自赈灾”?民间救援机构散发出官僚气味

法经社
2026-05-27 09:04:22
香港老戏骨重病立遗嘱,3个女友平分几亿,这辈子不想结婚他图啥

香港老戏骨重病立遗嘱,3个女友平分几亿,这辈子不想结婚他图啥

洲洲影视娱评
2026-05-27 12:49:42
反常!全国唯一GDP负增长的万亿城市,人口暴涨

反常!全国唯一GDP负增长的万亿城市,人口暴涨

前瞻网
2026-05-27 14:31:41
杨振宁离世7个月后,翁帆近况爆出,怀孕传闻早已真相大白

杨振宁离世7个月后,翁帆近况爆出,怀孕传闻早已真相大白

叨唠
2026-05-27 02:06:14
咪咕成为2026世界杯官方持权转播商,解说团队组成豪华阵容

咪咕成为2026世界杯官方持权转播商,解说团队组成豪华阵容

北青网-北京青年报
2026-05-27 14:19:04
投毒杀人者、 三体公司原CEO许垚被执行死刑

投毒杀人者、 三体公司原CEO许垚被执行死刑

经济观察报
2026-05-26 09:53:04
油价大跌近350元/吨,6月4日油价调整,上半年“第2次”油价下调

油价大跌近350元/吨,6月4日油价调整,上半年“第2次”油价下调

油价早知道
2026-05-27 09:24:17
何鸿燊忌日三房上山拜祭,何超莲墓前献花,陈婉珍腿脚不便需搀扶

何鸿燊忌日三房上山拜祭,何超莲墓前献花,陈婉珍腿脚不便需搀扶

八斗小先生
2026-05-27 11:39:55
台风“蔷薇”已生成!10省区市有大到暴雨

台风“蔷薇”已生成!10省区市有大到暴雨

鲁中晨报
2026-05-27 15:56:20
004航母进展被公开,中国为何一定要造一艘比美国还大的航母?

004航母进展被公开,中国为何一定要造一艘比美国还大的航母?

阿芒娱乐说
2026-05-27 15:23:22
退休人员注意:2026年这个证件赶紧办,关系到养老金和福利

退休人员注意:2026年这个证件赶紧办,关系到养老金和福利

据说说娱乐
2026-05-27 13:55:47
洋葱立大功!医生发现:洋葱或对3种慢性病有好处!可以常吃

洋葱立大功!医生发现:洋葱或对3种慢性病有好处!可以常吃

芹姐说生活
2026-05-25 14:19:45
新加坡为何害怕《给阿嬷的情书》?跟多年来他们刻意去中国化有关

新加坡为何害怕《给阿嬷的情书》?跟多年来他们刻意去中国化有关

娱乐圈见解说
2026-05-27 00:48:02
98岁李嘉诚要IPO敲锣了:2000亿

98岁李嘉诚要IPO敲锣了:2000亿

PE星球
2026-05-27 08:35:12
打破常规中方开晚宴招待日本想见的人来了高市需要好好珍惜

打破常规中方开晚宴招待日本想见的人来了高市需要好好珍惜

春之寞陌
2026-05-27 15:49:00
百万网红捐款1047万!本人回应:两位粉丝捐1000万,个人捐了47万

百万网红捐款1047万!本人回应:两位粉丝捐1000万,个人捐了47万

阿废冷眼观察所
2026-05-27 15:54:24
开始离谱了!燕郊板块房价从4万变6千,业主集体断供

开始离谱了!燕郊板块房价从4万变6千,业主集体断供

专业聊房君
2026-05-25 07:28:59
继萝卜岗后,又出来“祖坟”岗?网友:谁能考上,一辈子有的吹了

继萝卜岗后,又出来“祖坟”岗?网友:谁能考上,一辈子有的吹了

番外行
2026-05-24 09:20:53
世界或正在发生一个极其恶心的变化!印度最终可能会成为地球大患

世界或正在发生一个极其恶心的变化!印度最终可能会成为地球大患

手里有读
2026-05-27 09:10:37
2026-05-27 16:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13096文章数 142653关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

受害者多为中国女性 震惊全球的迷奸案细节披露

头条要闻

受害者多为中国女性 震惊全球的迷奸案细节披露

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

6激光雷达 全主动悬架 全新一代问界M9上市47.98万元起

态度原创

家居
亲子
教育
旅游
军事航空

家居要闻

古老而持久 石影扶手椅

亲子要闻

爱捣乱的小推土机 #大型挖掘机挖土玩具 #工程车玩具 #儿童动画

教育要闻

理解不等于记住,理解不等于考过!

旅游要闻

“周末游广东”文旅大篷车启航,引领广东周末微度假新风尚

军事要闻

以军称已打死哈马斯新任军事领导人

无障碍浏览 进入关怀版