中国人形机器人赛道最近“好消息”不断。
前有深圳的众擎机器人完成全球首例前空翻,后有杭州宇树科技机器人实现720度回旋踢。3月11日,前华为天才少年“智晖君”创立的智元机器人,发布了人形机器人灵犀X2。在视频里,机器人不仅可以像人一样走路、跑步,还能玩滑板车、骑自行车。
人们正通向“机器人养老”的美好愿景,而现在,一个新工种随着具身机器人的火爆而出现。在Boss直聘、实习僧等求职APP上,一些公司正招聘学历要求大专以上,名叫“机器人数据采集员”的岗位。
这份工作的主要内容包括:负责机器人数据采集工作、控制机器人正确移动、保护机器人处于安全状态,等等。
除此以外,很多岗位还列出了对人的外形的要求,有的是,“不戴眼镜,没有高度近视”;有的要求“男生身高170-175,体重65公斤以内;女生160-168,体重55公斤内”;还有的公司要求,“不能有小肚子,身体协调性较好,细心、灵活、有控制力”。
这些岗位成功引起了众人的注意。人们不禁好奇:机器人的数据采集员,会是一份什么样的工作?这个问题的答案,关系到了人形机器人的技术路径和当下的阻碍。更本质的问题是,机器人实现智能的背后,会像AI倚赖数据标注一样,“有多少人工就有多少智能”吗?
重复性新工作
薪资100元-240元/天,在社交媒体上,关于机器人数据采集员的兼职、全职工作正在火热招聘中。
上海的“90后”张谦看到了这样的趋势,近半年来一直在给“数据采集岗”投递简历。事实上,她在一家经济贸易公司有全职工作,但在AI浪潮下,她愈发感到危机降临,想转行到一个代表未来的行业。
具身机器人赛道就是她瞄准的方向,而数据采集员就是其中最简单的跳板。“门槛低,这是我投数据采集员最主要的原因。毕竟AI等未来产业,许多岗位都是招工程师,对代码或硬件知识有一定要求。”她对盐财经说。
她同时感到这类工作是有趣的。“有些数据采集工作会模拟真实作业环境。数据采集员穿动捕服,戴VR眼镜第一视角模拟机器人完成任务。感觉很像游戏。”只是,投递了多份简历后,她仍未收到一份有效回复,转行之梦离她仍有些遥远。
而正如张谦所感受的,机器人数据采集岗的工作内容,与游戏3D动画有相似之处。多位业内人士告诉盐财经,训练机器人时,他们都运用了与游戏3D相似的动作捕捉技术。
所谓的动作捕捉,即通过人类穿戴各种设备,测量、跟踪、记录人的运动轨迹,再经过计算机处理,得到三维空间坐标的数据。当数据被计算机识别后,人体3D技术可以应用在动画制作、步态分析,生物力学、人机工程等各个领域。
事实上,业内人士都清楚,这波数据采集员的招聘热,最早是由全球顶尖机器人公司带动的。2024年8月,特斯拉率先为旗下Optimus人形机器人招募数据采集操作员(Data Collection Operator)。据介绍,其工作内容为穿戴动作捕捉服和 VR 头盔,每天沿着测试路线行走7小时以上,身上同时携带最多30磅(13.61千克)的重物。
与此同时,该岗位还要求采集员身高在170-180厘米之间,因为该职位需要穿上特制动捕服,身材要与机器人相似。采集员需要穿戴设备,在工作过程中站立、坐下、行走、弯腰、伸展、蹲伏和扭转身体。
特斯拉还给这群数据采集员提供了有竞争力的薪酬:每小时25-48 美元(约人民币 180-342元),以及股权刺激。
相似的大型招聘同时在上海开启。2024年6月,智元机器人在上海建立了一座面积3000平方米的数采工厂。公开视频显示,在这个工厂里,人需要通过在胸前佩戴VR设备等进行数据采集,比如,人佩戴设备教机器人叠衣服。
智元机器人具身产品线总裁姚卯青对媒体介绍,数采厂模拟了家庭、零售、服务业、餐饮、工厂的五个场景,未来将源源不断为机器人学习提供数据养料。去年数采工厂仅投入使用两个多月,就采集了超百万量级真机数据集。
“不久后我们将拥有超千万条数据。”姚卯青笑着对媒体介绍道。
从大厂的争相布局和落地来看,真实数据正成为机器人行业的一道门槛。唯一的问题是,机器人数据采集员门槛究竟高吗?
盐财经工作人员以求职者身份,试图联系多个招聘机器人数据采集员的科技公司。来自深圳某科技公司的招聘经理张女士表示,数据采集员多数是临时性的岗位,“我们有较大数据需求才会招人”。
“我们一般招的是大专生,或者外包的临时工,做的是短期一两个月的工作。”
据她介绍,机器人数据采集工作技术难度不算高,每天,采集员需要穿上一套设备,重复性地做某类任务。比如,为了训练机器人学习拿矿泉水,采集员需要在桌子前反复完成拿矿泉水的动作,“如果数据需求大的话,可能一个星期都要重复做这一个动作”。
“当然,这个工作岗位也是有一定门槛的。”张女士说。
“倒不是技术专业背景的门槛,我们想要比较听话、(身体)灵活的人。”
人类老师的重要性
数据采集员的招聘一定程度上反映了机器人行业的变化。国内动作捕捉厂商、NOKOV度量动捕负责人告诉盐财经,近两年,随着人形机器人为代表的具身智能在国内火热,机器人产业对动作捕捉的设备需求也随之大增。
为什么是近两年的需求增长?该负责人介绍,这是因为人形机器人要求精度更高的人体运动数据。相比于电脑模拟的理想仿真环境而言,由人采集回来的真实数据,可以兼容更多的随机性和意外。
举个例子,他说,机器人在遇见凹凸不平的地面时,因为机械机构的原因,很容易摔倒。但是,如果是人在面对一些崎岖地面或者突发状况时,人体本身可以自适应,很快能自己调节过来。
机器人资深从业者、北京某高校学者孔博士也告诉盐财经,机器人行业对真实数据的需求,是随着这两年AI大模型技术的发展而兴。一个典型标杆是特斯拉人型机器人的Optimus,采用端到端的技术,试图通过给机器人喂大量的数据,从而训练出具有通用能力的机器人。
此外,Transformer架构、VLA(Vision-Language-Action)的发展和应用,让机器人行业对数据的要求又增加了,如今,业界亟需精度高、质量佳的数据。
当下,来自业界一个共识是,“人类老师”对机器人的能力增长必不可少。上海通用机器人公司傅利叶生态拓展负责人周斌告诉盐财经,人类采集的数据可以反映真实世界的复杂性。比如在训练机器人时,周斌说,他们会首先运用仿真数据进行预训练和初调;接着,再使用人类采集的高质量数据,进行多次精调,“这样可以确保部署到真实物理世界的性能和效果”。
这一过程,智元具身研究中心常务主任广辉也曾打过一个形象的比方。他以学习乒乓球为例,一般我们要通过图文、看别人打球或看比赛等方式,先了解基础或理论,再去训练场通过发球机或者和别人打球简单模拟。“如果要有更高要求,还要找教练一对一手把手教学。”
总的来说,人类老师就是机器人的“一对一教练”。一对一教学的最终目的,是为了让机器人更像人类。
不可或缺的“上肢”力量
除了确保与真实世界相符,机器人的“一对一教练”还有一个更重要的功能。孔博告诉盐财经,目前机器人行业一个最大的难点是上肢力量。
相比于人类教学,当前行业内还有一个更主流的方向,叫强化学习。这是一种在仿真环境下通过试错(Trial and Error),让机器人学习做出最优决策的方式。
他举例:“通俗的理解,强化学习就像喂一个小狗,这个小狗它做对了,我就奖励它,他做错了,我就惩罚他。强化学习本质就是一个奖励函数。”
这一奖励最佳路径的方式,如今被发现能较好地训练机器人走路、跑动等运动自平衡能力。孔博将其形容为机器人的“下肢力量”,他称,业内主流的宇树科技等公司,都是运用强化学习训练的。
“但现在人形机器人最让人期待的使用上肢,去干具体的事,”孔博告诉盐财经,“它不应仅仅是个玩具,它要成为一个生产力,去工厂干活,去商店买东西,最终进入家庭,成为机器人保姆。这里的关键是在上肢。”
不过,与公众的期待仍有差距的是,孔博说,在实践中,训练机器人的上肢比下肢要难得多。而且,上肢训练在仿真环境下,通过强化学习训练得到的效果较差。
因此,多数机器人公司需要通过动作捕捉、遥操作等方式,让机器人观察人类演示后,迁移到自己本体上(尤其是上肢动作)去执行任务。这在机器人行业内,叫做模仿学习。
国内专注于机械臂和机器人本体的广东某机器人技术总监告诉盐财经,机器人获取“上肢”力量之所以难,其实是难在机器人的“控制”端。
相比于移动、平衡小脑等类似于人类小脑的功能,机器人“大脑”控制端需要面对各类复杂的物理场景。这很难通过奖励函数,在仿真环境中大规模训练就可以得到好的效果。
他举例,即使是简单地使用机械臂,实施抓取动作,也面临着复杂的状况。“理想的仿真环境都是存在系统误差的。(例如)在真实世界里,机械臂在运动过程中,会因为重力因素存在抖动状况。这些误差怎么去模拟出来,这是一个难题。”
因此,在操作端,该技术总监表示,还是人类在真实场景下进行数据采集,手把手教学的效果最好。“真实的数据是最直观的,虽然在目前的成本是最高的,但是在训练大模型时候,效果是最好的,也更容易进行参数调优。”他说。
与此同时,他强调,人工采集数据,不仅是简单的采集,还包括上游的环境搭建、下游对数据的清洗和审核,这些步骤都需要大量的人力。
从这个角度而言,机器人行业也属于“有多少人工,就有多少智能”的劳动密集型工作。
数据争霸
从招聘APP的热门岗位可以看出来,机器人行业正在经历与AI一样的数据“危机”——在AI行业里,数据被称为石油。OpenAI公司联合创始人兼前首席科学家伊利亚·苏茨克维尔2024年曾公开警告,“AI的训练数据如同化石燃料一样面临着耗尽的危机”。
傅利叶负责人周斌对盐财经表示,“真实场景下的机器人动作数据在行业内一直是个瓶颈,因为它的采集成本非常高,很多数据的标注精度也不够。高质量数据的缺失,是制约机器人发展的一个主要卡点。”
相较于自动驾驶而言,周斌介绍,机器人行业对数据的需求和要求也高得多。“就像特斯拉的自动驾驶技术,需要有海量的数据才能训练出来。但汽车需要控制的变量其实并不多,无非是加速、减速,转向。”
相比之下,周斌说,人型机器人至少有三四十个自由度的数据输出,“它背后的数据集的需求非常巨大”。
与此同时,在AI大模型的浪潮下,如今机器人行业迎来了全新的目标——追求通用性。孔博告诉盐财经,机器人行业一直以来很难突破的地方是,机器人只能完成特定场景下的特定任务。
“过去的技术一直只适用于固定的结构化场景,它的位置姿态都是固定的。”孔博介绍,“比如,一个立方体在桌子上,机器人可以去抓取。但是如果让它去拿一个水果,或者择菜,他就搞不了。”
大模型和具身智能火了后,上述多家机器人公司负责人都对盐财经提到,他们追求的是让机器人具有泛化性,意思就是,机器人可以同时完成多种任务,适用于多种场景。这就需要机器人拥有认知物理世界的“智慧”大脑。
而形成智能的关键,首先依赖大量高质量的数据,对机器人的AI算法进行训练。
不过,多位业内人士也承认,目前在机器人的数据上,仍存在许多不确定的因素。比如,当前各家机器人公司的形态、技术路径都不一样,导致了采集的数据形态不一,很难实现通用。
此外,真实世界因为存在过多的变量,例如光照因素、物理因素等等影响,需要采集的数据量也变得无穷大。而对于采集大量数据后,机器人能否拥有预想中的泛化性和通用性,目前还是未知数。
“目前来说大家都倾向于相信(具身智能)这个方向可以,但是究竟能不能行,目前还是有待观察。”孔博士总结。相比于AI,多重学科交叉的机器人还处在产业爆发的初期,前方仍有很多不确定性。
而当下,处在爆发期的机器人行业,也逐渐形成共识:各企业共同打造开放共建的生态,推动机器人数据共享。3月12日,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心等机构,发布全球百万真机数据集开源项目 AgiBot World。3月17日,傅里叶也正式开源全尺寸人形机器人数据集Fourier ActionNet。
“如何解决数据(紧缺)的问题,我们认为首先需要一个更加开放共建行业的生态。”周斌总结道,“这不是说是一家公司能够实现的,应该由企业、研究机构共同努力,参与数据的贡献与算法的优化。”
可以肯定的是,真实的人类动作数据正在被机器人企业所珍视,成为未来一大段时间的“石油”。众多机器人企业也将依靠着一名名“大专生”,一遍遍完成最简单的人类行为,等待机器人行业的ChatGPT时刻降临。
【来源】盐财经
【作者】朱秋雨、赖丁萌
【编辑】向由
免责声明(上下滑动查看全部)
任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.