网易首页 > 网易号 > 正文 申请入驻

谷歌PaLM杀疯了,已从语言模型进化成机器人大脑??

0
分享至

大数据文摘授权转载自夕小瑶的卖萌屋

作者:天于刀刀

开篇小编想了解一下,有多少小伙伴和我一样在看完《复联》后对钢铁侠托尼的智能管家贾维斯非常眼馋,然后坚定了自己 all in 人工智能算法这条(不归)路的?

理想中:你是个成熟的 AI 管家,你应该自己学会在家洗衣做菜刷盘子,出门取快递,偶尔穿个机甲打打外星人,到时候记得拍张照,我朋友圈等着用。

现实中:“小爱同学,关灯!”“嘿,Siri。打开网抑云。”

目前业界成熟的落地方案中,大多数都选择将所谓的“智能管家”,也就是语音助手,或称聊天机器人,作为人类和虚拟空间的一个新的输入纽带。

例如一些之前需要人类主动打字搜索的简单问题,现在我们可以通过动动嘴唤醒助手来帮我在虚拟空间中进行检索。

那么有没有什么能够进一步影响到我们的现实生活的机器助手呢?谷歌最新的一项研究表明,也许就在不远的将来,我们可以真正做到动动嘴,指挥机器人帮我们做事啦。[1][2][3]

同样是使用语言模型处理输入产生输出,随着应用场景从虚拟空间来到现实空间,相对于目前已经有简单应用的虚拟管家来说,机器人面临着更多挑战。

首先是传统的自然语言理解(NLU)问题,往往机器只能够识别短文本的明确命令,对于较长的开放式问题可能就抓瞎了。

撰文的时候小编现场做了一个小实验,分别向 Siri 提出“打开网抑云,播放《听妈妈的话》”以及“今天是我母亲生日,你有什么推荐的音乐吗?”。

结果要么是“我没有找到相关应用”,或者是“你需要先订阅 Apple Music”。

从这个回答中可以看出,Siri 完全没有理解我的语义,表现不够智能。


(也许开通 Apple Music 会好一点?笑死)

其次,由于目前大模型生成结果的不确定性,往往输出的结果不一定是合理的。

引用原博客[2]的例子,例如你输入“我不小心把水碰翻了,你能帮帮我吗?”,GPT-3 的回复是“你可以试试真空吸尘器” [4]。这是一个正确的建议,可是万一我家里没有吸尘器怎么办?

另外当问 FLAN [5] 同样的问题,他会使用“对不起,我不是故意的”来道歉,这不是一个有用的回复。

小结一下,目前的难点在于:

  1. 只能接受短文本 (very short) 和明确命令 (hard-code command), 不接受长链命令 (long-horizon tasks)和虚拟目标 (abstract goals);

  2. LM 输出结果可行性较差,且不可控。

因此,谷歌的研究团队想到,能不能使用一种有效的方法来结合语言模型和机器人学习算法的优点,去实现一个落地的“贾维斯”。

那么有没有这样一个语言模型,他既能够理解上下文语义,也可以处理长文本,如果能表现出一定的逻辑能力那就最好不过啦。

还记得 PaLM [6] 吗?能理解上下文语义,通过 emoji 猜测电源名,甚至可以解释笑话的 PaLM,同时也在思维链提示任务中表现出彩。

光是能让机器人能接受复杂命令还不够,此外最重要的还是能让它选择一个最贴近现实的选择作为输出。这个性质在机器人问题中被称为可供性 (affordance)。

根据维基百科的定义,在物体的抓取和操纵中,机器人需要学习环境中物体的可供性,即从视觉感知和经验中学习:

  • 物体是否可以被操纵;

  • 学习如何抓取物体,以及;

  • 学习如何操纵物体以达到特定目标。

例如,原则上可以通过多种手部姿势和接近策略来抓住锤子,但有效接触点的集合及其相关的最佳抓握力是有限的。

研究团队使用可供性方程 (affordance function) 来控制机器人在一个特定环境中去选择一个可行的方案。

最终将语言模型 (Say) 和可供性方程 (Can) 相结合,就得到了一个新的解决方案:PaLM-SayCan。

使用 PaLM-SayCan,机器人充当语言模型的“手和眼睛”,而语言模型提供有关任务的高级语义知识。

具体来说,语言模型会根据人机对话的输入生成建议 (Say),而机器人本身也会根据现实情况产生一个行为 (Can),通过融合我们自然得到了一个最合理的行动计划。

博客[2]中还通过 demo 视频[7]展示了 PaLM-SayCan 系统的可解释性。

我们可以看到它根据语言分数(蓝色)、可供性分数(红色)和综合分数(绿色)来考虑最佳选项。

这套方案极大地提升了模型的可解释性,同时看起来也是一个非常通用的解决方案。

能够想到,除了实验中的“厨房”场景外,我们可以轻易地将这套方案应用到客厅、卧室、卫生间,甚至是办公室等其他封闭场景中。

此外,原实验中还有个和我们搞 AI+互联网/软件/金融/等 不太一样的地方在于,他的评价指标有两个:

  1. 计划成功率,表示机器人是否选择了正确的指令;

  2. 执行成功率,表示它是否成功执行了指令。

结果表明,使用 PaLM 的系统取得了 sota,同时也证明了语言模型对机器人技术的改进效果。

在未来,谷歌团队也会继续探索如何更好地驾驭语言模型并且使其更加紧密地和其他领域联系在一起。

不过我还是想吐槽一下,目前放出的 demo 视频里,机器人的表现非常呆板,在进行一些精密操纵的时候(例如拿起一个苹果)往往速度非常慢,视频里好多都是经过五倍速快进剪辑的效果。

此外他的一些行为选择也有限制,例如在视频中,机器人正确地拿着海绵来到了不干净的台面。

正当我以为他下一个动作就是帮你擦桌子的时候,研究人员站起身接过了海绵,轻轻地拍了拍机器人的头,然后擦起了桌子。

搞了半天最后机器人只是帮人类跑了一次腿罢了!看来仿生人的出现还是遥遥无期啊。

最后稍微扩展一下,小编一直在思考如果是在闲聊任务中,我们可不可以设计一个类似可供性分数的对话主线,辅助模型生成更连贯更有逻辑的输出?

如果机器最终实现了有主题有逻辑的对话,那么这个是否就算是智能的体现呢?

欢迎一同探讨,若有相关论文也可推荐交流!

参考文献:

[1] Do As I Can, Not As I Say: Grounding Language in Robotic Affordances, https://arxiv.org/pdf/2204.01691.pdf

[2] Towards Helpful Robots: Grounding Language in Robotic Affordances,https://ai.googleblog.com/2022/08/towards-helpful-robots-grounding.html

[3] Grounding language in robotic affordances, https://www.youtube.com/watch?v=E2R1D8RzOlM

[4] Language Models are Few-Shot Learners, https://arxiv.org/abs/2005.14165

[5] Introducing FLAN: More generalizable Language Models with Instruction Fine-Tuning, https://ai.googleblog.com/2021/10/introducing-flan-more-generalizable.html

[6] Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance, https://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html

[7] PaLM-SayCan is also interpretable, https://github.com/say-can/say-can.github.io/blob/main/img/demo_sequence_compressed.mp4?raw=true

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
羊肉的“死对头”,医生提醒:二者万不可同食,吃羊肉也有禁忌的

羊肉的“死对头”,医生提醒:二者万不可同食,吃羊肉也有禁忌的

简食记工作号
2024-11-27 00:22:03
为什么现在那么多小孩得抑郁?评论区真相了,父母是最主要的因素

为什么现在那么多小孩得抑郁?评论区真相了,父母是最主要的因素

奇特短尾矮袋鼠
2024-07-18 15:22:11
银行取钱新规已开始执行,存款人死亡后,亲属取款限额提高

银行取钱新规已开始执行,存款人死亡后,亲属取款限额提高

老鹈爱历史
2024-11-28 11:51:42
肺部有没有癌变,喉咙先知?肺癌患者,喉咙一般会出现这几个异常

肺部有没有癌变,喉咙先知?肺癌患者,喉咙一般会出现这几个异常

今日养生之道
2024-11-28 14:13:50
再拖4年?事关特朗普罪行,美国检方当众“泼冷水”,想跑不可能

再拖4年?事关特朗普罪行,美国检方当众“泼冷水”,想跑不可能

要塞阵地官方
2024-11-28 11:34:41
原来算命有这么多真事?网友:算命先生不会平白无故拒绝你

原来算命有这么多真事?网友:算命先生不会平白无故拒绝你

滑稽斑马呀
2024-09-24 13:50:08
余承东:明年华为新手机、平板将全面搭载原生鸿蒙系统

余承东:明年华为新手机、平板将全面搭载原生鸿蒙系统

环球网资讯
2024-11-26 16:55:09
RTX4090运行《真三国无双:起源》4K测试 稳定100帧

RTX4090运行《真三国无双:起源》4K测试 稳定100帧

3DM游戏
2024-11-28 09:39:30
国家一锤定音,马云预言成真?未来5年,买不买房会有多大区别?

国家一锤定音,马云预言成真?未来5年,买不买房会有多大区别?

山丘楼评
2024-11-27 15:56:23
野猪撞死老人后续!双方已和解,捕猎队4人估计赔20万,网友炸锅

野猪撞死老人后续!双方已和解,捕猎队4人估计赔20万,网友炸锅

历史看阿敞
2024-11-27 15:56:20
王钰栋轰处子球!亚冠生死战传射建功,脱衣滑跪激情庆祝

王钰栋轰处子球!亚冠生死战传射建功,脱衣滑跪激情庆祝

奥拜尔
2024-11-28 22:07:59
中央为何决定:武警部队要归中央军委统一领导?

中央为何决定:武警部队要归中央军委统一领导?

李昕言温度空间
2024-11-10 16:35:12
香港最新调查显示:香港市民2024年月均储蓄金额创7年来新高,达9800港元

香港最新调查显示:香港市民2024年月均储蓄金额创7年来新高,达9800港元

环球网资讯
2024-11-28 07:24:14
杜子建:支持云朵,为刀郎减分,云朵有90%的概率可以把刀郎毁掉

杜子建:支持云朵,为刀郎减分,云朵有90%的概率可以把刀郎毁掉

吐不满的痰娱
2024-11-27 19:06:15
王楠女儿未能打进国少选拔赛12强,网友质疑:资源逆天,天赋一般

王楠女儿未能打进国少选拔赛12强,网友质疑:资源逆天,天赋一般

爱论历史
2024-11-27 22:49:16
吃素的也能长成这样?

吃素的也能长成这样?

人情皆文史
2024-09-10 00:06:04
欧冠官方本轮最佳阵:麦卡利斯特领衔,库巴西、小蜘蛛在列

欧冠官方本轮最佳阵:麦卡利斯特领衔,库巴西、小蜘蛛在列

直播吧
2024-11-28 23:54:08
孟婆汤是不是开始掺水了?小孩的记忆全都在!原来投胎还得交钱啊

孟婆汤是不是开始掺水了?小孩的记忆全都在!原来投胎还得交钱啊

有趣的火烈鸟
2024-09-24 19:07:12
林如鹏任广东省教育厅厅长 刘利群任省卫生健康委主任

林如鹏任广东省教育厅厅长 刘利群任省卫生健康委主任

中国经济网
2024-11-28 17:31:10
华为史上售价最高单品发布,首款蓝宝石水晶智能手表演绎极致奢华

华为史上售价最高单品发布,首款蓝宝石水晶智能手表演绎极致奢华

硅星Breaknews
2024-11-26 16:22:17
2024-11-29 02:27:00
大数据文摘
大数据文摘
专注大数据,每日有分享!
6487文章数 94347关注度
往期回顾 全部

科技要闻

讽刺谁?特斯拉称供应链付款周期缩至90天

头条要闻

大众宣布将出售其在新疆的业务 外交部回应

头条要闻

大众宣布将出售其在新疆的业务 外交部回应

体育要闻

道心破碎的姆巴佩,交出一张负分答卷

娱乐要闻

冯绍峰新恋情曝出!女方第一时间发文辟谣

财经要闻

洪灏:不要误解增量政策 不是数越大越好

汽车要闻

ID. CODE概念车/探岳L领衔 大众汽车携25款车亮相

态度原创

教育
亲子
健康
公开课
军事航空

教育要闻

徐州市市高中数学题目,将向量与三角运算结合考察!

亲子要闻

萌娃望着水沟跃跃欲试,舅舅已经完美预判,娃:我被制裁了

花18万治疗阿尔茨海默病,值不值?

公开课

一块玻璃,如何改变人类世界?

军事要闻

涉嫌严重违纪 中央军委委员苗华被停职检查

无障碍浏览 进入关怀版