网易首页 > 网易号 > 正文 申请入驻

研讨会回顾:探索基于多模态 LLM 的自动驾驶智能体

0
分享至

来自 NVIDIA Research 自动驾驶方向研究科学家李柏依,其主题为《探索基于多模态 LLM 的自动驾驶智能体》的在线研讨会回放已上线并开放资料下载。

直播回放

扫描二维码观看回放

本次研讨会聚焦收录于 CVPR 2024、CoRL 2024 等会议的论文成果。

此次研讨会中,李柏依博士通过视频 demo 介绍了自动驾驶智能体 LLaDA 如何为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导;之后通过对比 GPT-Driver、人类驾驶员、LLaDA 的驾驶轨迹,分析了 LLaDA 如何帮助自动驾驶汽车和人类驾驶员调整轨迹策略,使其可以在世界的任何地方驾驶。

而在复杂交通场景中,车辆之间存在过多交互,这会导致智能体在预测时产生幻觉,从而影响其规划性能。为此,李柏依博士详解了如何基于 TOKEN 分解复杂交通场景,进而提升智能体在长尾事件的规划能力。

最后,李柏依博士介绍了能够提升智能体场景理解能力的自动化视频字幕生成模型 Wolf,并对比分析了 Wolf 与 GPT-4V、CogAgent、VILA-1.5-13b 等其他模型。

更多资料

LLaDA:大语言模型政策适应性让驾驶无处不在

NVIDIA 研究团队在 CVPR 2024 大会上展示了大语言模型工具 LLaDA(Large Language Driving Assistant),通过为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导,帮助他们更轻松地在陌生的地方导航。

LLaDA 是由 NVIDIA DRIVE Thor 赋能的 LLM 网络,采用了 NVIDIA Blackwell GPU 架构所支持的全新生成式 AI 功能。作为一个简单而强大的工具,LLaDA 可以通过利用 LLM 的零样本泛化性来解释本地驾驶员手册中的交通规则,能够实现在陌生路况为用户提供多语言和地区交规实时指导,轻松实现环游世界!

同时,广泛的用户研究表明,LLaDA 的指导说明有助于解决对现实中意外情况的误判,并可以在真实世界数据集上调整 AV 运动规划策略的能力。

论文链接:

https://arxiv.org/abs/2402.05932

项目地址:

https://boyiliee.github.io/llada/

NVIDIA 自动驾驶实验室:LLM 道路规则指南轻松应对陌生路况



TOKEN:将世界标记化为对象级知识单元

以解决自动驾驶中的长尾事件

论文链接:

https://arxiv.org/abs/2407.00959

Wolf:利用世界摘要框架为一切添加字幕

论文链接:

https://arxiv.org/abs/2407.18908

项目地址:

https://wolfv0.github.io/leaderboard.html

精彩问答

Q:TOKEN 和 OmniDrive 有什么区别?

A:TOKEN 于 2024 年发表在 CoRL 上,我们可能比 OmniDrive 更早开始做相关工作。TOKEN 和 OmniDrive 在大基础模型上可能是相似的,但问题的关键不在于做的有多广,而是在于做的有多深,TOKEN 的目标是解决短板,只有把短板解决,我们才能够更好的去解决整体。驾驶本身就是跟人有关的东西,所以我们必须要保证它的场景足够准确。

Q:纯视觉路线是否存在必然的危险?

A:在非常理想的情况下,我觉得视觉是可以解决这个问题的。但关键是我们所在的现实世界当中所拥有的数据和信息是有限的。我们链接的可视数据中掺杂着很多的杂质,它并不是非常高效,所以这个时候需要借助一些大语言模型帮助我们去了解。如果把 LLM 这样一个很好的通用模型和视觉模型相结合,这样构成的基础模型会变得非常强大。

Q:LLM 在自动驾驶规划任务中能起到什么样的作用?

A:我认为 LLaDA 就是一个很好的一个例子,LLM 可以协调我们能拿到的视觉信息和具体的人之间的信息,同时可以作为一个桥梁去连接人和模型之间的互动。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
追完《我是刑警》,才知道什么叫真刑侦

追完《我是刑警》,才知道什么叫真刑侦

镜像娱乐
2024-12-18 14:03:52
雪地整排人尸!朝鲜士兵在俄罗斯的遭遇曝光

雪地整排人尸!朝鲜士兵在俄罗斯的遭遇曝光

沧海一书客
2024-12-17 08:49:32
血亏93亿卖银泰的阿里,其实可能赚到了?

血亏93亿卖银泰的阿里,其实可能赚到了?

差评XPIN
2024-12-18 00:05:05
阿司匹林在美国,真的只卖3美分

阿司匹林在美国,真的只卖3美分

虎嗅APP
2024-12-18 12:47:27
章子怡怒骂小沈阳,没赵本山谁认识你,他的回怼让章子怡无地自容

章子怡怒骂小沈阳,没赵本山谁认识你,他的回怼让章子怡无地自容

美食阿鳕
2024-12-16 15:37:09
蒙古国宣布,在2025年恢复传统蒙古文,和内蒙古实现语言相通?

蒙古国宣布,在2025年恢复传统蒙古文,和内蒙古实现语言相通?

小撇说事
2024-12-12 15:07:03
贵州省人民政府关于刘均等任职的通知

贵州省人民政府关于刘均等任职的通知

知知贵阳
2024-12-18 12:00:08
专访薛凯琪:不完美的我,那也是我

专访薛凯琪:不完美的我,那也是我

新周刊
2024-12-17 12:13:55
对中国的远东故土,俄罗斯做了一个重大让步!

对中国的远东故土,俄罗斯做了一个重大让步!

星辰故事屋
2024-12-16 14:23:59
官宣!皇马牵头,96队组建新赛事:架空欧冠,坐拥5大优势

官宣!皇马牵头,96队组建新赛事:架空欧冠,坐拥5大优势

叶青足球世界
2024-12-17 20:55:42
国家队暂停稳定股市!12月18日,今日凌晨的四大消息全面发酵!

国家队暂停稳定股市!12月18日,今日凌晨的四大消息全面发酵!

风口招财猪
2024-12-18 01:05:00
当年套现15亿,卖掉摩拜单车的创始人胡玮炜,如今生活怎样了?

当年套现15亿,卖掉摩拜单车的创始人胡玮炜,如今生活怎样了?

博学老K杂谈
2024-11-23 19:50:02
本想让年少的你背个锅,却不曾想变成机会,让你把大旗扛了起来

本想让年少的你背个锅,却不曾想变成机会,让你把大旗扛了起来

美人茶话会
2024-12-18 12:55:58
央视直播调整!女排世俱杯12月18日赛程出炉:李盈莹对话埃格努

央视直播调整!女排世俱杯12月18日赛程出炉:李盈莹对话埃格努

知轩体育
2024-12-18 00:30:06
老公夜班,我去闺蜜家睡,却在厕所发现一根抽了半截的香烟

老公夜班,我去闺蜜家睡,却在厕所发现一根抽了半截的香烟

莎莉说情感
2024-12-17 10:50:02
真以为大陆怕他?还敢开条件!蒋万安霸气回怼,让人拍案叫绝!

真以为大陆怕他?还敢开条件!蒋万安霸气回怼,让人拍案叫绝!

历史求知所
2024-12-17 10:00:09
第一次看到阿根廷汽车2024年10月销量榜单,真是令人哭笑不得!

第一次看到阿根廷汽车2024年10月销量榜单,真是令人哭笑不得!

人情皆文史
2024-11-17 00:02:48
外媒谈《黑神话》Steam玩家回升:或与TGA争议有关

外媒谈《黑神话》Steam玩家回升:或与TGA争议有关

游民星空
2024-12-18 12:13:28
近3年中国最好的10部刑侦剧:《我是刑警》仅排第4,第1名没争议

近3年中国最好的10部刑侦剧:《我是刑警》仅排第4,第1名没争议

美食阿鳕
2024-12-16 08:37:15
俄罗斯官宣:朝鲜特种兵在库尔斯克向乌军发起进攻

俄罗斯官宣:朝鲜特种兵在库尔斯克向乌军发起进攻

山河路口
2024-12-15 12:51:33
2024-12-18 14:51:00
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
2769文章数 1336关注度
往期回顾 全部

科技要闻

日本两巨头将开启合并谈判 应对电动车挑战

头条要闻

特鲁多向特朗普示好:明年对中国矿产加征关税

头条要闻

特鲁多向特朗普示好:明年对中国矿产加征关税

体育要闻

维尼修斯获FIFA年度最佳 创4大纪录

娱乐要闻

郑伊健吐槽老婆沉迷游戏

财经要闻

日产、本田洽谈合并 三菱也可能加入

汽车要闻

搭载鲲鹏超能混动C-DM 奇瑞风云T11PT车下线

态度原创

健康
手机
本地
公开课
军事航空

花18万治疗阿尔茨海默病,值不值?

手机要闻

苹果App Store新突破!首个支持外部支付的应用来了

本地新闻

好吃潮州|“丸”美出道,你pick了吗

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄将军在家门口被暗杀 细节披露

无障碍浏览 进入关怀版