网易首页 > 网易号 > 正文 申请入驻

ICLR 2025 | Diffusion Planner:基于扩散模型的自动驾驶规划算法

0
分享至

本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。此外,借助扩散模型的引导机制,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。

论文标题: Diffusion-based Planning for Autonomous Driving with Flexible Guidance 论文链接: https://arxiv.org/pdf/2501.15564 项目主页: https://zhengyinan-air.github.io/Diffusion-Planner/

一、背景介绍

自动驾驶规划正朝着更安全、高效的方向发展,但在复杂环境下实现类人驾驶仍具挑战。基于规则的方法虽在工业应用中取得成功,但适应性差,调整成本高;模仿学习能直接学习专家驾驶行为,并随训练数据扩展提升性能。然而,模仿学习方法在多模态行为适应性、泛化能力和驾驶风格灵活调控上仍存挑战,依赖后处理来优化模型输出。

近年来,扩散模型在决策领域得到广泛应用,但在自动驾驶规划中的探索仍有限。现有研究多聚焦于运动预测和场景生成,关注开环性能,而非闭环规划。一些方法尝试将扩散模型应用于规划任务,但仅仅是沿用现有结构或扩展模型参数,缺乏针对性结构设计,导致仍然高度依赖后处理。

为此,我们提出了Diffusion Planner,一种创新的基于扩散模型的自动驾驶规划方法。通过扩散模型强大的数据分布拟合能力,Diffusion Planner能够精准捕捉复杂场景中周车与自车的多模态驾驶行为,并实现周车预测与自车规划的联合建模。同时,基于Transformer的结构设计高效处理复杂场景输入,实现20Hz的高速实时推理。此外,借助灵活的引导机制,模型在部署阶段即可适应不同的驾驶需求。在大规模真实数据集 nuPlan 的闭环评估中,Diffusion Planner取得了SOTA级表现,⼤幅降低了对后处理的依赖,并在额外收集的 200 小时物流小车数据上验证了其在多种驾驶风格下的鲁棒性和迁移能力。

二、Diffusion Planner 技术细节

Diffusion Planner专为自动驾驶闭环规划设计,具备以下特点:

  • 基于DiT架构融合加噪轨迹与条件信息,推理速度可达20Hz;

  • 联合建模自车与周车的未来轨迹,将运动预测与闭环规划统一为未来轨迹生成;

  • 采用扩散模型的引导机制,实现具有偏好的轨迹生成。

2.1 模型结构设计

在自动驾驶中,自车与周围车辆之间的紧密互动使得规划与预测任务必须高度协同。为了应对复杂的交通场景,准确预测邻近车辆的未来轨迹至关重要。这不仅提升了闭环规划模型的能力,还能增强系统的安全性和可控性。我们通过联合建模关键参与者的状态,将运动预测与闭环规划任务统一为一个未来轨迹生成任务。我们希望模型能够同时生成所有关键参与者的未来轨迹,从而实现更加自然的协同行为。

然而,多车交互的复杂场景会产生更加多样的驾驶行为,增加了训练的难度。为此,我们采用了扩散模型的框架进行训练,并基于Diffusion Transformer设计了针对自动驾驶规划的结构

具体而言,我们考虑了周围车辆的历史信息、道路信息和静态障碍物,设计了简洁的编码器结构用于信息提取,并通过交叉注意力机制与加噪后的自车和周车轨迹进行信息交互。此外,我们还引入了额外的导航信息以及扩散模型特有的加噪步数信息。为了避免模型重复自车历史行为导致闭环性能下降,我们仅考虑自车当前时刻的位置和朝向,并与周车的当前状态一起拼接到加噪轨迹中。通过这种方式,起始状态的引导还能进一步降低模型对未来轨迹生成的难度。

2.2 有偏好轨迹生成

基于扩散模型的引导机制,我们可以在模型的测试阶段引入安全,舒适等偏好,同时也可以根据用户需求灵活的改变模型输出的轨迹特性,例如速度特性。此外,不同的偏好可以通过加权求和轻松组合,并且在部署阶段可以灵活选择是否启用,提供更大的灵活性。

三、实验结果

3.1 nuPlan闭环仿真

下图展示了Diffusion Planner与其他自动驾驶规划算法在nuPlan数据集上的表现对比。我们在三个常用测试基准上进行了比较,结果显示Diffusion Planner达到了SOTA性能水平。通过引入现有的后处理模块,算法性能得到了进一步提升,这得益于模型生成的高质量轨迹,为后处理模块提供了更优的初始化参考轨迹。

此外,我们还对比了现有基于扩散模型的自动驾驶规划算法。与现有方法相比,Diffusion Planner有效降低了对后处理的依赖,同时实现了更高的推理频率,进一步验证了我们设计结构的有效性。

3.2 轨迹生成可视化

为了进一步展示Diffusion Planner在轨迹生成方面的优势,我们选择了狭窄路段的左转场景,并与现有方法的无后处理版本进行了对比,如下图所示。Diffusion Planner生成了高质量的轨迹,不仅准确预测了周围车辆的行为,还生成了平滑的自车规划轨迹,合理地考虑了前车的速度,充分体现了预测与规划任务联合建模以及扩散模型生成的优势。

3.3 毫末智行物流小车数据集

我们使用毫末智行收集的约200小时真实世界物流小车配送数据,作为nuPlan数据集的补充,并计划后续开源。与nuPlan数据集中的车辆相比,配送车具有以下特点:尺寸较小,运行速度较低;可以在主干道和自行车道上行驶;与行人和骑行者的交互更为频繁,同时面临不同的行驶规则。通过在该数据集上进行测试,我们发现Diffusion Planner依然保持了最佳表现。相比之下,基于规则或依赖后处理的方法由于其设计存在对nuPlan数据的过拟合问题,导致在新场景中的性能下降。这进一步证明了Diffusion Planner在适应不同驾驶行为方面的鲁棒性

3.4 有偏好轨迹生成案例

为了进一步展示引导机制的有效性,我们挑选了部分场景,从相同起始位置出发,展示了闭环测试结果。红色虚线和空心黄色车代表没有引导的结果,而红色实线和实心黄色车则表示有引导的结果。

四、总结

在本文中,我们提出了 Diffusion Planner,一种基于模仿学习的自动驾驶规划方法,充分发挥扩散模型的强大表达能力和灵活的引导机制。我们设计了基于 Diffusion Transformer 的模型架构,联合建模运动预测与规划任务中的多模态数据分布,并利用扩散模型的引导机制,使模型生成的规划行为与目标驾驶风格保持一致。Diffusion Planner 在 nuPlan 数据集及新收集的 200 小时物流车驾驶数据集上取得了 SOTA 级别的闭环性能,并展现出对不同驾驶风格的强大适应性。


作者:周展科 来源: 公众号【PaperWeekly】

llustration From IconScout By IconScout Store

-The End-

本周上新!

扫码观看!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广大教师强烈呼吁:让教育局局长去赛课、让校长去赛课

广大教师强烈呼吁:让教育局局长去赛课、让校长去赛课

天天热点见闻
2026-06-01 05:43:26
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
小马科斯还是没拦住,莎拉民调支持率登顶,马科斯家族不再是对手

小马科斯还是没拦住,莎拉民调支持率登顶,马科斯家族不再是对手

阿讯说天下
2026-06-01 10:07:01
6月1日,天涯社区将正式恢复访问

6月1日,天涯社区将正式恢复访问

21世纪经济报道
2026-05-31 21:25:09
山东网友打算买龟,多个商家直言“山东不卖”,评论区全是电商泪

山东网友打算买龟,多个商家直言“山东不卖”,评论区全是电商泪

谭谈社会
2026-05-30 15:06:18
张末:目睹父亲张艺谋两次移情,我不想母亲的悲剧在自己身上重演

张末:目睹父亲张艺谋两次移情,我不想母亲的悲剧在自己身上重演

飘飘然的娱乐汇
2026-05-31 21:35:05
袁世凯只当了83天皇帝,却造了近8亿枚银元:袁大头凭什么火遍全国几十年?

袁世凯只当了83天皇帝,却造了近8亿枚银元:袁大头凭什么火遍全国几十年?

阅读悦读之写乎
2026-05-31 00:04:14
德国4-0芬兰,昂达夫传射,维尔茨、穆西亚拉建功

德国4-0芬兰,昂达夫传射,维尔茨、穆西亚拉建功

懂球帝
2026-06-01 04:45:22
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

上观新闻
2026-05-29 14:54:19
省油省钱的小电驴,正在掏空中女钱包

省油省钱的小电驴,正在掏空中女钱包

她刊
2026-05-19 11:05:57
砍22分!早就知道弗格G3爆发?沪记:他是全世界最了解弗格的男人

砍22分!早就知道弗格G3爆发?沪记:他是全世界最了解弗格的男人

弄月公子
2026-05-31 23:18:57
大宋不允许这么牛X的武人存在

大宋不允许这么牛X的武人存在

最爱历史
2026-05-29 18:05:50
一个家最好的风水,从来不是优秀的孩子,而是被善待的妈妈

一个家最好的风水,从来不是优秀的孩子,而是被善待的妈妈

青苹果sht
2026-05-30 05:15:46
雷霆被淘汰4将身价下跌!2内线无影响力,卡鲁索连崩,多特副作用

雷霆被淘汰4将身价下跌!2内线无影响力,卡鲁索连崩,多特副作用

篮球资讯达人
2026-05-31 12:14:30
你有没发现,那些从不哭的人,其实垮得更彻底?

你有没发现,那些从不哭的人,其实垮得更彻底?

一隅安稳
2026-05-31 00:59:33
张嘉益做梦也没想到,《主角》即将迎来结束,恶心一幕发生了!

张嘉益做梦也没想到,《主角》即将迎来结束,恶心一幕发生了!

精彩背后的故事
2026-05-31 22:54:41
印度每年榨糖,剩下7500万吨甘蔗渣,中国人却用它造出了科技王炸

印度每年榨糖,剩下7500万吨甘蔗渣,中国人却用它造出了科技王炸

毒sir财经
2026-05-12 19:34:07
心酸!登哥放下身段!!只求一座冠军!!

心酸!登哥放下身段!!只求一座冠军!!

柚子说球
2026-05-31 19:58:44
释永信贪污的3个亿,最后流向了哪里?还能追回吗?

释永信贪污的3个亿,最后流向了哪里?还能追回吗?

三目观史
2026-05-31 21:22:05
2026-06-01 13:08:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2397文章数 596关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

房产
艺术
旅游
手机
公开课

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

艺术要闻

吴镇写竹,清清爽爽

旅游要闻

逛故宫的游客注意了,坤宁宫明起检修请绕行

手机要闻

小米17系列即将突破500万销量,国产安卓第一人有意见吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版