网易首页 > 网易号 > 正文 申请入驻

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果

0
分享至

机器之心发布

机器之心编辑部

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。

  • 论文链接:https://arxiv.org/abs/2410.13571
  • 项目主页:https://drivedreamer4d.github.io/
  • 代码地址:https://github.com/GigaAI-research/DriveDreamer4D

闭环仿真技术是推动端到端自动驾驶系统发展的关键。目前的传感器仿真方法,如 NeRF 与 3DGS,主要依赖于训练数据分布,若训练数据不足,则这些方法在复杂驾驶操作(例如变道、加速或减速)的重建效果不佳。近来,自动驾驶世界模型(World Model)证明其可以生成丰富驾驶数据。在此背景下,本文提出了 DriveDreamer4D,是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。

DriveDreamer4D 可以为驾驶场景提供丰富多样的视角(包括变道、加速和减速等)数据,以增加动态驾驶场景下的闭环仿真能力。

DriveDreamer4D 利用世界模型作为数据引擎,基于真实世界的驾驶数据合成新轨迹视频(例如变道场景)。如下图所示,DriveDreamer4D 不仅可以提升多种重建算法(PVG,S3Gaussian,Deformable-GS)的图像渲染质量,还可以提升驾驶前景(车辆)和背景(车道线)的时空一致性。

DriveDreamer4D 的总体结构框图如下所示,轨迹生成模块(NTGM)用于调整原始轨迹动作,如转向角度和速度,以生成新的轨迹。这些新轨迹为提取结构化信息(如车辆 3D 框和背景车道线细节)提供了全新的视角。随后,基于世界模型的视频生成能力,并利用更新轨迹后得到的结构化信息作为控制条件,可以合成新轨迹的视频。最后,原始轨迹视频与新轨迹视频相结合,进行 4DGS 模型的优化。

在实验中,多种传统算法(PVG, S3Gaussian,Deformable-GS )在变道场景下的车道线、天空、车辆都会模糊,甚至出现 “鬼影” 现象。而 DriveDreamer4D 可以提升多种重建算法在复杂变道场景下的视频渲染效果,不仅消除了 “鬼影”,而且提升了交通元素的渲染质量,车辆和车道线都更加清晰。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

除了变道,在车辆变速场景下,传统算法(PVG,S3Gaussian,Deformable-GS)的表现能力也受到限制,如下第一列视频所示,这些算法在自车加速时,前方的车辆都出现了 “拖影” 现象。而经过 DriveDreamer4D 提升后,渲染的车辆的时空一致性更高。

视频链接:https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

在定量实验中,本文证明了 DriveDreamer4D 不仅可以提升多种重建算法 (PVG, S3Gaussian,Deformable-GS)的图像渲染质量 (如表 2),还可以提升车辆和车道线渲染的时空一致性(如表 1)。此外,本文还通过 user study(表 3)证明用户更加偏好 DriveDreamer4D 的渲染效果,获得了超过 80% 的投票率。

表 1 DriveDreamer4D 提升了车辆和车道线重建渲染的时空一致性

表 2 DriveDreamer4D 提升了图像重建渲染质量

表 3 User study 证明用户更加偏好 DriveDreamer4D 的渲染效果

本项 DriveDreamer4D 工作是极佳科技研究团队之前 DriveDreamer 和 DriveDreamer-2 工作的延续。

DriveDreamer 是首个面向真实驾驶场景的世界模型,可以根据不同的控制条件生成自动驾驶周视视频,有效提升了 BEV 感知的性能;DriveDreamer-2 在此基础上,引入大语言模型,可以生成用户自定义的驾驶数据,进一步提升了长尾和 corner case 场景下的数据生成能力。针对端到端自动驾驶和闭环仿真对于场景重建的迫切需求,DriveDreamer4D 利用 DriveDreamer 系列工作的能力,用以生成新轨迹视频(例如变道、加减速),从而大幅提升了多种 4DGS 算法的重建效果。

本篇论文的牵头完成单位为极佳科技,是一家空间智能公司,致力于将视频生成提升到 4D 世界模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生成和认知推理能力,都有巨大的价值和作用。极佳科技是国内最早开始探索和布局世界模型和空间智能方向的公司,在物理空间和虚拟空间两方面都已取得显著的技术和商业进展,获得了行业广泛的认可。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台教授:岛内政治氛围在变,很多年轻人都在看小红书,大陆有底气

台教授:岛内政治氛围在变,很多年轻人都在看小红书,大陆有底气

海峡导报社
2026-05-16 07:32:04
官网前瞻骑士活塞抢七:三大球星谁能爆发?四位配角有望变身奇兵

官网前瞻骑士活塞抢七:三大球星谁能爆发?四位配角有望变身奇兵

罗说NBA
2026-05-17 06:36:26
中超无罚分积分榜:成都同样锁半程冠军,山东三连胜升第二

中超无罚分积分榜:成都同样锁半程冠军,山东三连胜升第二

懂球帝
2026-05-16 22:13:40
《给阿嬷的情书》单日票房过亿冲20亿!为何火得恐怖?

《给阿嬷的情书》单日票房过亿冲20亿!为何火得恐怖?

释凡电影
2026-05-17 04:51:47
心痛!张雨绮疑整容失败,满脸硅胶五官僵硬太油腻,侧面看像猪刚鬣

心痛!张雨绮疑整容失败,满脸硅胶五官僵硬太油腻,侧面看像猪刚鬣

八卦王者
2026-05-15 15:54:05
2000万汽车人的囚徒困境:国内车市大跌20.6%,卖一辆亏两三万

2000万汽车人的囚徒困境:国内车市大跌20.6%,卖一辆亏两三万

DearAuto
2026-05-15 09:34:57
比夺冠更诛心!瓦伦丁赛后几句大实话,雅马哈听完估计想连夜开会

比夺冠更诛心!瓦伦丁赛后几句大实话,雅马哈听完估计想连夜开会

童叔不飙车
2026-05-17 00:26:36
释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

江山挥笔
2026-03-23 15:40:31
突然发现一件很玄学的事情:凡事发生前,皆有预兆

突然发现一件很玄学的事情:凡事发生前,皆有预兆

时尚的弄潮
2026-05-16 13:07:38
最近李晨的瓜,有点大

最近李晨的瓜,有点大

黎兜兜
2026-05-15 15:29:18
PJ塔克如何二进宫杀回NBA,你知道这五年我经历了什么?

PJ塔克如何二进宫杀回NBA,你知道这五年我经历了什么?

篮球小烟花
2026-05-17 08:00:03
9男共用厕所升级!方媛真实用意曝光,这一点她真跟郭晶晶有点像

9男共用厕所升级!方媛真实用意曝光,这一点她真跟郭晶晶有点像

冷紫葉
2026-05-16 14:42:28
我卧底边境六年终于回家,饭桌上父亲用摩斯密码敲击桌子:赶快跑

我卧底边境六年终于回家,饭桌上父亲用摩斯密码敲击桌子:赶快跑

千秋文化
2026-05-14 20:24:09
女生退机票问豆包亏600后把豆包告上法庭!这问答记录和网友神评把人笑疯

女生退机票问豆包亏600后把豆包告上法庭!这问答记录和网友神评把人笑疯

不二表姐
2026-05-15 22:37:09
26国对伊朗下通牒!武力护航霍尔木兹,全球耐心耗尽

26国对伊朗下通牒!武力护航霍尔木兹,全球耐心耗尽

凤眼论
2026-05-15 21:45:41
3人暴增至100人!汉坦病毒来袭,CDC紧急扩编并拒绝封城!

3人暴增至100人!汉坦病毒来袭,CDC紧急扩编并拒绝封城!

可乐爱微笑
2026-05-17 02:25:32
特朗普刚走,俄伊喊话中国,普京太直接!中国警告以色列:快撤!

特朗普刚走,俄伊喊话中国,普京太直接!中国警告以色列:快撤!

混沌录
2026-05-17 01:37:10
很多人天天在吃“变质油”!研究证实:你家的油,开封42天可能就“坏”了

很多人天天在吃“变质油”!研究证实:你家的油,开封42天可能就“坏”了

人民日报健康客户端
2026-05-14 07:37:26
能接受吗?13秒16的吴艳妮来了 从亚洲一姐到亚洲九妹她心气已松

能接受吗?13秒16的吴艳妮来了 从亚洲一姐到亚洲九妹她心气已松

劲爆体坛
2026-05-17 07:26:09
U17亚洲杯17日凌晨 5-7 3-0 四强揭晓 国足对手敲定 韩国憾负 越南队大败

U17亚洲杯17日凌晨 5-7 3-0 四强揭晓 国足对手敲定 韩国憾负 越南队大败

等等talk
2026-05-17 03:28:14
2026-05-17 09:11:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13007文章数 142650关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

NASA高官迷之自信:我睡得着 中方现在彻夜难眠

头条要闻

NASA高官迷之自信:我睡得着 中方现在彻夜难眠

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

家居
健康
房产
手机
旅游

家居要闻

110㎡淡而有致的生活表达

专家揭秘干细胞回输的安全风险

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

手机要闻

小米天玑之王降临!小米17T系列预热:天玑芯+徕卡影像

旅游要闻

爱上海|“安吉拉花道”再迎盛放 绵延花墙绘就浪漫画卷

无障碍浏览 进入关怀版