网易首页 > 网易号 > 正文 申请入驻

理想汽车发布MindVLA,真正的自动驾驶还会远吗?

0
分享至

进入2025年,国内车市智能化竞争进一步升级,一些车企开始喊出“全民智驾”的口号。而从技术层面来说,处在头部位置的车企已经在推动下一代自动驾驶架构的落地。

在3月18日的NVIDIA GTC 2025上,理想汽车自动驾驶技术研发负责人贾鹏发表了主题为《VLA:迈向自动驾驶物理智能体的关键一步》的演讲,并发布了理想汽车的下一代自动驾驶架构——MindVLA。

理想汽车董事长兼CEO李想当日在社交平台发文称,“MindVLA是一个视觉-语言-行为大模型,但我们更愿意将其称为“机器人大模型”,它将空间智能、语言智能和行为智能统一在一个模型里,让自动驾驶拥有感知、思考和适应环境的能力,是我们通往L4路上最重要的一步。”他还表示,MindVLA能为自动驾驶赋予类似人类的驾驶能力,就像iPhone 4重新定义了手机,MindVLA也将重新定义自动驾驶。

全栈自研MindVLA开启自动驾驶iPhone 4时刻

理想汽车的智能驾驶经过几次迭代和升级。去年10月,理想汽车全量推送“端到端+VLM”双系统方案后,该模式渐渐成为行业的标杆。许多企业开始采用这一路线。特别值得一提的是,不仅在自动驾驶领域,在通用机器人领域该系统也得到应用。

基于上述“端到端+VLM”双系统架构的实践,及对前沿技术的洞察,理想自研了MindVLA大模型。VLA是机器人大模型的新范式,其将赋予自动驾驶强大的3D空间理解能力、逻辑推理能力和行为生成能力。

值得注意的是,MindVLA不是简单地将端到端模型和VLM模型结合在一起,所有模块都是全新设计。3D空间编码器通过语言模型后,和逻辑推理结合在一起后,给出合理的驾驶决策,并输出一组action token(动作词元),action token指的是对周围环境和自车驾驶行为的编码,并通过diffusion(扩散模型)进一步优化出最佳的驾驶轨迹,整个推理过程都要发生在车端,并且要做到实时运行。

2010年中发布的iPhone 4是智能手机时代的首个爆款,也是智能手机渗透率加速提升的起点。对汽车行业来说,理想汽车最新的MindVLA也将重新定义自动驾驶,加速行业的快速发展。

从用户体验方面来看,有MindVLA赋能的汽车不再只是一个简单的驾驶工具,而是一个能与用户沟通、理解用户意图的智能体。能够听得懂、看得见、找得到,是一个真正意义上的司机Agent或者叫“专职司机”。

所谓“听得懂”是用户可以通过语音指令改变车辆的路线和行为,MindVLA能够理解并执行“开太快了”“应该走左边这条路”等这些指令。“看得见”是指MindVLA具备强大的通识能力,不仅能够认识星巴克、肯德基等不同的商店招牌;当用户在陌生地点找不到车辆时,可以拍一张附近环境的照片发送给车辆,拥有MindVLA赋能的车辆能够搜寻照片中的位置,并自动找到用户。“找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游,其中典型应用场景是用户在商场地库,可以跟车辆说:“去找个车位停好”,车辆就会利用强大的空间推理能力自主寻找车位,即便遇到死胡同,车辆也会自如地倒车,重新寻找合适的车位停下,整个过程不依赖地图或导航信息,完全依赖MindVLA的空间理解和逻辑推理能力。

对于人工智能领域而言,汽车作为物理人工智能的最佳载体,未来探索出物理世界和数字世界结合的范式,将有望赋能多个行业协同发展。

打破传统,六大关键技术引领行业创新

在理想交付端到端+VLM期间,空间智能、LLM、AIGC和具身智能等技术有了快速发展。基于此,理想开始思考能否将端到端模型和VLM模型合二为一,像GPT O1和DeepSeek R1一样,让模型自己学会快慢思考,同时赋予模型强大的3D空间理解能力和行为生成能力,将双系统的天花板进一步打开。

MindVLA打破了自动驾驶技术框架设计的传统模式,使用能够承载丰富语义,且具备出色多粒度、多尺度3D几何表达能力的3D高斯(3D Gaussian)这一优良的中间表征,充分利用海量数据进行自监督训练,极大提升了下游任务性能。

而在过去,从单目2D特征到单目3D特征,再到多摄像头的鸟瞰图(BEV)特征和占据网格(OCC)等不同阶段,大多依赖于监督学习,需要精准标注的数据,效率和数据利用率都很低下。

理想还从0设计和训练一个适合VLA的LLM基座模型,使其具备3D空间理解和推理能力,并能在有限资源下实现实时推理,保证模型规模增长的同时,不降低端侧的推理效率。而在训练模型去学习人类的思考过程,理想让快慢思考有机结合到同一模型中,并可实现自主切换快思考和慢思考。

为了把NVIDIA Drive AGX的性能发挥到极致,MindVLA采取小词表结合投机推理,以及创新性地应用并行解码技术,进一步提升了实时推理的速度。至此,MindVLA实现了模型参数规模与实时推理性能之间的平衡。

理想利用diffusion模型,将action token解码成最终的驾驶轨迹,并让RLHF与diffusion结合,学习和对齐人类行为的同时,提升安全下限。

MindVLA基于自研的重建+生成云端统一世界模型,深度融合重建模型的三维场景还原能力与生成模型的新视角补全,以及未见视角预测能力,构建接近真实世界的仿真环境。源于世界模型的技术积累与充足计算资源的支撑,MindVLA实现了基于仿真环境的大规模闭环强化学习,即真正意义上的从“错误中学习”。过去一年,理想自动驾驶团队完成了世界模型大量的工程优化,显著提升了场景重建与生成的质量和效率,其中一项工作是将3D GS的训练速度提升至7倍以上。

理想通过创新性的预训练和后训练方法,让MindVLA实现了卓越的泛化能力和涌现特性,其不仅在驾驶场景下表现优异,在室内环境也展示出了一定的适应性和延展性。

持续精进,朝全球领先的AI企业再进一步

在上述六大技术的突破下,理想MindVLA能为自动驾驶行业带来革命性的变化。而这离不开理想在智能驾驶技术、AI大模型等领域的持续投入。

理想在不断进行技术创新的同时,还在人工智能领域顶级学术会议和期刊发表了大量论文,为加速技术发展贡献了重要力量。

李想曾说过,理想要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。从行业视角来看,汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。在对整个世界的理解上,理想通过人工智能将物理世界与数字世界进行融合,让有限的空间实现无限的延伸。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贵州省贵定县暴雨洪灾已致4人死亡5人失联

贵州省贵定县暴雨洪灾已致4人死亡5人失联

界面新闻
2026-05-19 17:06:52
夫妻杀人后潜逃20年,各自另组家庭,妻子成公司高管丈夫成大老板

夫妻杀人后潜逃20年,各自另组家庭,妻子成公司高管丈夫成大老板

就一点
2026-05-19 11:34:38
吴镇宇“亲”郝蕾风波发酵,受害者不止2人,汪峰宁静早就吃亏了

吴镇宇“亲”郝蕾风波发酵,受害者不止2人,汪峰宁静早就吃亏了

老吴教育课堂
2026-05-19 02:19:45
《水浒传》中猛将排名,他才是武力值天花板

《水浒传》中猛将排名,他才是武力值天花板

史政先锋
2026-05-17 15:49:01
《黑袍纠察队》,大结局来了!

《黑袍纠察队》,大结局来了!

来看美剧
2026-05-19 22:28:32
“长三角之星”旅游列车上海首发,近200名游客开启18天畅游南北疆之旅

“长三角之星”旅游列车上海首发,近200名游客开启18天畅游南北疆之旅

现代快报
2026-05-19 14:16:24
安切洛蒂豪赌:内马尔凭啥挤掉英超 20 球神锋佩德罗?三点原因

安切洛蒂豪赌:内马尔凭啥挤掉英超 20 球神锋佩德罗?三点原因

姜大叔侃球
2026-05-19 19:27:18
突然动手!菲律宾参议院“红袍”开庭,莎拉·杜特尔特遭弹劾

突然动手!菲律宾参议院“红袍”开庭,莎拉·杜特尔特遭弹劾

菁菁子衿
2026-05-19 11:20:35
国产系统里程碑!华为鸿蒙PC正式发布,5999元起告别Windows

国产系统里程碑!华为鸿蒙PC正式发布,5999元起告别Windows

小柱解说游戏
2026-05-19 00:54:04
板桥水库溃坝:24万人一夜消逝,尘封28年,真相远比天灾残酷

板桥水库溃坝:24万人一夜消逝,尘封28年,真相远比天灾残酷

小玡说故事
2026-05-15 20:07:35
1979年,越军狙击手,将副师长一枪打死,我军找不出人,立马撤离

1979年,越军狙击手,将副师长一枪打死,我军找不出人,立马撤离

兴趣知识
2026-05-18 00:46:47
游山玩水:把心交给天地,把自己还给自己

游山玩水:把心交给天地,把自己还给自己

疾跑的小蜗牛
2026-05-19 20:29:40
公园监控惊现“活春宫”事情闹大,上千网友连夜上山打卡,擎天岗爆红成为网红新地标,还有人现场穿恐龙服还原情侣姿势,画面荒谬!

公园监控惊现“活春宫”事情闹大,上千网友连夜上山打卡,擎天岗爆红成为网红新地标,还有人现场穿恐龙服还原情侣姿势,画面荒谬!

澳门月刊
2026-05-18 10:29:06
陈婉珍送别何超蕸需搀扶,何猷启与第二任妻子现身,何超云带男友

陈婉珍送别何超蕸需搀扶,何猷启与第二任妻子现身,何超云带男友

一盅情怀
2026-05-18 10:57:01
高市早苗遭遇耻辱一幕!日本官员嚷着:要在中国介绍“女首相”

高市早苗遭遇耻辱一幕!日本官员嚷着:要在中国介绍“女首相”

小樾说历史
2026-05-18 12:39:56
赶在普京抵京前,李显龙访华5天,罕见不去北京,但目的非常明确

赶在普京抵京前,李显龙访华5天,罕见不去北京,但目的非常明确

书纪文谭
2026-05-19 11:26:05
国少挺进2026年U-17亚洲杯四强,韩媒感慨,“日韩对决”化为泡影

国少挺进2026年U-17亚洲杯四强,韩媒感慨,“日韩对决”化为泡影

兰亭墨未干
2026-05-19 16:18:54
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

李橑在北漂
2026-05-17 19:52:16
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
21场8球8助 皇马19岁前锋回来了:穆帅若执教 他将扮演奇兵

21场8球8助 皇马19岁前锋回来了:穆帅若执教 他将扮演奇兵

叶青足球世界
2026-05-18 19:28:56
2026-05-19 23:16:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1087888文章数 1334638关注度
往期回顾 全部

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

头条要闻

华南农大回应"石牌旧址琉璃瓦被扔":非原始建筑构件

头条要闻

华南农大回应"石牌旧址琉璃瓦被扔":非原始建筑构件

体育要闻

文班亚马:没拿到MVP,就证明自己是MVP

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

从卖流量到卖Token,运营商算力生意破局

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

态度原创

时尚
本地
房产
手机
军事航空

57岁恶女出手整治浪姐,全网拍手叫好

本地新闻

别搜晋江小说了,去看真的晋江

房产要闻

7516元/㎡,161套一次全甩!海口住宅最低价出现了!

手机要闻

联想大量新品发布,大小折叠屏、拯救者新一代Y70、平板都有!

军事要闻

特朗普暂缓打击伊朗 称系应中东三国请求

无障碍浏览 进入关怀版