2024年12月20日,由科技出行产业智库与创新服务平台亿欧汽车主办的GTM2024第七届科技出行大会暨科技出行产业创新榜发布会在上海漕河泾万丽酒店成功举办。
本次活动主题为“开启AIEV元年”,由亿欧汽车倾力打造,意在产业创新的坐标系中,积极推动以AI数字智能为代表的新质生产力与汽⻋工业与出行产业加速融合,促进深度融合人工智能技术的新一代AI出行终端AI EV加速到来。
基于亿欧汽车对智能电动汽车与科技出行产业的长期洞察与研判,此次大会将围绕AI与EV两大产业生态,聚焦具身智能、大模型、端到端自动驾驶、固态电池、车规级芯片、新能源商用车、超级补能、车路云一体化等细分话题,并携手汽车出行产业上下游代表企业、机构、跨界科技公司等共话行业发展图景,见证即将到来的AI应用的群星闪耀时刻。
在本届大会上,零一汽车智能驾驶合伙人王泮渠发表了题为《新能源重卡的智能化之路》的主题演讲,他认为大语言模型是解决高阶智驾泛化性问题的钥匙。零一汽车结合强泛化的算法,可量产的整车平台,及易闭环的场景,实现新能源智能重卡的快速落地。
以下为亿欧汽车整理的分享实录,供行业人士参考:
非常高兴跟各位同行各位朋友简单分享一下我们零一汽车的一些思考。首先简单介绍一下,我们是一家新能源重卡科技企业,我们是造车新势力,我们的两款卡车已经量产,包括用大数据应用,重塑卡车的研发生产体系,包括极致的自动化实现,包括自动驾驶、自动底盘和大模型,一会我会讲到,帮助我们新能源重卡领域把它变得更加智能和高效。
零一从2022年到现在两年半左右时间进展还是可以的,我们实现了两款车型的量产,以及很多客户使用都认为体感是非常不错的。今年年中我们有一些成绩,比如大模型的应用,后面也会跟大家做一些展开。
今天主要想聊的就是自动化这一块比较相关,就是自动驾驶的话题,我先简单介绍一下。同行已经聊到我们整个行业对于自动驾驶来说进展是非常快的,首先就是辅助驾驶,我们经常说高速NOA城市NOA,进入到一个量产以及大规模的状态,比如说目前市场上有大概1000万辆车,NOA渗透率达到50%左右。对于无人驾驶来说,也就是我们说的L4更高级别的无人驾驶却相对比较初期。无人驾驶商用车场景是非常广泛的,,比如物流、矿区、港口、配送厂内有非常多应用和案例,非常多的友商从事这样的行业。大的自驾来说,我们终极目标还是形成一个规模化的无人驾驶,也就是把已经成熟的量产的辅助驾驶以及试点的无人驾驶,把它做一个整合,最终实现真正完全量产的无人驾驶,这是我们的目标。
我们离这个目标还有多远呢,至少在商用车重卡另外还差哪些东西要做?这是我们零一聚焦的三个点,软件、算法端,车辆端,路径端,我今天做一些思考的分享。
首先还是说一说关于软件和整个算法这一块,因为很多自动驾驶从业者包括我个人在内都是平时做研发为主,我们会默认它是一个偏软件的商业模式,但是目前来讲可能它不是这样的,因为软件行业的商业模式大家会认为它是非常低边际成本的,比如我们搞电商平台用非常低的成本获得一个新的客户,打开一个场景。但是自动驾驶还做不到这一点,我们做一个场景再做下一个场景也需要付出同样的努力。比如以目前的领头羊Waymo为例,它实现了4个城市的商业化运营,它有足够的数据足够的车辆我们认为它是头部玩家。但是如果真正实现量产在全美国或是全世界实现无人驾驶无人化运营来说还是比较困难的。每个场景都不一样。我们看,我们算法端也就是整个软件端这个技术能力并没有办法真正完全支持到量产自动驾驶需要的程度,这也是当前的一个机会。
具体来说,当前无人驾驶的方案就是基于这个上面所讲的模块化的设计,上面有几十个模块,问题有哪些呢,每个模块算力比较分散,而且它和其他模块的优化目标不一致导致模块之间的冲突,另外是工程成本和带来的开发成本和项目管理成本的问题。还有我们提到的泛化性的问题,如果我们遇到长尾场景的话,在四五十个模块同时进行更新的时候不可避免引入很多人工的规则或是手工的参数,这样的话,维护整个系统或是让整个系统进入到下一个新的场景的时候,它成本是非常高的。这就是问题。在当前整个行业来说的话,大家因为意识到这个问题,所以大家都在聊这个端到端这个事情,端到端主要解决的一个问题,其实是非常简单,就是把刚才的几十个模块整合成一个或是两个,来避免模块之间的打架和算力不足的问题。而端到端之内,中间这样的一个方块采用一个什么样的技术路线,目前大家还没有一个共识,有的同行可能采用两段式的一段式的,有的是用视觉模型,有的想用大语言模型。我们大语言模型的思路是比较好的一个方案,为什么这样说,刚才说一个问题就是泛化性的问题。为了解决泛化性的问题,我们反过来看目前市面上能找到的泛化性更早的模型是什么,就是大语言模型,在一个我们没有训练过的场景,比如总结今天开会的一个会议纪要肯定没有训练过,但是可以回答的很好。基于基座模型的能力,我们其实需要做的事情就是把这个大语言模型本身的这个常识也好,整个泛化性的水平也好跟自动驾驶的场景做一个很好的结合,这样我们既能利用好它强泛化性,更好为我们自动驾驶的场景做服务。所以这就是我们一个大语言模型的原因。
本身核心还是大语言模型,我们需要做的就是输入端输出端做一些自动驾驶方面的一些适配,比如它输入端包括摄像头、激光雷达等等模态,包括我们去哪里。输出端就是端到端的轨迹、控制为什么这样做的一些逻辑推理。其中需要我们做非常多的设计方面,除了这个网络架构之外,是跟训练方式相关的东西。我们把它说的更简单一点就是怎么让大语言模型会开车,这个类比成人类学习的过程,大语言模型本身已经水平说是硕士生还是博士生,并不是博士学历才可以是一个合格的驾驶员。我们是让它基于多模态视频语言的能力,在此基础上通过一些驾驶的常识注入,以及驾驶视频的理解,最后让它自己学会驾驶轨迹的生成,这样的话就是一个比较拟人也是比较有效的训练策略,让大语言模型从一个基座模型变成一个智能模型。
我们也了一些尝试,发现它在平时见到的场景下效果是非常不错的。与此同时我们在业界收集了一些案例,可以看一下左边黄色的方案是非大语言模型的,右边蓝色的是基于大语言模型的,总来说它复杂度更高,但是它性能在同样的评测题上是更好的,所以未来我们也是希望沿着这个方案继续往前进。这是一个比赛的成绩,我就略过了。
大语言模型怎么保证安全性?我们认为这个问题的核心反映的就是大众对新鲜事物的不确定性,我们应该如何相信它。其实我们认为从四个方面解决这个问题,首先原理上,大语言模型本身是基于这个机制,输出通过这个权重做追溯我们知道它做得好还是不好。第二个就是算法上大语言模型有非常独特的优势,它跟非大语言模型相比可以更好利用语言上加一些什么是安全什么是不安全,正负样本的结合,刚才说到多模态的对齐以及强化学习的方案,生成对抗式学习,可以得到比较好的解决。除了算法之外,我们回到自动驾驶本身它是基于车辆系统的,自动驾驶的开发流程对大语言模型同样适用,我们要比较好的线下仿真,有一个比较好的仿真场景,使各种问题得到解决。通过系统把算法、软件以及硬件做一个比较好的结合,打造一个针对L4全冗余的体系,这就跟整个车辆制造是非常相关的,这也是我们为什么说在做自动驾驶研发的同时造车业务也是我们的基础,这是我们的一个核心的想法。
综合来看,我们认为坚持大语言模型这条道路是真正能往量产无人驾驶做的一个自由路径。这是在算法端的一个介绍。
接下来是关于车辆这一块,车辆这一块目前大家有一个偏共识一点的结论,如果我们要做量产自动驾驶的话,首先我们量产车是非常重要的,在乘用车领域大家看到的目前这个趋势,就是说,做的比较好的一些主机厂确实数据量规模比较不错,量产车带来一个好处就是它很大降低我们成本,成本包括数据获取的成本,整个车辆运营成本,包括自动驾驶想做大规模的验证测试,这样的一些成本。这些其实都是我们想要做自动驾驶一定需要的内容。
对于商用车来说,我们提到车辆的硬件投入远远不如刚才提到的用车的领域以及我们算法本身。随着过去五年或是十年左右的自动驾驶发展,软件接管率已经下降比较多了,硬件还是比较高的状态,而且比软件的概率还高。但是整个行业里面,商用车硬件投入和资金支持来说是相对比较低的水平,这也是为什么我们看到目前如果我们想实现整个商用车的自动驾驶,在造车这个领域我们是先行的。造车这一块我们做了两个事情。一个是底盘一个是数据驱动。
一个是底盘,我们是全冗余高性能的L4的底盘系统,大家可以看到,我们车上设计有很多的传感器,比如对线控的转向、驱动,制动、电源管理、以及CAN的一些系统都能做到全冗余的方案,这是第一个商用车全冗余线控的思路。性能也是不错的,而且时间有一个比较好的优化,信号以及整个无故障运行时间。这些指标反过来可以指引我们做更好的设计。
第二是数据驱动,传统车基本上相互割裂的,研发、生产、制造、销售,甚至包括我们自动驾驶,每个系统是不一样的,是不打通的。零一目前做的事情就是所有的数据打通,所有的系统串起来,这样的话我们所有数据比如说我们在测试中遇到的数据反馈到我们研发端生产端或是销售端。通过智子系统更好的做系统迭代。我们电耗为例,目前零一的卡车受欢迎的原因是我们电耗非常低,优化电耗是非常难的事情,我们在这之前要做很多的实验,是非常费人力物力的。刚才讲到智子平台,我们非常清楚知道每一度电去哪里了,通过电池或是电机损耗的还是我们在轮胎或是什么地方,来实现很短时间内电耗降低30到40%的水平,也能在行业不断的做正向的迭代。
刚才蜻蜓点水一样介绍了我们整车的设计。最后聊一下商用车商业化的土壤,有的同行已经谈到了,我们商用车领域高阶自动驾驶怎么可以很快的产品化。这张图代表了一个在我们看来,商用车高阶智驾量产方面的优势性质,比如说我们想把一个乘用车做到量产,它可能面对的场景是非常复杂的,比如说我们想在上海或是北京做一台车,面对的2000万人口,几千万辆车的道路场景。对于商用车来说,它所覆盖的场景可能只是一个煤矿,或是一个厂区或是一个物流园区一个港口,它这个场景是非常小的,它不只是车辆需要的少,对管理车辆的难度或是整个场景的数量也是相对来说比较低。包括法律法规来说在城市道路以及城市道路甚至一些矿区内部要求也是不一致的。
另外,对于商用车来说少了很多的变量就是上面没有人,只有货物,做优化的时候不用考虑特别多的三角关系的平衡,我们要考虑安全性、人的舒适性,还考虑人的心情等等。商用车只要安全准时把货物运到目的地就可以了,所以我们场景复杂度,资产管理的难度和落地所需要的时间来说,对高阶智驾这是第一站。单一场景可以实现这样的场景落地,希望按随着大模型技术的进步,我们其实能让各个场景之间做一个打通,既可以实现封闭场景的自动驾驶也可以半封闭或是开放的场景以及是道路的因素。这是我们长久以来的目标,我们希望零一通过强泛化的算法,大模型的架构、正向设计车辆平台,这是我们的优势和基础,快速闭环的场景应用,能把整个新能源重卡智能化做一个比较快速的落地,为整个行业做一些贡献。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.