文|光锥智能 周文斌
亦庄新城,又叫北京经济技术开发区,位于北京西南方,离市中心大概20公里。最近两年,随着自动驾驶的高速发展,亦庄也成为了各大自动驾驶企业最肥沃的试验田。
从市区前往亦庄,驱车大概需半个小时,这里没有其他经开区常见的高楼林立,反而因为地处郊外,视线没有遮碍,再加上偌大的华北平原作为背景,所以显得有些荒芜和空寂。这种感觉,特别是在见惯了北京的繁华之后,对比得格外强烈。
但是,如果你将眺望天边的视线收回,将目光重新注意到亦庄往来交错的街道,那么你很快又会在这荒芜空寂的外表下感受到一种绝对的炽热,就像一团火焰,正在熊熊燃烧。
在这里,随处可见的自动驾驶车辆,正在让亦庄成为一座真正的自动驾驶之城。
进入亦庄,我们遇到的第一个红绿灯路口,左右两边与我们并排等待的,就是两辆自动驾驶测试车,一辆属于百度Apollo,一辆属于小马智行,一辆车的安全员坐在主驾驶,另一辆车的主驾驶位置却空着。
红灯熄灭,绿灯亮起;在我们的车辆才刚刚起步的时候,两旁自动驾驶的汽车却已经早早的驶过了路口,我们只能在后面遥遥地看到一排尾灯。
除了主路上行驶的自动驾驶车辆之外,旁边的辅路随处可见美团的自动驾驶送餐车,不知品牌的快递配送车,自动行驶的路面清洁车,以及那些在路上趴了窝,正在被工程车驮着送去检修的故障车辆。
在这之前,我们从未想象过自动驾驶可以表现得如此具体,所有交通工具各司其职,一种赛博朋克的感觉扑面而来。整个亦庄似乎都在为成为一个无人化的城市而努力。
在之前,这种热烈我们也只能在亦庄这种远离城市的郊区看到。而最近,自动驾驶却准备正式"进城"了。
近日,小鹏城市NGP(Navigation Guided Pilot智能导航辅助驾驶)在预告10个月之后,终于在广州开始向部分用户推送了。从网友上传的视频可以看到,更新NGP之后的小鹏P5已经能够在人类驾驶员的监督下,平稳地行驶在城市道路上。
自动识别红绿灯,自动并线、超车,主动绕开占道的行人和自行车,在路口会车的时候主动"加塞"......一系列的操作就如同一个老司机,面对最拥挤复杂的路段也游刃有余。而整个过程中,驾驶员的手甚至都不需要碰到方向盘,只是作为一个监督者,预防可能发生的意外。
可以说,随着城市辅助驾驶的上线,驾驶员与车的关系,正在发生深刻的改变。
今年以来,城市辅助驾驶也正在成为各大车企和自动驾驶企业争夺最激烈的焦点。
8月18日,魏牌CMO乔心昱率先在微博喊话,称只有面临更复杂路况的城市辅助驾驶才是自动驾驶的"大学水准",将自动驾驶的舆论焦点拉到了城市辅助驾驶。
之后,毫末在9月13日AI DAY上,详细介绍了城市辅助驾驶方案(城市NOH)技术迭代;宏景智驾也在2022世界智能网联汽车大会上展示了包含城市智慧领航(NOP-C)的全栈自动驾驶解决方案。
而除了这些之外,同样不甘落后的玩家还有计划今年内在ET7和ET5等车型搭载的NAD系统上实现辅助驾驶的蔚来;在L9上搭载了智能驾驶系统"理想AD Max",以实现全场景导航辅助驾驶的理想;以及搭载了华为ADS系统,同样具备高速+城市场景辅助驾驶的能力的阿维塔11等等。
据亿欧汽车统计,今明两年,至少有12家车企/自动驾驶企业将落地支持NOA行泊一体的智能驾驶方案。
渐进式的辅助驾驶"进城",成为当前自动驾驶最关键的一场战役。
自动驾驶进城,两种路线一个方向
路旁随意停放的车辆,走下路肩的行人,送外卖的电瓶车,往来的自行车,横穿马路的行人,红绿灯路口的拥堵、加塞......
从高速公路的30万公里到城市道路的1100万公里,自动驾驶进入城市后,不仅仅在使用里程上有极大的延展,其道路的复杂程度也上升了不止一个数量级。毫末智行CEO顾潍灏总结,城市道路最显著的三个特点,就是——路口多、变道多、拥堵多。
某种意义上说,城市道路辅助驾驶系统要解决的问题难度,并不低于L4级自动驾驶。
延续高速辅助驾驶的路径,城市辅助驾驶系统也分为两个技术方向,即重高精地图和重感知,这两个方案各有优劣。
首先是依赖高精地图的方案,由于其能够将车道信息精确到1m左右,所以采用高精地图方案的车辆行驶起来都会比较稳定。在转弯、并线、车道规划,以及上下匝道时都较平顺。新造车的蔚小理采用的都是这种方案,其中理想和小鹏用的是高德的高精地图,而蔚来用的则是百度地图。
而没有采用高精地图方案的车企,如特斯拉在进入匝道时往往会出现"画龙"的情况,在车道规划时也会出现过早、过晚的情况。
不过,高精地图方案也存在许多问题。比如,因为地图覆盖范围有限,辅助驾驶能够使用的范围也有限;比如数据更新不及时,碰到一些临时施工改道的道路,车辆会因为数据没有更新而一头扎进封闭的施工道路中。
中国城市道路来回里程高达到1100万公里,这样庞大的规模,如果都按高精地图的要求来维护,数据几乎不可能实现及时更新。
除此之外,高精地图的使用也有相应的规范,通常需要相关部门审核之后才能上线。而这种审核,往往也会导致早已准备好的辅助驾驶功能延期。比如,小鹏城市NGP大概三个月前就已经准备好了,但是因为高精地图没有审核通过,所以一直拖到了现在。
而作为对比,重感知的路线则相对自由,能够应对更多的复杂路况,使用范围也不必被高精地图所掣肘。重感知路线的代表车型就有特斯拉和魏牌(采用的毫末NOH)等等。
所以,为了规避高精地图带来的一些局限,如今许多车企/自动驾驶企业都将绕开高精地图作为主要的发展方向。
除此之外,也有如毫末采用"重感知,轻地图"的中间路径——以感知为主,地图为辅。
毫末的方案是,通过围绕车身的传感器(雷达、摄像头等),建立一个连续的时空模型,再从这个模型中提取车辆行驶时需要的车道线、车辆位置、其他交通参与者的意图等等。然后再与导航信息进行结合,最终指导车辆行驶。
"这种方式就和人开车一样,我们就把眼前的这段路开好。"顾潍灏说。
整体来看,降低高精地图在城市领航中的占比是大势所趋。余承东、何小鹏也都在公开场合提到,对于自动驾驶而言,高精地图一定是过渡,真正的自动驾驶一定要能够全场景驾驶。
除了采用毫末城市NOH的魏牌计划在年底覆盖10座城市,小鹏也在推进不依赖高精地图的辅助驾驶车型。
但是,重感知路线的城市领航,为什么也仍然没有大面积在各个城市上线?
毫末相关技术负责人对光锥智能表示,"在实际应用当中,每个城市都有许多意想不到的复杂路况,比如奇葩的红绿灯。"
在保定的一次测试中,他们每天经过的路口突然新增了一个红绿灯,没人知道这个红绿灯什么时候出现的,大家也没有在其他地方见过同样的东西。"三排红绿灯横穿整个路口,两边用高亮的LED包裹,四周围绕的全部都是LED的彩灯。"
一个奇葩的红绿灯,把数万元的辅助驾驶整不会了?
城市的道路,每时每刻都在发生着变化,不同城市之间的不同道路会有所区别,同一个城市的不同道路也会有所不同。
"为了保证产品交付的稳定,我们前期肯定会控制节奏,每一个新开通的城市都会去做具体的测试,而当某一天我们发现新增的问题数量开始减少,或者快速收敛达到一定程度之后,才会去做大规模的铺开。"毫末对光锥智能如是说。
按照计划,魏牌会在年底之前让城市NOH覆盖10座城市,并计划在明年覆盖超100座城市。除此之外,搭载华为城市辅助驾驶的极狐预计在今年年底向用户推送,蔚来、理想也将在2023年陆续更新自家的城市辅助驾驶系统。
自动驾驶3.0,开始拼算力
"大众辅助驾驶,拥堵跟车把变道的前车给撞了"
"有次在高速ACC帮我防止了追尾。"
用户对辅助驾驶的评价,呈现出两极分化。
事实上,从目前的许多事故上来看,辅助驾驶确实还很难说得上安全,就在不久之前,开着LCC功能的小鹏就在高速追尾;之后也有特斯拉在进入小区时突然加速。
而这一系列的事故也给了广大车主一个非常强的不信任感。辅助驾驶在高速、停车场这样相对简单的场景都不能保证安全,那在更复杂的城市道路上又值得信任吗?
顾维灏认为,目前城市辅助驾驶的挑战主要还是道路的复杂性,具体表现为城市道路养护,大型车辆密集,变道空间狭窄,城市环境多样四个方面。而要解决这些问题,AI就需要更多的数据样本进行训练,所以数据也就成了驱动自动驾驶成熟的核心。
区别于之前辅助驾驶将单个传感器数据在车载大算力芯片上进行计算,在进入城市辅助驾驶之后,毫末开始将所有传感器的原始数据放在一起,然后再通过AI大模型输出车辆的全局感知结果。
这样做的好处是,车辆在认知领域的进步可以逐渐脱离之前人为设定的规则,然后逐渐把人类真实驾驶的行为和常识提取出来。简单说就是让AI驾驶更像人类的老司机。但要达到这种状态,那支持训练的模型的数据至少要超过1亿公里。
除此之外,进入城市道路之后,汽车也要开始适应人类常用的交互方式,比如要理解周围车辆转向灯、尾灯的不同信号的意图。但现在市面上,不同车型、不同形状的尾灯都有很多,这不仅对算法识别带来挑战,庞大的数据量同样也会增加。
为了解决AI训练中语义理解的问题,谷歌在四月份发布了一个新的训练模型——Pathways Language Model(PaLM),由于其训练参数达到5400亿,使用了7800亿个Tokens,也被大家戏称为,让世界没有难懂的梗。但这种能力要使用到自动驾驶环境,也要求自动驾驶训练的里程至少在一亿公里以上。
图:PaLM用two-shot prompts解释了一个原创笑话
很显然,要训练出好的自动驾驶,未来的数据量会变得越来越大,特斯拉现在拥有三大数据中心,总计11544GPUs。为了提高数据的使用效率,特斯拉在2021年AI DAY上还发布了自研的DOJO超级计算系统和D1芯片。
但传统的数据使用方式还是制约了自动驾驶的发展。在之前,大量的数据进入训练阶段之前,都需要人工进行标注,即人要先告诉AI,这个东西是红绿灯,那个东西是栅栏,帮助AI建立基本认知。庞大的数据标注催生了数据标注师这个职业,也一度被人们戏称"有多少人工就有多少智能"。
但这种依赖人工标注的训练方式也存在许多问题,比如大量时间和成本的占用。顾维灏在毫末AI DAY上表示,之前的AI训练中,成本主要用在了训练标注上。而在今年6月份,特斯拉加州办公室有近200位员工被裁,主要也是自动驾驶的数据标注团队。
为了解决数据标注的成本问题,特斯拉也开始引入效率更高,成本更低的数据标注系统。这个系统只需要将车辆在路上行驶采集到的真实驾驶数据,再利用标注好的数据来训练模型,将结果进行联合优化以后便可以得到更加精确和详细的标注结果,整个过程都不需要人工的参与。
在2021年8月的AI Day上,特斯拉Autopilot的软件总监Ashok Elluswamy就表示,他们可以在一周内自动标记10k个clips(最小标注单元),而之前这个工作量至少需要几个月的时间。
在国内,毫末采用的大模型训练方式也有异曲同工之处。
毫末的方案是用大量未经标注的数据进行预训练,然后形成一个主干模型,之后再用标注过的数据在特定的任务上做特定的优化。通过这种方式,毫末让训练效率提升了三倍,精度和准确性也远高于之前只用标注数据训练的结果。
清华大学智能科学讲席教授,中国工程院外籍院士张亚勤表示,自动驾驶正在逐步在向大模型,大数据、预训练、多模态、端到端的趋势发展。
最近几年,随着Attention to Transformer的广泛应用,AI的自然语言识别效果很快超过了人类的平均水平。但问题也随之而来,这种大模型对算力的消耗要远远高于摩尔定律能给到的支持。这也导致AI大模型的训练成本太高了,传导之后,也让自动驾驶在车端的落地变得比较复杂。
针对这个问题,目前行业里也在积极探索解决方案。目前主流的方案有两种,一种是轻量化,另一种是降低计算中的弱关联计算。
首先是轻量化。Attention to Transformer这种模型,其计算力和计算量比之前的CNN(卷积神经网络)要高100倍,而这100倍的冗余显然还没有达到完全释放的时候,所以许多玩家就在尝试将CNN与Attention在不同环节做不同程度的融合,以达到降低算力,实现轻量化的目的。其中像苹果在2021年提出的mobileVit和三星在今年提出的XFormer都是其中代表。
另一个则是降低弱关联计算。要知道,Attention其实有一个特点,就是在庞大的计算中,6.9%的计算贡献了大概94%的价值,剩下93%左右的计算则是弱关联计算,并没有太大的作用,这就造成了非常庞大的算力浪费。
基于这样的特点,清华的一位教授开始针对Attention的机制设计芯片(之前相关芯片的设计都是针对CNN进行的),以达到降低弱关联计算的目的。
顾维灏认为,自动驾驶需要的数据主要是两个方面,一个是规模,另一个是多样性。我们今天做的所有工作,都是为了更加高效,低成本地获取数据。然后把数据送到计算中心,用训练的方法把数据转换为自动驾驶的能力。
除了在算法模型上下的功夫之外,算力也是未来自动驾驶能力的关键。
8月初,小鹏与阿里云专门为自动驾驶建立的智算中心"扶摇",在被称为"草原云谷"的乌兰察布正式落成。这座智算中心算力可达600PFLOPS,用于小鹏的自动驾驶模型训练。
而在刚刚举办的AI DAY上,毫末也公布了首个超算中心。顾维灏表示,毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,将整体训练成本降低200倍。
随着自动驾驶发展阶段的改变,自动驾驶公司的成本重心也开始发生转移。"自动驾驶2.0阶段,钱都花在数据标注上了,应用大模型后的3.0时代,成本会发生转移,会从标注转到计算。"顾维灏称。
总之,数据的规模、获取成本、质量、处理速度等,都和自动驾驶能力的提升速度正相关。自动驾驶已经进入了依靠算力推动数据处理的时代。
结语
如今,各地政府也在加快推进自动驾驶和辅助驾驶的发展。
9月初,上海市政府印发《上海市加快智能网联汽车创新发展实施方案》,目标到2025年,具备组合驾驶辅助功能(L2级)和有条件自动驾驶功能(L3级)汽车占新车生产比例超过70%,具备高度自动驾驶功能(L4级及以上)汽车在限定区域和特定场景实现商业化应用。
在2022世界智能网联汽车大会上,北京经开区相关负责人表示自动驾驶示范区开启3.0阶段将实现全域信号覆盖。
截至目前,北京经开区已经建成329个智能网联标准路口,双向750公里城市道路和10公里高速公路实现车路云一体化功能覆盖,并汇聚了产业相关领域百余家企业、国内顶级院校与研究机构参与示范区建设。
除此之外,还有像深圳、广州、长沙、成都、上海等全国多个城市都在积极推动自动(辅助)驾驶落地。一系列的举措,也都将推动辅助驾驶和自动驾驶加快落地。
8月28日,百度集团资深副总裁、智能驾驶事业群组总经理李震宇表示:"自动驾驶正成为智能汽车竞争的焦点,未来3-5年,将是全球汽车智能化竞争的关键窗口期,2030年没有自动驾驶能力的电动汽车将完全失去竞争力。"
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.