关于激光雷达的必要性,业内一直有着不同声音。
理想在成都车展上表示,激光雷达的作用非常像安全气囊,虽然没有它也能实现智驾,但视觉总有未见过的场景,激光雷达能对此起到安全兜底的作用。
理想高层刘杰的表态更明确——短期内不会放弃激光雷达。
至于另一边的马斯克则说到,激光雷达并非最佳选择,数字神经网络+摄像头组合使用的效果才是更好。
面对激光雷达的争议性,这尴尬处境能有破局吗?
说到智能驾驶,特斯拉是一个无法绕开的对象。
早在10年前,马斯克就从航空领域拿来了“Autopilot”(自动驾驶)一词,用在自身智驾系统身上,借此来宣告正式投身到智驾赛道。
当时,谷歌自动驾驶汽车项目选择了头顶激光雷达的方案,立心实现L4级自动驾驶能力。
反观当年特斯拉的体量,实际跟现时新势力品牌几无差异。
于是在成本控制能力和普及智驾目标都跟谷歌有着明显差异以后,马斯克毅然提出以摄像头为主的视觉路线来实现智能驾驶。
从事后总结来看,谷歌和特斯拉实际是两派技术路径代表,谷歌采取的是“Top-down”的自上而下路线,试图从一开始就干掉驾驶员的位置。
反之马斯克作为车企代表,“Bottom-up”自下而上的方案要更合适走量的量产车。
这大概就是特斯拉视觉路线的起源。
按照马斯克强调的第一性原理,既然人可以用双眼来开车,那么智能驾驶也应该只需摄像头也能完事。
因此在2021年的时候,特斯拉就宣布北美市场的Model 3和Y,不再配备毫米波雷达和超声波雷达,只标配摄像头。
如今,国产新款Model 3,也砍掉所有雷达。
日前马斯克再次表达了对视觉路线的看法,他认为激光雷达并非汽车的最佳选择,道路更适用于生物神经网络和眼睛,数字神经网络+摄像机组合使用的效果更好。
不过马斯克也直言,他并不讨厌激光雷达。
在此其中,马斯克提到的“数字神经网络”(transformer)是关键一环。
摄像头在各个领域已经使用很久了,但要说它在智驾领域真正起到作用,这还得归功于特斯拉技术路线上的创新。
2020年10月,特斯拉第一次向用户推送了FSD Beta测试版本,这是BEV+transformer路线开始证明自己实力的起点。
接着到了21年,国内大多数新势力纷纷转向同样技术路线的研究,其中目前国内领跑的蔚小理和华为,其实都采用了跟特斯拉一样的技术方案。
BEV+transformer,究竟有什么魔力?
首先来看,BEV的英文全称是bird’s eye view,中文译名是鸟瞰图,说得直白些是“上帝视角”。
BEV实际也不是刚冒出来的新鲜事物,此前没把它用在智驾层面,是因为它有着一个比较突出的弱点——适应场景能力很弱。
比如说在经过崎岖不平的路面时,当摄像头角度发生变化以后,导致输出效果出现了非常大的失真。
但BEV有个好处,就是能够把多路摄像头数据放在同一个模型里运行,省去更多后处理的人力。
这时候transformer就派上用场了。
transformer可以按照时间序列,给不同的特征和信息赋予权重,更好完成比对多路摄像头的特征,以达成一致的结果,借此实现更准确的感知识别效果。
你可以理解为,transformer是一个有资历的厨师,它可以在旁边辅助你怎么做菜,教导你如何根据不同菜品,来分配好不同比例的油盐酱醋茶,从而做出一道美味的菜品。
不过有了transformer,也不是说就能一了百了。
BEV本身的弱点还是很突出,它要先识别、再跟踪,如果有一个东西它不认识,它就无法识别出来,更谈不上会追踪它。
另外,BEV对远距离物体的探测,也不能做到十拿九稳,这看着很远的东西在高速场景下可能也就几秒钟事情,然而这可是人命关天。
于是业内又想出了一个解决办法——occupancy占用网络。
占用网络是对真实世界物体的一种3D描述方法,具体来说是“栅格化”。
相比于BEV需要先认识该物体,再来完成跟踪的做法,占用网络则是直接把物体给3D栅格化,也就是以一个个小方块的形式来投射到BEV空间,并不用去知道这个物体究竟是什么。
占用网络的到来,进一步让感知工作做得更准确了。
站在特斯拉角度,它认为在BEV+transformer+占用网络的底层技术支持下,有摄像头作为硬件组合就够了。
其中原因,还是因为人家做得早,数据积累得多,同时算法亦更加成熟。
根据此前特斯拉Q2财报披露,截至到今年6月,特斯拉FSD Beta累计行驶里程约合4.8亿公里,另外测试车队人数已经超过10万人。
事实上,数据积累得多只是最表层因素,在BEV方案下要想收集数据并不困难,关键是要有一套数据闭环体系。
这需要你有量产车的运行数据,在得到数据以后再去做清洗,以保留高质量的数据,接着再去实现自动化标注,让神经网络得到更好训练。
让系统变得更聪明,这不是一天两天的事,并且目前FSD Beta还只是在算力只有144TOPS的HW3.0硬件上运行。
结合日前马斯克试驾了世界首个端到端方案的FSD Beta V12版以后,从中再次彰显了特斯拉算法能力之强大。
正因如此,特斯拉不用激光雷达,确实是有它的厉害之处。
但激光雷达真是一无是处,纯粹是中国品牌为堆配置而生吗?
事实非也。
从感知能力而言,激光雷达和摄像头之间还是起到相互补充的作用。
一方面由于激光雷达的点云数据比较稀疏,稳定性不算强,那么作为底层建筑的数据出现问题的话,在此之上所构建的软件自然也更容易出错。
反之摄像头的数据量足够大,它采用了非常多像素去描述周围环境,因此整个稳定性是有着更高冗余度。
就此角度来说,马斯克极力推崇摄像头也不只是从成本出发,当中亦有对数据稳定度的考虑。
不过激光雷达的优势,在于它的测距能力和精度是摄像头所无法比拟的。
特别对于一些体积细小、非规则物体,激光雷达的点云还是能够对视觉探测起到补充作用。
正因如此,激光雷达可以说给系统起到安全兜底的作用。
事实上关于激光雷达“安全兜底”的定位,核心一点还取决于系统对极限场景的应对能力。
如果能像特斯拉那样视觉能力已经足够出色,那么不采用激光雷达也是可取的。
但如果系统本身能力上限一般,同时又要求在当下就达到业内领先水平,那么配备激光雷达这样的“高性能工具”,则是无可避免。
因此从本质来说,车企是根据自身能力和阶段任务目标去决定,该不该用激光雷达。
打个比方,特斯拉FSD已经是一个高中生,它要去迎接高考是顺理成章的事情。
但咱们多数中国车企可能还是初中生的水平,就想去跟特斯拉一起去参加高考,这难免是要多上点工具才行。
这也是为什么理想在成都车展表示,短期内不会放弃激光雷达的原因。
另外,此前吴新宙也说到,基于目前的技术能力,激光雷达在中国这种特别复杂的城市场景,还是起到了非常重要的作用,但这个作用未来能否由视觉完全取代,现在还太早去下定论。
“我们用激光雷达一直非常收敛,其中建图、定位、传感器和激光雷达都没有什么关系,但现在还不是特别确定,一定要或者不要。”
虽然头部玩家没有明确要放弃激光雷达,但耐不住激光雷达最大的弊端——“贵”。
上汽集团副总裁祖似杰说到,“我认为不要去放弃激光雷达,但现在的问题是激光雷达太贵,如果它只卖100美元,那我就全配。”
“我跟华为海思聊激光雷达,他们的观点跟我蛮重合,他们认为激光雷达的成本不低下来,就是死路一条。”
面对贵的东西,大家都乐意去找替代品。
尽管之前特斯拉高呼要走纯视觉路线,但大概是发现自己走过头了,后面在HW4.0硬件里,又偷偷报备上4D毫米波雷达。
和普通毫米波雷达相比,4D毫米波雷达可以测出高度数据,分辨率也更高,同时还能像激光雷达一样生成点云。
尽管在能力上较难比肩激光雷达,但4D毫米波雷达胜在便宜,相比于激光雷达高达几千元的成本,4D毫米波雷达只有前者售价的20%左右。
就此角度来说,4D毫米波雷达在一定程度上会是激光雷达很好的替代品。
不久前上汽集团就宣布,飞凡R7将搭载国内首批量产的4D毫米波雷达,此举或将引领4D毫米波雷达的普及。
这样看来,未来激光雷达大概率只会在高价车型上才会搭载。
事实上,参照作为旗舰车型问界M9只搭载1颗激光雷达的做法,这比起阿维塔11标配3颗激光雷达的奢侈搭配,已然是要收敛许多。
可以预见,持续降低激光雷达的作用权重,乃至是放弃,还是大概率的选择。
要想实现高阶智驾,激光雷达不能说是100%的必需品,但它会是一定时间内多数玩家的选择。
一方面是受自身软件能力限制,另一方面是想更快追赶头部玩家的步伐,那么这中间所要付出的代价,自然是售价高昂的激光雷达。
不过激光雷达的成本曲线也在往下走,结合国内向来突出的产业降本能力,未来激光雷达有没有可能降本至让更多车企接受的范围,咱们边走边看了。