2022 年,我们是如何思智能驾驶的?
2022 年智能驾驶逐步从单一功能向上演进。智能驾驶就像一颗树,树根象征着平台的成长,而树干则象征着能量的流动。
而当我们回顾 2021 年到 2022 年,这个阶段智能驾驶也发生了几件具备“划时代”意义的事情,包括大算力芯片的正式交付、激光雷达厂商单月销量过万、城市领航辅助驾驶的落地等等。
反映在做智能驾驶的相关评测中我们也有了较大的优化,例如过去我们只是对单一功能的通过性做评价,只划分了「通过」或「不通过」两个标准,而在新评测标准中我们也首次提出了智能驾驶 「GAMP」 评测标准,而不是「总分制」。
为了能让大家更为直观的看到我们每个项目的结果,我们会在每个测试项目中做评级,在最后成文时也思考着如何以更宏观、体系化的评测方向以及用户更容易理解的角度做相关总结。( 详情可见:写在「大横评」前|为什么我们在 2022 年还在谈论 LCC? )
那 2022 年我们是如何思考智能驾驶的?我们也从今年的「智能驾驶有哪些新发展方向」、「智能驾驶好不好用,我们是如何评价的?」以及「新格局下,有哪些新的技术亮点?」三个维度出发展开思考。
一、2022年,智能驾驶有哪些新发展方向?
今年智能驾驶的热度都来得比往年更加猛烈,除了智能驾驶硬件的量产,功能化的体验也重新点燃了用户同学们的热情。今年智能驾驶的主要功能热点也覆盖了「 LCC 边界能力的扩大」、「城市领航辅助驾驶的落地」以及「系统安全底线」等。
1、LCC 边界能力在扩大
LCC 过去是被大家认定为一个基础以及入门级功能,而在目前 LCC 逐步成为一个较大的热门话题。
例如小鹏提出的 LCC-L ( LCC 增强版)、理想与蔚来新技术架构下的 LKA、 LCC 等,还有例如后起的阿维塔、飞凡、智己以及摩卡等车型,也基于大算力芯片对基础算法架构做了升级,并且大部分车企选择大算力芯片下的 LCC 架构都是与未来高阶的城市领航辅助驾驶甚至是 L4 平台是同源的。
其中最为激进的是小鹏,小鹏用了一款量产车型 G9 以零改装的形式布局了 Robotaxi 车队,这也就意味着其考虑了智能驾驶的数据、硬件成本、算法框架以及商业模式的闭环,这也会在下面的篇章为大家展开。
那 LCC 边界范围到底扩大了哪些?
首先交互能力更为多样化。
有了高通 8155 车机芯片、激光雷达以及 BEV 等新算法的支持,不同车企在 SR 界面交互上也更为丰富。
例如理想 L9 、飞凡 R7 等车型直接把实时渲染的动态环境以鸟瞰视角的方式放入交互界面里,同时也结合 W-HUD、AR-HUD 等智能驾驶画面结合,让智能驾驶的交互更具丰富性。
而例如小鹏 G9、集度 ROBO-01 也是把 3D 交互的理念也“搬”到了智能驾驶的地图等车机交互上。
第二直观的是功能边界的扩大。
LCC 的通过边界相比以往有较大的变化,而这种变化并不单是为了提高某些单一场景的通过能力,而是从处理策略上升级。
例如在 LCC 防加塞以及跟车上有不同思路,部分车企会选择较强的跟车策略,而部分车型会有与加塞车辆尝试做博弈,而部分车型会开始思考轻打方向盘避让等等。
而例如在大曲率弯道上部分车型只有通过与退出两个指标,而如今系统开始有了新的变化,在单一的“IF Eles”解决思路上加入了更多通过策略,例如特斯拉 Model 3、小鹏 P5 、理想 L9 等车型能够实现弯道内减速、调整方向盘等结合规控能力提高大曲率弯道的通过性。
而例如极氪 001 通过弯道能力并不强,但在系统退出前会在弯道中有足够的时间提醒驾驶者接管,而不是选择“逞强”后直接退出或者直接偏离行驶轨迹。
例如在识别障碍物时,过去的策略为仅做检测或者直接漏检,而例如小鹏 P5 、极氪 001、极狐阿尔法 S 华为 HI 版以及智己 L7 等都具备一定横向绕行能力,在确保通过能力的同时,通过效率也会有所提高。
LCC 的安全交互上也在拓展。
LCC 是一个与主动安全捆绑的智能系统,例如安全交互的提醒也更为多元化,在基础场景上,目前大部分车型在遇到有加塞车辆、静止车辆、施工路段、前方路口变化等也有了语音、文字或者震动提醒,也给驾驶者起到安全提醒作用。
而在系统进出策略上,需要提醒接管或者退出时有明显提醒行为,甚至在即将触发系统边界的场景时,会伴有蜂鸣等语音等提醒,我们也认为是至关重要的,而不是到了已经触发系统边界就直接退出,没有给驾驶者安全接管时间。
而部分车型“默不作声”或者“默默退出”的交互方式会给大部分新手用户带来冷汗指数。除了交互安全,例如高速上横向避让大货车,深蓝 SL03 、智己 L7 等车型则在基础 LCC 上就做了大货车横向避让,系统交互也较为好评。
在更为进阶的 LCC 功能上,我们也留意到例如 Model 3 以及小鹏 P5 等车型上即使系统本身无法通过或者无法通过的场景,系统会把车辆的速度降至安全速度再触发系统退出,交由驾驶者接管,这也是更高阶 LCC 系统安全交互的能力边界。
伴随着智能驾驶功能的迭代,安全的交互能力也成为当下一个重要的课题。
2、城市成为智能驾驶重点
除了 LCC 外,把智能驾驶带入城市是今年智能驾驶的一大热题。
除了特斯拉,国内选手包括小鹏、理想、毫末、飞凡、阿维塔以及极狐等车型都宣布进军城市领航辅助驾驶。
另一梯队的 Robotaxi 车队的运营商也逐步“看中”城市板块,试图把技术下放到城区领航辅助驾驶,提供了一整套可量产的前装解决方案。
相比高速场景,城市领航辅助驾驶没有高速公路建设那么完善,城市道路错综复杂,交通参与者众多,参与者的行为也常常不可预测,这也给感知系统、规划与控制系统以及预测带来压力。
而也正是因为城区的“难”,也吸引了更多车企参与到系统的研发上。
首先城市场景作为大部分用户开车时高频场景,城市也是真正实现点到点全场景智能驾驶的核心部分,无论从用户日常行驶里程中城市占比、开车所消耗的时长以及系统开发的难度看,城市都具有更高的开发价值。
城市所带来的场景非常多样丰富,更利于系统的标注、训练,同时它的能力能够反哺到基础 LCC 或者是高速领航辅助驾驶等场景里。
城区更像是不断被训练的大学生,而当它具备一定的理解能力时,它的能力能够下放到小学能力的基础 LCC 或者高速领航辅助驾驶等能力上,也是实现全场景高阶智能驾驶的基础。
3、AEB 安全底线越发重要
上面和大家提到,其实 LCC 的研发与 AEB 策略上有很大共性,同在 LCC 使用下,AEB 也逐步作为智能驾驶系统的安全“底线”。
安全作为智能驾驶系统的前提,但不同车企对于 AEB 算法有不同的诠释,部分人认为 AEB 只是作为入门级安全功能,高度依赖供应商,而部分人认为真正做好 AEB 可能比实现 L4 智能驾驶更难。
而今年开始有多例系统无法识别静止物体、横置障碍物等场景,产生严重碰撞事故造成伤亡,也有部分场景是由于驾驶者驾驶疲劳或者夜间没有集中注意力产生碰撞事故,主动安全也开始被大家所重视。
AEB 自研也伴随着智能驾驶的发展同步演进,也成为今年车企较热的名词,包括蔚来、小鹏以及理想等都公开自研 AEB 计划。
李想也提出:建议把 AEB 作为车辆的标配,同时他在随后的发布会上补充了将对外开源 AEB 系统代码。
AEB 作为一个全天候全场景的功能,实际上功能门槛更高,难度会更大。
难点在于过去 AEB 的研发较为封闭,也是基于“黑盒”为主,供应商也较为强势,从研发层上很难进行调优,特别是基于国内本土场景的优化上。另一个难点在于技术封闭,技术难点也“垄断”在小部分人手里,而 AEB 难点除了能够精准提早触发,同时也需要避免误触发,这需要系统有大量的实测数据,对系统触发进行优化,以此降低其误触发的频率。
在研发上车企也逐步选择在毫米波的基础上融入视觉、激光雷达等传感器,例如识别夜间静止物体、行人、外卖小哥以及异形物体的识别能力会更高。
而例如理想在量产车型上引入“影子模式”的 AEB 研发模式,也大大提高了研发效率以及安全验证。
“影子模式”能够在用户实际场景中,利用“影子”来模拟系统的运行状态,结果不会反映到驾驶车辆上,而是会输送到云端,供研发团队进行优化以及验证,直到系统完成大范围验证再进行推送,而在系统后期的迭代上,也一改过去供应商方案的反应慢、更新迟的问题,更多问题可以在闭环的研发中解决,优化效率更高。
4、基础地图+高阶能力 LCC 或成为主流
相比去年,今年大家进军城市后,对高精地图的“青睐”明显下降,相比高速高精地图,城市高精地图受限于严格的法律法规。
另外如果城市中单纯依赖高精地图会出现地图“断层”的情况,它就像一个具有先验信息的传感器,不断的给系统传输数据,但它会时而不准,而系统却不知道它什么时候会不准。此外城市级的地图在构建成本上比高速级更高,同时更新频率、维度成本也会更高,需要确保地图鲜度。
为了确保城市领航辅助驾驶功能的连续性,今年部分车企提出了重感知、轻地图的路线,包括采用拓扑地图以及众包地图,逐步降低对高精地图的依赖,而部分车企则提出了“降级”的思路,在高精地图缺失时依赖高级别的 LCC 能力自行通过等等。
除了小鹏、毫末以及华为代表外,我们也留意到了其他车企也在关注轻地图的路线,会选择基于基础地图加上高阶 LCC 的形式,来完成自动超车、变道以及拐弯等智能驾驶的能力。
二、智能驾驶好不好用,我们是如何评价的?
以用户体验为核心,我们针对“好不好用”的评测上划分了四个类别,安全、舒适、可以范围以及效率四大指标,结合 GAMP 四大评测标准,成为今年新出行的 LCC 横评标准。
第一是安全性。安全类主要覆盖主动安全、交互安全以及功能安全。这里大部分内容也在上面的篇章中做了阐述。
第二是舒适性。舒适性指标依旧对于 L2 级智能驾驶是一个不小的挑战,而部分系统为了追求功能的通过性而牺牲了用户体验。
功能的舒适性伴随着系统的迭代也逐步上升为一个系统化能力。相比高速场景中需要在高速场景下对远距离物体检测不同,城区中我们需要应对常规的近距离加塞、堵车时不断跟停前车或者通过路口时与车辆博弈等场景,上到感知精度、算法的低延迟性、预测精准度甚至下到底盘刹车控制、电机系统控制等都有很强的关联性,系统解决策略也更为复杂。
第三是效率。效率与安全、舒适度是作为同一个维度指标,不存在优先级。如果一个系统为了安全、舒适为前提,却牺牲了效率,也不是一个好用的辅助驾驶系统。例如因为策略保守被经常被加塞,为了安全策略都采取刹车避让的形式,还有我们在某车型高速 LCC 体验中,为了提高弯道通过率在弯道中做了较大范围的制动,它们依旧也不是一套好用的系统。
另外我们也看到很多车型在解决效率上有很多思路,例如识别占道车辆、静止车辆或者车道收窄时会选择主动绕行,而不是选择刹车等待或者退出。应对城市场景中,系统在遇到加塞车辆、汇入匝道或者通过十字路口时,我们常常需要与周围车辆进行博弈,如果通过模拟人为驾驶策略来提高通过效率也成为系统好用的一大前提。
第四是使用范围。相较于高速或者城市领航辅助驾驶,LCC 的使用范围会更大,所以在评测系统中我们并不只是局限在场地的常规测试以及边界测试,还覆盖了国道、高速等场景,也验证了 LCC 在不同环境下的表现,包括高速或者低速下时的易用性、居中性、加减速舒适性、连续性体验以及安全性等。
基于安全、舒适、效率以及使用范围四大指标,我们也逐步看到系统的能力边界,从一个能用的系统到好用的系统转变。
而为什么我们不设置“总分制”呢?这是因为我们认为设置的每个测试内容分类都是各自独立的,所以无法设置权重,一旦偏袒就会有不公平的情况,也失去我们测评的意义。
我们在实际的应用中发现,“边界”能力强的系统不一定好用,看似“基础”能力差的系统并不一是所有表现都是倒数第一,甚至还有“逆袭”的情况。所以基于安全、舒适、可用范围以及效率四大指标,我们提出了 GAMP 评测标准,成为今年新出行新的横评标准。
新出行 GAMP 大横评文章:
什么是好用的 LCC|8 款车型 LCC 辅助驾驶大横评·第一季
什么是好用的 LCC|5 款车型 LCC 辅助驾驶大横评·第二季
新出行 GAMP 大横评视频:
智驾报告| 谁才是最好用的 LCC ?8 车 LCC 期末考成绩出炉!第一季
智驾报告|谁才是最好用的 LCC ?5 车 LCC 期末考试成绩出炉!第二季
三、新格局下有哪些新的技术热点?
1、数据驱动取代手写代码
过去基于手写规则代码的时代,程序员通过分析理解问题后再以代码的形式进行编程,最后再将代码做测试、运营,所以在规则代码时代程序员需要把问题定义、把问题拆解成多个步骤、再以代码的形式解决。
而在软件 2.0 时代,解决问题思路却有很大的不同。
在软件 1.0 阶段,更多是以 if-then-else 等循环逻辑展开,也就是程序员需要先知道问题是什么、再逐步罗列解决问题的方式。
例如在辅助驾驶的手动打灯变道中,当我们拨动右转变道指令时,如果此时隔壁车道有车辆经过,系统退出变道,也就是一个机械化执行指令,而程序员可以设置多条 if 指令,来满足打灯变道的指令需求。
伴随着大算力芯片、传感器的升级,软件也自然而然迭代到 2.0 时代。
在设计一个软件前程序员并不知道问题的具体答案,只能过将问题做分类,利用模型训练来给问题提供答案,这里有个重要变化是问题的答案不再依赖规则,而是依赖数据对模型的训练,让模型逐步“成长”,让其具备有“理解”能力,而不是程序手写的“规则”能力。
可以看到软件 2.0 解决问题的周期相比 1.0 的规则时代更慢,但它却有很大的成长空间,也从底层问题的解决思路上有更大的创新,也带来更多的想象空间。
2、大模型时代的到来
那软件 2.0 时代是如何践行在当前的智能驾驶中呢?
我们试想自动驾驶有没有可能依赖一个像人类一样的“大脑”来解决行驶中的复杂问题?
过去不同类型的任务所使用的 AI 模型是完全不同的,各有各的建模方式,并不统一,不同的“小脑”负责不同的板块,早期的模型也如同我们常见的“流水线”办公,每一个问题都有独立的部门解决。例如识别车辆、车道线以及雪糕筒等都是单独的模型解决一个独立的任务,但它的本质还是无法摆脱有人为监督的训练方式。
而大模型的出现就像一个“大脑”,也就是把流水线的线式结构更改为环式的闭环结构,模型是处于一个闭环的训练模式上,不断优化成长。
例如较为火热的 Attention 大模型中,先利用大量的数据对模型做预训练,随后再根据实际的任务用监督的数据来对模型进行微调,直至它成为一个有独立判断力的“大脑”。
模型一开始就像是一个学生,在预训练中有一个导师带领构建它的知识库。随后在步入社会实践中有了真正复杂、多样的经验加以修正,让其不断成长,最后成为一个摆脱导师并且能够独立学习、优化的优秀人才。
所以大模型具备三个特点:
大模型遇强则强。如果有一个监督方式(类似导师角色),那它的能力会越来越高;
依赖数据的随机性和多样性。在开放式的环境中智能驾驶所面临的数据复杂多样,更具备训练价值,而数据才是真正让大模型逐步取代规则模型的关键;
最后是自我评价体系,也就是懂得独立学习。相比规则模型,大模型的一大变化是场景能够被理解。例如传感器输入进来的信息就像一个个词组,但系统推理就是要先分类,然后找到词与词之间的管联系,从而组成一个句子,这也就是我们常常提及的特征提取,系统懂得如何找到找到词组,让它们产生联系。
3、视觉算法迭代,依旧引领智能驾驶的技术方向
大模型的“热”其实也反映了一大现实问题,视觉算法依旧成为智能驾驶中最关键的部分。软件的发展从规则演进到数据驱动,市场逐步确定了视觉的重要性,而在感知算法上,目前大部分车企都选择跟进特斯拉的算法的迭代的方式,所以我们也以特斯拉为例。
在传统多模型框架下也就是我们提及的多相机、单帧方案,各个摄像头各自为营,各任务通过单独模型分别处理,例如车辆识别、车道线识别以及跟踪算法等,随后再通过前融合或后融合的方式将不同网络的感知结果融合在一起输出给下游。
多任务模型就像多条“流水线”工人一起工作,也就是基于不同传感器的结果或者不同摄像头的数据融合在一起,最后由一个独立的部门来汇总不同流水线的输出结果,这种基于规则的方法无法学习,同时也不具备泛化能力。不同部门之间信息无法共享,也就是不同摄像头之间会做重复做特征提取工作,也无法将特征共享,另外流水线的工作方式容易把上游的差错累计带到下游,让感知性能降低。
而在第二阶段也就是我们提及的大模型,也就以一个大模型来取代多模型,同时让各模型的主干网络部分可以共用,这样可以避免大量重复计算,也无需再对不同任务开发不同的网络模型。
其中特斯拉 BEV 算法取消多路摄像头各自为营的做法,把多路摄像头先一起融合后再输出一个鸟瞰视角,由一个主干来主导多个任务,除了能够共享特征信息、避免重复计算外,能将感知、预测等都是在同一个空间下完成,也简化了算法框架同时也避免了误差累计。
而 BEV 带来的另一个好处是时序融合,也就是知道目标物的“前后联系”。例如我们可以每隔一段时间将缓存的信息发回,以此来推断物体是怎么运动的、周围环境在一定时间里发生哪些变化。
而在今年特斯拉提出了一种的检测方法,也就是 Occupancy Networks,占用网络算法。
占用网络一听难以理解,实际上它的意义非常简单,我们知道 BEV 算法是通过对多帧摄像头做融合后进行检测,而 Occupancy Networks 是在三维空间力寻找哪些空间是空闲状态,哪些是被占用状态,通过“小方格”来表达物体占据的体积是多少。
所以实际上 Occupancy Networks 并不是一种对 BEV 算法的推翻,反而是一种正向“延续”。
它的好处是将 BEV 算法从「二维空间」升级到「三维空间」的鸟瞰图。Occupancy Networks 是在 BEV 二维图像空间的基础上加入高度维度,使其真正形成一个三维空间,它的变化就像我们平时用的平面设计升级为 3D 建模。所以视觉算法的发展也正式从最开始的单帧图像检测到连续帧图像检测到现如今的 3D 体素化检测。
另外是「检测逻辑的改变」。相比过去我们通过矩形框来表达检测目标,Occupancy 是通过“堆方盒子”的概念来表达出检测的物体,就像一个可以无限伸展的魔方,所以不在乎它所检测的对象是什么,也不需要依赖训练。而 BEV 检测需要依赖人工标注训练分割的任务检测,一些不规则障碍物难以识别。
例如一台 SUV 拖挂了一台房车、吊车凸出的液压支腿盘、占道车辆打开的车门等常常会被漏检,但这些均能被 Occupancy 检测所识别。
最后是 Occupancy 的「检测效率」,对于基于纯视觉方案甚至摆脱毫米波、超声波雷达的特斯拉而言,Occupancy 检测除了能够凭借视觉算法获得 3D 几何信息以外,也融合进了视觉语义信息,并且还融入了速度、加速度以及运动方向感知多个维度,不需要再让多传感器同空间、同时间做对齐,另外据特斯拉提供的数据,Occupancy 的识别效率仅为 10 毫秒,具备较强的低延迟性。
可以看到视觉算法的演进也从真实场景中获得灵感,例如日常生活中视觉检测不连续、多种障碍物难以统一训练、可通行空间识别或者是被遮挡物体检测等难题,伴随着算法的升级也逐步被迭代。
Occupancy Network 加入高度信息后其带来的想象空间也是庞大的,当然 Occupancy Network 也不应该被过渡神化,它是目前激光雷达等多种路线下的一种新思路,而不是通往自动驾驶的唯一路径,但不可否认其具备很大的想象力,Occupancy Network 未来的表达方式也可以是多样,并不一定是我们目前仅看到的“小方块”体素表达。
可以看到视觉算法的迭代依旧引领着目前智能驾驶的方向,例如部分车企在考虑智能驾驶时在前期会投入研发,再思考性能最后考虑效率以及成本,特别是目前大家敏感度较高的高精地图覆盖难度大的问题,思考着基于重感知、轻依赖甚至不依赖高精地图的路线,避免强捆绑,而在芯片自研等问题上,则是围绕基于从软件中来,到硬件中去的原则,通过软件需求来反向设计好硬件,从而达到效率、成本以及性能的最优化。
基于视觉算法只是感知算法中的一部分,感知算法也只是智能驾驶全链路中的一部分,规划算法、建图方式等都在不断迭代,智能驾驶的发展从“软件上”也逐步上演了一场“百花齐放”的大演进,也逐步成为市场具备核心竞争力的重要基础。
4、激光雷达的「冰」与「火」
除了感知算法的狂欢,今年开始硬件的代表们显然也不是“吃素”的。作为与特斯拉“对抗路”的激光雷达,今年也是进入新一轮如火如荼的“卷时代”。
首先小鹏 P5 成为国内首个前装量产的车型后,也首秀了一把城市 NGP ,理想 L9 的发布会上也采用激光雷达在夜间高速下识别不规则障碍物,让大家看到了激光雷达的使用范围。理想 L9/L8、蔚来 ET7/ET5/ES7 、小鹏 G9 、极狐阿尔法 S 华为 HI 版、飞凡 R7 等激光雷达车型也逐步完成量产交付。
目前看激光雷达虽然存在不同技术路线竞争,但目前都都往集成化、轻量化以及低成本方向演进,而今年较大热点话题是在主激光雷达基础上,新增了用于补盲的固态激光雷达,以此在以一个较低成本的形式形成 360 度大视场角覆盖,也是今年一大方向。
所以在讨论激光雷达中,我们试图围绕上面几个话题展开,包括大家常提及的固态激光雷达是否是真固态?波长越长是否意味着激光雷达性能越好?当下哪个激光雷达的技术路线是最好?主雷达+补盲雷达如何组合?等等。
第一:目前激光雷达厂商提的固态激光雷达是否是真固态?
激光雷达如果按照结构件划分可以分为发射模块、接受模块、扫描模块以及数字处理模块,目前大家讨论的固态或者非固态实则讨论的是激光雷达的扫描模块。
其中发射和接收模块也就是通过发射红外脉冲光,在光到达物体表面后会反射回部分光束,接收器接收并记录,由此计算出和物体的距离,这种方法也被称为飞行时间法 TOF。而扫描模块就像一个“镜子”不断调整光束的方向,通过旋转等方式来覆盖整个视场角范围。
目前市场上固态激光雷达的概念实则上不是真正意义上的激光雷达,而是混合固态激光雷达,大家都没有完全去机械化,扫描方式还有机械部件。
第二:那目前有哪些技术方案路线代表?是否存在一个最佳路线方案?
可以看到激光雷达主要围绕成本、性能以及可靠性三大指标,而不同阶段对于这三个指标的需求不同。
例如在 Robotaxi 等无人车上,激光雷达指标还是以性能优先,Robotaxi 车队相对需求量小、对价格敏感度低同时也不需要车规级的需求。而乘用车对激光雷达考量的维度更为复杂,成本问题成为敏感的因素,同时需要兼顾性能、车规级可靠性、激光雷达算法的易用性以及可持续迭代性等作为指标。
而从技术方向上看,目前国内激光雷达技术路线之争,基本上是围绕转镜式与 MEMS 两种技术路线为主,虽然大家默认同固态激光雷达是未来,但较长的发展时间里混合固态激光雷达会占据优势。
而混合固态激光雷达各个技术路线也有优劣,例如部分技术兼顾长距离或者超长距离、部分兼顾成本与性能等,它们就像对应目前摄像头就像长焦、广角以及鱼眼镜头,所以多种技术的依旧存在会持续较长的时间,目前还远远未到技术收敛的时候。
目前蔚来、小鹏、理想以及华为等所搭载的激光雷达在目前市场中也具代表性,我们也以目前比较主流的应用激光雷达车型作为代表,看看不同技术路线的对比:
一维转镜方案的有包括华为(阿维塔 11 首发)、禾赛(理想 L9 首发),一维转镜是采用了激光发射器+反射镜的组合,反射镜以一个维度也就是横轴方向不断旋转,而发射器负责发射激光激光,激光打在旋转的反射镜后可以改变发射器的发射方向以及提高视场角范围。
例如禾赛 AT128 就是在放置了 128 个激光器,但把过去通过堆叠激光器的方式用芯片化做了集成,集成度高,未来也可以通过芯片化摩尔定律来降低成本,但在稳定性以及光源功率上要求较高。
而第二个技术代表是二维转镜,二维转镜方案的有 Luminar(飞凡 R7 首发)、图达通(蔚来 ET7 首发),相比一维转镜多了一个转镜,一个棱镜负责高速的横向旋转,另一个棱镜可以较低速度负责纵向翻转,激光器可以仅用一束激光就能实现横纵双向扫描。
可以看到相比 AT128 需要 128 个激光器发射的点光源不同,二维转镜采用的是线光源,也就是单凭一条线就能实现多线扫描的效果,所以非常直接的优势是通道数量少,但二维需要利用高频机械扫描才能满足多线激光雷达扫描的优势,所以对于机械结构件可靠性有较高的需求。
最后一大主流路线就是 MEMS 微振镜方案,目前代表的有速腾聚创(小鹏 G9 首发),微振镜顾名思义就是一个“被架起来”的镜子,同时悬臂梁(架子)围绕横向和纵向两个维度让“镜子”做周期运动,也以此能调整激光雷达的发射方向,完成扫描。
微振镜的优势也非常明显,可以大幅降低成本、尺寸小同时也有较低功耗的优势,另外和二维转镜类似用创新的扫描结构来取代过去的多通道,只利用一组或者少数激光器就能实现等效线束的效果。
当然微振镜的测距能力和微振镜这面“镜子”的尺寸有很大关系,首先微振镜摆动的幅度相比棱镜更小,所以视场角覆盖比较小,另外微振镜如果尺寸过小会导致测距能力过弱,但尺寸过大也会因为架起“镜子”的悬臂梁耐久性不高。而例如速腾 M1 激光雷达采用的方案是拼接四台微振镜形成一个“大”微振镜,以提高视场角的覆盖范围,最终也达到 120 度的水平覆盖视角。
可以看到激光雷达竞争中技术路线较为多样,同时会共存一段时间,但对激光雷达未来的竞争上,势必是需要有更低的成本以此实现更高的性能、满足高效迭代的效率,而这些都集中到三个核心要点:
- 通过芯片化来降低成本,来构建自己的技术壁垒形成优势;
- 利用服务将软硬件结合更贴近客户;
- 规模化的制造能力,以此来巩固产品的质量需求。
第三:905nm 和 1550nm 之争,波长是否越长越好?
905nm 和 1550nm 之争也是今年较热话题,是否波长越高激光雷达的性能会越高呢?
实际上并不是,每一种波长代表的激光雷达实际上都有各自的特性,除了大家常提到的对人眼安全,还与激光雷达的探测、功耗、抗干扰性、光源亮度等特性相关。
首先 1550nm 的功率更高,所以它的探测距离会更远,这个是不争的事实,另外 1550nm 激光器对远处细小物体的识别能力更高。例如图达通目前实现 @10% 反射率下探测距离为250米,同时在探测 100 米处的行人时,可以接收到横排 4 个点,纵排 7 个点的脉冲,可以较为清晰探测到行人的姿态。也就是对远处行人不是仅仅识别成一个“点”,而是一个结构化可用的“点云”。
另外是抗干扰能力强,1550nm 作为光纤激光器,光源亮度较高。在日常中,如果我们逆光行驶时强烈的太阳光照射会对激光雷达产生干扰,点云中出现明显噪点,而 1550nm 在光源亮度上相比 905nm 更高,所以抗干扰能力会更高。而 905nm 则需要采取不同的处理策略或者光学设计,以此来区分环境光和激光雷达的发射光。
但目前 1550nm 功耗过高依旧是未解的难题。上面我们提到 1550nm 功率高,可以带来更高的探测距离,但会带来散热的难题。这是因为 1550nm 接收器的灵敏度比较低,为了实现比较长的探测距离以及高的分辨率,也只能让发射端用更高的功率。另外 1550nm 的“探测效率”实际上并没有 905nm 高,也就是说在同等功率下,1550nm 的探测距离相比 905nm 会更弱。
可以看到在飞行时间法 TOF 激光雷达下, 1550nm 激光器功率更高,在探测距离、对远距离细小物体等的检测上存在较大优势,但其依旧面对着散热等难题。
而 905nm 激光器的功率会受到人眼安全的限制,所以在功耗抑制上更优,但在远距离探测以及对远距离小信号回波检测能力有限,目前 905nm 也在通过提高探测效率来提高探测性能,但提升空间大。
另外大家比较关注的是产业规模,目前 905nm 相关器件市场规模较为成熟,而 1550nm 也在不断扩展产业链。目前各个激光雷达厂商时机都有不同激光器的技术储备,而不同波长的激光雷达也具备不同的特性,所以目前依旧很难判断哪种激光器会被取代。
第四:全固态补盲激光雷达成下一个热点
除了位于前向的主激光雷达外,用于车身周边环境感知的全固态补盲激光雷达也成为今年激光雷达市场的一大热点,包括速腾聚创 E1 、禾赛 FT120 以及亮道智能 LDSatellite™ 等。
由于 Flash 技术的特性,其在大垂直视场角、探测近距的场景上会有一个理想的落地空间,所以它和目前小垂直视场角、探测距离远的混合固态激光雷达成为天然的组合关系。
而全固态补盲激光雷达将会达到真正纯固态的理念,也就是没有任何机械结构,激光发射以及接收完全由芯片化完成,同时也因为没有了传统的机械部件,让其在尺寸、性能以及可靠性上有较大的优势,在安装上可以灵活安装在翼子板、后保险杆等位置。
由于补盲激光雷达的垂直视场角大,所以它能检测到位于车辆周围的盲区物体,拥有一个更好的视野。例如速腾聚创 E1 的垂直 FoV为 90°的数据,可以近距离看到 3 米外轿车以及 5 米外的成年人全貌。而如果垂直角度不够或者直接利用目前主流的混合固态激光雷达,会对近距离低矮的物体存在漏检,例如在泊车、城市中路口、加塞、路沿等对障碍物、行人或者车辆的识别。
最后是关于固态激光雷达的成本,禾赛曾对外提到 FT120 价格会比主激光雷达 AT128 的价格更低,而速腾更是提到两颗 E1 的价格相比 M1 的价格更低。
可以预见到未来的车型将会更加青睐于主激光雷达+纯固态补盲激光雷达方案,用较低的成本实现覆盖率更高的感知方案,而目前全固态方案的优势也正是基于芯片化、集成化的技术思维,可以看到各家激光雷达厂商在以往的技术储备。
相比较国内激光雷达的崛起,海外的激光雷达厂商却呈现不同的发展态势,呈现冰与火两极分化局面,海外激光雷达厂商 Velodyne 和 Ouester 宣布合并、Ibeo也没等来量产,等来了破产,而Quanergy 也已退市,而反观国内市场的需求热度一直在不断上涨,同时在制造以及供应链上有较大的优势,拿下竞争的入场券也已经明朗。
5、跨越 L4 与 L2 的鸿沟?
除了今年热议的算法、硬件等的迭代,今年另一技术热点则是聚焦在了 Robotaxi 上。
相较于过去乘用车市场与 L4 级的 Robotaxi 车队“分裂”的关系,如今两者也逐步趋向融合与互补的存在,这也是今年一大热点。
例如小鹏以一台零改装的乘用车 G9 作为城市自动驾驶道路测试车辆,仅在软件层面做了升级优化,也宣布小鹏正式进军 Robotaxi 的商业化运营。
而另一端我们也看到了 L4 自动驾驶公司的尝试,例如集度汽车是直接继承百度 Apollo 的自动驾驶软件技术,通过重新的集成、车规验证后,集度再把百度上的 Robotaxi 上的硬件能力做“轻”,例如“轻”传感器以及“轻”算力,符合集度汽车作为乘用车的定位,最后将其适配到量产车中。
根据集度汽车的计划,希望在法律法规范围内把一些现在只能在 Robotaxi 上体验到的高阶自动驾驶功能提供给量产车用户,并且不是在交付很长时间之后再通过 OTA 实现。
而另一个代表则是 Robotaxi 代表队轻舟智航,但它不是宣布造车,而是为车企提供整套解决方案,包括提供基础的高速领航辅助驾驶以及城市领航辅助驾驶解决方案。
轻舟智航和百度的方案上基本同理,也就是利用底层的 L4 架构融合用户量产车的感知方案,通过整合 L4 技术反哺到 L2 级城市领航辅助驾驶,并且可以根据客户需求灵活配置传感器方案,其主打的是通过一颗激光雷达可以实现城市领航辅助驾驶。
1、那 L4 公司与 L2 量产车企之间为什么会从分道扬镳的策略走向目前的“殊途同归”呢?
首先是商业化模式。从 L2 级的基础 ADAS 步入 L4 级 Robotaxi ,实际上小鹏的核心目的是为了向城市领航辅助驾驶过渡,因为在城市领航需要处理的问题其实与 L4 级面临的问题类似。
而 L4 公司想要分一杯羹,在距离 L4 还有一定时间下 L4 也在探索其他落地的可能,例如城区复杂的交通参与者、博弈场景以及规控算法呢,L4 公司都有技术降维的优势。
第二硬件的升级提供了基础。可以看到今年包括英伟达 Orin 、地平线征程 5 等大算力芯片完成前装量产,包括 800 万像素摄像头、激光雷达等传感器也开始量产上车,这也给 L2 或者 L4 测试车提供一个并行的硬件基础。
最后是软件框架。L4 公司最核心的竞争力在于数据思维以及数据闭环的思考,相比较于早期的 ACC/LCC 等理念,L4 从初始就是迈向无人化,所以 L4 的技术架构是中心化,就是一套算法服务全场景。
所以 L4 对数据运营的考量从一开始就具优势。例如 Momenta 提出的「飞轮」、轻舟智航的「双擎」策略,就是将公开道路的 L4 作为技术架构, 用 L2 级乘用车带来的数据流反哺到 L4 ,让算法越来越“聪明”,所以 L4 公司看中的解决了数据源的同时,也以较低的成本“消化”海量的长尾场景,到最终完成 L4 的规模化商业运营。
而到这里我们也就更能理解为什么 L2 级的主机厂也开始投奔于 L4 。在过去 L2 级基础辅助驾驶 ACC/LCC/AEB/高速 NoA 等场景可能是划分多个供应商,部分车企更是选择了部分功能做自研,所以实际上是去中心化的技术架构,而例如特斯拉、小鹏、蔚来、理想、飞凡、智己等车型也开始思考基于 L4 的中心化架构来构建智能驾驶,也就是基于同一套架构服务基础 LCC 、泊车、高速以及城区的全场景智能驾驶。
虽然主机厂过去的数据闭环结构不如 L4,但也开始不断追赶,例如小鹏汽车建立了自动驾驶智算中心「扶摇」,部分主机厂也都在建设云端计算中心,以消耗目前大量的道路数据,例如标注、仿真平台以及训练平台都逐步实现闭环。而相比 L4 ,主机厂天生有足够规模的数据量,在样本数量具备足够大的优势,同时在用户数据所有权上也有较高的话语权。
总的来熟,无论是车企还是 L4 公司,它们的策略都是趋同于通过数据驱动来达到自动驾驶的大范围落地,形成数据闭环。
但唯一不同的是倾向不同,车企拥有大量的用户与数据量,对 Robotaxi 的探索更多为了服务用户提升自动驾驶的体验,例如在城市道路中的脱困场景、博弈场景以及过去主机厂较弱的规控上得以优化。而 Robotaxi 公司更多是探寻商业化的可能,通过降维到乘用车市场,用较低的成本获取车企的海量数据为 L4 技术框架做反哺,实现商业化闭环。
四、总结
当我们都在讨论国内多传感器方案会逐步打败过去一骑绝尘的纯视觉方案时,纯视觉依旧保持它无尽的成长空间与想象。而以特斯拉为首的纯视觉信奉者也逐步走向极致化,从不用激光雷达到去掉毫米波,再到去掉超声波雷达,纯视觉也进入快速迭代期。
当然纯视觉算法依旧面临原生的局限性,例如对 3D 空间、测距、夜间环境以及检测范围等,而新的算法也在逐步攻克其局限性。另外通过大算力芯片、存储、训练、仿真等为数据驱动的闭环开发模式,也让不同车企之间的能力逐步拉开差距,进入加速迭代期。在解决了0-1 的「技术能力」后,相信大家都会走向「降本增效」的长期优化期。
今年一个比较热的话题则是从「重地图」到「轻地图」的策略迁移,大家普遍对城市中使用高精地图持悲观态度,包括小鹏、华为以及毫末都宣布轻高精地图化。而激光雷达在性能不断提高提高的同时,也提供了不同激光雷达组合的解决方案,通过覆盖车身周围的传感器部件提高安全检测能力,但激光雷达短期内依旧限制于成本,中低端车型短期内与激光雷达无缘。
而另一个思路是从功能上出发,多传感器融合看似在融合效率以及简化上不是最优解,但不可否认其在与纯视觉方案的对比上,多传感器依旧是一个快速通道,不同车企也提出新的融合方案,在满足识别效率上也确保每个传感器发挥其产品优势。
在大家步入城市领航辅助驾驶上,全场景的能力也开始成为下半场衡量智能驾驶系统能力的新起点。而新兴的智能驾驶硬件、软件算法也在不断创新演进。而回归到用户体验上,安全、舒适、效率以及使用范围也是我们评测 LCC 好不好用的四大关键指标,而这四个指标就像四个枝干,在不同阶段中也具备延展性。例如在智能驾驶的第一阶段,我们对安全的理解只局限在通过性,能否完成安全刹车、避让。而伴随着智能驾驶的演进我们聚焦在基础安全(主动安全)、交互安全、功能安全等多维度体系上。
从评测维度上,我们也以 GAMP 作为评测标标准,不以总分制的策略,通过设置不同场景来看看不同系统的通过能力,以更宏观、全面的角度评测系统的能力。
在步入 2023 年之际,我们即是智能驾驶发展的亲历者与见证者,同时也带着一份新的期待,智能驾驶市场又会带给我们哪些惊喜呢?我们拭目以待...