

- 全站推荐
- 全站置顶
- 首页推荐
- 社区推荐
-
置顶推荐
- 6小时
- 12小时
- 24小时
- 3天
- 一周
- 长期
- 设为精华
- 热门推荐
- 撤销审核
- 进小黑屋
- 生成议题
#你对记忆泊车的理解是什么?#
Hello!大家好!我是炸鸡协会会长!
作为新用户,「会长」响应社区话题号召,今天和大家来「嗦嗦」自动泊车的那些事儿!
泊车对于老司机或者刚拿驾照的用户而言,它其实只是一个驾驶出行的一个场景。但对于自动驾驶的机器而言,意义有些不同,这是一个关乎能力闭环的重要环节。
那么在这里我们就引出了一个逆向思路:能否先攻克自动泊车,接着逆向走向自动驾驶呢?

一、嗦嗦大局:记忆泊车的背景
我们都知道自动驾驶的方向会有两个思路,一个是面向全无人驾驶的无人车代表,例如 Waymo 等;一类是 L2 到 L3 等的循序渐进式的技术,包括特斯拉、小鹏、蔚来等。
可以看到,第一类是出手即高端,跨阶的技术让第二类技术无法比拟,建立起一套完整的训练体系,并且有装备齐全的车队做采集,数据非常高质量、处理的场景也更加多元。但难点也显显而易见,商业化落地的尴尬。
而第二类技术我们看到都是车企或者供应给车企的方案供应商,商业化途径很清晰、车队的数量也非常庞大,但目前建立起完善的训练体系还在初期,并且车队数据采集量虽多,但是数据质量有限、迭代速度慢。
并且蕴含一个风险:
假设一台车有八个摄像头、摄像头像素为 200 万分辨率。那么如果你基于这套感知框架所采集的道路信息不能解决你的问题,那么这套架构得推倒重来,并且可能在你新的框架下,过去的采集的信息都不可用,重来。
那么有没有一种路径,车企可以在技术上参考无人车技术路线、又能面向 c 端用户完成商业化呢?
记忆泊车应运而生。
二、记忆泊车的关键词:范围
1、在范围内实现无人驾驶。
无人驾驶衡量的除了我们常提到的安全和成本,另一个是衡量指标是 ODD(运营范围)以及技术。
这几点是相辅相成的:
- ODD运营范围越小
- 那么你的场景、技术越简单、成本越低、更安全。
Robotaxi 的落地逻辑就在这里,打不通全范围的无人驾驶前提下,那么就先利用范围内实现无人技术呗。
所以现阶段比的是:谁的 Robotaxi 能够更大的运营范围内实现更好的解决方案(成本低、安全高),那么你就是赢家。
那车企、方案供应商如何利用车企的单车实现范围内的技术迭代呢?
泊车的场景就非常合适。
- 第一:它有一个 A B 两点的起点、终点目标,这完全和高速场景 NGP 和城市 NGP 完全一样呀!
- 第二:自动泊车有开放式的场景,并且空间维度上封闭、场景简单;安全维度上速度低,完全可以拿来练手呀!
那么有这两个前提,就开始撸起袖子干呗!
三、「看看」市场两大技术博弈
1、第一个技术方案:小鹏纯视觉方案的记忆泊车
小鹏基于视觉传感以及 IMU 定位技术路线,也就是你有一双眼睛然后走一遍绘一张地图(VSLAM),这个原理和扫地机器人差不多:
对陌生环境建立地图、保存、使用(基于地图做定位)。
所以解决两个关键点:
- 一个是解决定位问题。
- 另一个是解决视觉建图。这里和自动驾驶的地图需求不同,需求简单,只需要建一张符合地库的地图即可。

2、第二个技术方案:基于百度平台的记忆泊车
威马基于多传感器(环视+超声波+毫米波)以及高精地图的百度技术路线,当然百度还有一个外援,也就最具差异化的技术:云端计算。
解决问题的关键点也有两个:
- 1、高精地图的采集+众包车队的更新
- 2、车企+科技公司的深度融合能力,包括未来的规划和控制上。
这两个技术有哪些优势劣势呢?我们详细剖析!
四、剖析小鹏的纯视觉方案背后的技术
1、小鹏加入避障能力
纯视觉方案的路线我们了解了很多,例如对车辆的规划与控制以及行为预测等。
这里的技术范畴其实和小鹏当前高速 NGP 以及 未来城市 NGP 相类似,对于奔走的行人、车辆做预测、最终对车辆做行为规划和控制控制。
这里要做一个大大的强调:
自动驾驶的预测和规控能力不是简单的识别、刹车这么简单,到 L4 阶段我们看到的难点可能不是处理 AEB 场景,而是如何让一台车具备「收放自如」的刹车能力,能够带来更接近人类驾驶的体感,而这个优化是需要针对场景做持续迭代优化的过程。

2、小鹏视觉传感加入更多语义信息
从过去的泊车、遥控泊车、加入路径规划/地图的自动泊车,到下一阶段夸楼层自寻车位的自主泊车。
基于的地图的纯视觉方案我觉得是小鹏接下来的一个新技术方案的雏形。没有高精地图的辅助,小鹏利用 SLAM 与语义地图相结合,是构建纯视觉方案的雏形。
与点云信息不同,语义即是把你看到的点云做一个注解。
例如点云看到一个距离你 200 米外立在大马路的 “7” 字形物体,那么语义信息就会告诉你,这是一个信号灯、现在是红灯状态、你赶紧给我停下来!
诸如此类的语义有很多,例如路上左转右转的箭头、限速信息等。而最高阶显然是接近于人类认知的语义,这也是 L4 阶段要实现的。
人凭借双眼可以对可行驶的区域、道路信息、路标和周围信息有很好的认知,所见即所得,所以做了很好的决策。

我们看到小鹏在这个阶段除了从过去识别出的各种样式的车位外,还加入了减速带、行人、车、柱子以及两轮车等。
没有高精地图的辅助,基于视觉建图下需要加入更多的语义信息,同时也可以拿一些东西例如柱子做路标信息作辅助定位,我们看到小鹏记忆泊车中,暂时无法对地库路面箭头、车道线的识别,未来应该会继续补上。
3、IMU 定位,不依赖 GPS?
在论述定位关系前,我们看看绝对定位和相对定位的关系。
我扒出了当年在大学学网页设计时,舍友给我讲了一个比喻,让我整个大学对于定位关系都明朗了:

也就是说:
- 自动驾驶需要解决车与环境的关系,就是相对定位,这个位置变化是时刻变化的。
- 而车辆出现在地球的某个具体位置(经纬度),就是绝对定位。
绝对定位我们也比较容易理解,就是我们常见的 GPS 了,但是自动驾驶需要厘米级,所以以高精地图为依托,采用 IMU 和 GNSS 来做高精定位。
但 IMU(惯性测量单元) 则不同。
惯性测量系统可以完全独立,测量上完全不受运动变化或者环境变化,所以它单纯使用的情况下是用来做相对定位,就是即刻下对某个位置的位置测量,所以它不需要任何外部依赖,包括外部信号。
过去 IMU 是与 GPS、RTK 融合使用,来做相互验证以及在信号丢失后做冗余。而单独拿出来用在地库这样一个封闭环境里,解决相对定位的问题,就讲得通了。
它记住一次路线后,在使用时就解决了自身定位问题,所以不存在 GPS 。
4、为何没有做开放式场景 ?
为何是地库?我做一个小小的判断 轻喷!
(1)快速建模
地库室内的建模相比室外会更方便,地库场景都较类似、道路场景都简单,室外开放性场景更为复杂。
(2)光线问题
地库光源主要来源于灯光,相对比较容易设置,而室内光线对于纯视觉传感而言也比较友好。
(3)语义与定位
猜测室内的车道线、柱子等信息都较为稳定,也有利于视觉识别以及定位,开放式环境没有可参考信息,具备难度。
五、威马基于百度的高精地图方案解析
威马 W6 基于百度的方案分为 HAVP 和 PAVP 。目前 HAVP(自主学习泊车)已经落地,通过学习人为学习路线,后续自主来完成无人驾驶泊车,适用于固定车位,但是后续可升级为范围内的任意车位。 而 PAVP(高精地图自主泊车,则无需学习,利用高精地图完成机器自主泊车。

1、利用云端计算
云端计算算力相比车端算力高很多,并且可以支持在线升级,这也是百度这类做无人车的一大技术优势,而泊车场景也不需要依赖太多效率,所以云端是一个很好的方案。
那么相比小鹏的车端又会有哪些优势?
只要在同一个地库内,那么就有路径优化的可能,这个逻辑类似于当前的车队数据,利用云端训练、车端与云端的更新能力,只要样本够大,最佳路径的规划就成为可能。
另外这个云端就像一个大本营,只要有足够的品牌车队加入,那么它的优势就会更大,并且对于车企的成本要求也会变低。

2、高精地图
依赖高精地图的优势无论是定位、规划等能力相比小鹏的视觉感知会更佳稳定,比如说它有高精地图情况下就无所谓是否在地库了,相信在一定范围的召唤或者泊车都可以实现,所以实用性场景还是有很大想象空间。
但显而易见,高精地图还是受限于环境更新以及绘制问题,目前百度应该是利用车队来实时更新数据。
3、规划与控制比较难
由于是拿来技术,那么在和车企做控制规划匹配上,就没有太大的优势,或者它需要时间做更多深度的融合。
所以你看现在威马在避障能力上就弱了很多。

4、遥控泊车
这里和小鹏有一个很大的不同是威马利用了手机泊车,小鹏则是利用蓝牙钥匙泊车。
这两点是很大的技术差异。
威马利用 APP 联 4G/5G 网络,所以它能解决长距离的无人遥控泊车,当然现在限制 100 米应该是法律法规问题,需要在人为监视情况下完成无人泊车,按道理来说这个距离去的比这个更远。
而小鹏依赖于蓝牙钥匙,所以只支持短距离的手机遥控泊车,实用性相比会差一些。
总结下:
现阶段自动泊车的技术百花齐放,可以预见的是自动泊车向自主泊车的路径在场景化上会走向趋同,但是前期和中期的方案会发挥不同企业自身的技术优势。
小鹏利用地库的场景集成了自己的优势,并对场景的收集可以进一步做场景优化,例如避障能力上是需要长时间的打磨的,这也能够反哺小鹏的技术成果,而特别是在纯视觉路线中,这无疑是绕不开的技术难题。
而威马基于百度的方案,威马可以迅速拿到一个泊车方案,加快技术落地、降低成本。而百度在未来技术路线中,需要大规模的车队去填补自身的数据空缺以及更新!
百花齐放的时代,期待!