- 全站推荐
- 全站置顶
- 撤销首页推荐
- 社区推荐
-
置顶推荐
- 6小时
- 12小时
- 24小时
- 3天
- 一周
- 长期
- 设为精华
- 热门推荐
- 撤销审核
- 进小黑屋
- 生成议题
前几天和新宙博士、马君博士以及新出行的老朋友 @MrRocky 做了交流,解答了几个包括我内心都有疑问的问题。对于小鹏 XNGP 也有一个全新的理解。
所以这次我们从硬件结合小鹏 Xnet 技术,和大家从另一个角度来讨论 XNGP 。
感兴趣的同学可以看看我们的视频回顾:智驾报告|不仅只有「无图」的惊艳! 深度体验小鹏 P7i 全新 XNGP
而这次我们讨论点别的:
- 双 Orin 目前天花板在哪里?
- Xnet 是什么?它能带来什么?边界在哪里呢?
- 不要“过渡崇拜”深度学习。
一、 双 Orin 目前天花板在哪里?
一个大家会忽略的“冷门知识”。
小鹏对英伟达提供的 Orin 平台,实际在原体的基础代码上做了一个大幅度的算子改写。
新宙提到的是目前双 Orin 至少从目前看是没有任何瓶颈的。
神经网络里的算子可以处理不同的数据、不同算子之间也有不同的计算规则,所以算子执行越高效,实际上神经网络的效率也会更高。
而这里我认为的逻辑是:
- 目前大家纯软件的优化存在瓶颈,而且软件算法也会逐步统一,针对这个芯片架构去开发一套算子库,这样神经网络才能加速,优化性能,同时也让自己具备核心竞争力。
- 另外是大量的神经网络计算不是通用计算,而是对特定问题做特定的理解,这样解决智能驾驶的问题效率才会更高。
这点 P5 的城市 NGP 已经做了验证,榨干了 Xavier ,来到 Orin 后小鹏自然有明显优势。
而长远来看,我觉得对于小鹏而言,算法的深根后算力本就不具备限制的问题,所以你也会发现小鹏一直不会过渡宣传 508TOPS 多么牛逼的事,而是更注重功能以及算法本身。
二、Xnet 的边界在哪里?
Xnet 是什么?它能带来什么?边界在哪里呢?
粗暴点理解,Xnet 是根据 BEV+Transformer 算法框架做到了接近于高精地图的能力,这也是我们目前看到的 SR 的水平。
包括道路结构信息、静态车道线、斑马线、红绿灯等、动态行人、两轮车、汽车等。
而到了这一 part ,相信很多同学要提到一个关键词就是“无图”。
这里面我理解 Xnet 无图化的有三个关键信息:
-Xnet 感知能力的转变。
Xnet 第一阶段是对道路环境的感知能力,知道道路结构、静态以及动态目标等环境信息的识别。第二阶段是知道这些环境信息之间的前后联系。
简单理解就是,第一阶段我们看懂现实环境的车道线,第二阶段是要在车道线找你对应的车道,最终通过路口。
而这个能力就对应了小鹏无图的下个阶段,就是通过导航地图来左右转、直行等。
当然这只是一个简单的例子。
-找到高精地图的“软肋”
小鹏过去做了大量关于高精地图的经验,实际上小鹏反而能找到高精地图的“最小值”。也就是不需要用到高精地图所有信息,只要找到一个“最小值”,通过感知能力来帮它做转换,从而达到最终的无图化。
-更远的视觉距离。
其实在基于高精地图的城市 NGP ,小鹏本身也是具备部分无图的能力。
比如广州超级多突然丢失车道、施工改道的场景,如果这里地图出现更新延迟或者错误,系统不可能直接冲,或者每次都请求接管一次。所以这部分需要感知能力来兜底,解决这些“暂时”的无图场景。
而这些能力在无图能力上被不断延续。实际上直接反应的就是 Xnet 视觉的距离,上游看的越远,也给下游留足了可行空间的判断,再通过低延迟的计算来帮助系统脱困。
比如上次和大家分享的在一个大型丢失车道的路口,没有车道参考的前提下,XNGP 的 LCC 在通过上结合远端信息规划出了接近人为开车的路线。
三、 不要“过渡崇拜”深度学习网络。
当我们把这些所有的能力都归功于深度学习网络的时候,新宙却提出了一个观点:能用数学解决的问题,暂时不要用深度学习网络。
可能很多同学听到这句话会有很大的失落。
“实际上整体算法上,到运动规划、运动控制上是一个非常经典的数学优化对象。深度学习是在规则越来越多,你在一个数学问题之外还要加很多的 if 、else ,你对语义的理解要求越来越高。我的判断如果是画一个线的话,是在运动规划的上面。运动规划到运动控制,我认为在很长一段时间内不会考虑,端到端对于小鹏来说不是优先级。”
也就是基于 Xnet 神经网络小鹏更需要的是理解这个世界,但规则算法会一直存在,但这不是我们所理解的狂堆 if else 语句,而是通过数学计算优化。
有个例子,刚好在沟通会上有人提到“XNGP 在识别黄灯上是否是基于规则算法去实现?”
实际上这个场景要确保好的通过性是要联合计算黄灯时间、当前速度以及路径规划,最后判断系统的通行能力,选择过或者不过,而这些实际上才是「规控」能力的核心因素。
在过去我们把大部分规划算法是把路径规划和速度规划独立成两个板块,路径规划就像是铺轨道,让车在轨道上行驶,随后在铁轨上再计算实时的速度,最后再获得行驶轨迹。
而你每次这样计算会带来一个bug,当我们识别一台慢车时,你得到慢车跟前再刹车,因为是实时计算速度后再判断绕行,每次我们都会“慢一步”,通过红绿灯路口也是类似。
而通过联合计算,我们可以在通行空间上加上时间维度,一次性直接得出最佳轨迹路线,做到提前识别慢车提前绕行或者判断红绿灯是否能通过。
所以当披着光鲜的 bev+transformer +大算力 ai 芯片外衣时,我们往往会忽略量产落地、用户体验的真正核心,也就是基础的规控能力,而这也是小鹏核心的关键竞争力。
「总结」
目前火热的 BEV 算法到大算力芯片,而我们看到的是小鹏每走的一步都在循序渐进。
从 P7 构建智驾框架开始,小鹏做到了高速 NGP 。
从 P5 开始,延续了 P7 架构,将 Xavier 的 30TOPS 算力榨干做到了城市 NGP 。
小鹏二代平台开始在大算力 Orin 芯片思考 XNGP 的全场景能力,而这期间还做了重要的技术切换,就是无图化。
从功能本身去思考平台架构、从算法本身去思考算力、从高精地图本身去思考无图,这时候我们发现这样你才能掌握功能迭代的主权、算力的主权以及无图化的主权,而下一步可能我们都在期待小鹏从激光雷达本身去思考纯视觉的能力?God knows!
我坚信,下半场小鹏还有一个“惊喜”。