大概一个月之前,马斯克放出了可能是今年特斯拉最重大事件的预告。
4 月 15 日,马斯克在推特回复网友称,特斯拉的 AI Day 专场发布会,预计会在「7 月底 late July」举行。
继 2019 年 4 月 23 号自动驾驶日 Autonomous Day、2020 年 9 月 23 日电池日 Battery Day 之后,特斯拉第三次以「Day」命名的技术发布会,终于正式定档。
自动驾驶日上,特斯拉掏出了世界上首枚由车企研发的自动驾驶计算芯片 FSD Chip,并发布了算力高达 144TOPS 的 Autopilot 硬件 3.0,总体算力至今依然没有量产车望其项背。
电池日上,马斯克放出了年产能 TWh 级别的全新电池工厂,发布了下一代 4680 电池,以及融合了电化学、生产优化,以及车辆工程之后续航提升 54% 的宏大目标,还有三电机+超长续航的新款 Model S。
于是,我们没有理由不期待,马斯克会在 7 月底的 AI 发布会上,放出更多「核弹」,为自动驾驶的 2021 打上更多花火。
当然,按照前两次发布会的调性,大家一定要做好 AI Day 跳票,甚至多次跳票的准备。不过这不影响我们根据现有的线索,揣测一下特斯拉到底会在 AI Day 上发布些什么。
不用担心,今天的文章不只有枯燥无味的数字,我们会争取写得更让人心潮涌动一些。
来自车企的全球最强计算机
根据 2020 下半年的全球 TOP500 计算机排名,目前已投入使用的超级计算机中,日本富岳 Fugaku 超级计算机以 431.65PFLOPS 的 FP32 精度算力,排在榜首,大概是第二名的3倍。
2020 年 8 月 16 日,马斯克首次披露了特斯拉 DOJO 超级计算机计划的目标——FP32 精度 1EFLOPS 的算力,也就是 1024PFLOPS,富岳的 2.5 倍。
DOJO,也就是特斯拉 AI Day 的最大看点之一,一套来自车企的超级计算系统。它是特斯拉自动驾驶计算补齐的最后一块拼图,甚至有可能是新时代车企「灵魂」的最终体现。
我们讨论自动驾驶时,常用的 TFLOPS 算力,其实是基于 INT8 精度衡量的。换算成 FP32 精度的话大致要除以 4。也就是说,特斯拉 Autopilot 硬件 3.0 的 FP32 精度算力大概是 36TFLOPS。
换算一下就是,一个 DOJO 系统的算力,起码相当于 29127 辆特斯拉硬件 3.0 车型算力之和。
1EFLOPS 的算力当然很恐怖,但傲视群雄的 DOJO 担子依然不轻。
根据 thecarconnection.com 的统计数据,2014 年全美驾驶者平均每天开车 52 分钟。
以特斯拉硬件 3.0 车型保有量 100 万辆计算,一套 DOJO 纯粹基于平均时间值换算,每天大约需要处理超过 2500 万辆次汽车反馈的数据。
当然,DOJO 主要负责的是「训练」,这样计算它的压力不严谨。但另一个幸福的烦恼是,特斯拉卖得真不错。
刚刚过去的 1 季度,特斯拉一共交付了超过 18 万辆汽车,这些车型全部搭载了 Autopilot 硬件 3.0,算下来今年特斯拉或将售出 73 万辆汽车,甚至有机会超越雷克萨斯。
按照这样的趋势,再过一阵子,马斯克曾经引以为豪的「百万级自动驾驶数据反馈车队」,就会变成每年「自豪」一次的幸福烦恼。
DOJO 如何适应迅速累积的 Shadow mode 数据反馈规模,比起 DOJO 本身,也许是 AI Day 更值得关注的命题。
硬件 4.0,突破 1000TOPS?
灵魂需要肉体承载,DOJO 是坐镇特斯拉总部的大脑,而分散于世界各地的 Autopilot 硬件,则是神经网络的每一个末梢。
DOJO 超算目前面临的内部挑战有两个:特斯拉卖得太火,也就是数据反馈越来越庞杂;以及特斯拉做得太多,也就是来自每一个「神经末梢」的数据压力,会越来越大。
「做得太多」对应的,就是马斯克 Autonomous Day 上承诺会在「两三年内」推出的二代 FSD Chip,以及它的载体 Autopilot 硬件 4.0。
根据台湾工商时报报道,二代 FSD Chip 将交给台积电量产,使用 7 纳米工艺制造,由博通和特斯拉一起设计。
台湾媒体报道的另一个消息,是「每块 7 纳米晶圆只能切割出 25 片 FSD Chip 2 代芯片」——一块 7 纳米晶圆面积是 70650 平方毫米,而初代 FSD Chip 面积只有 260 平方毫米。
所谓的「X 纳米工艺」,一般指的是晶体管边长为 X 纳米。根据摩尔定律,同样面积的芯片,其晶体管数量每隔 18 个月就会翻一番,而边长就是计算晶体管密度的重要因素。
一般来说,同样架构下等量的晶体管密度提升,就会带来相近的性能提升幅度。也就是说,同样面积下晶体管数量翻一倍,理论上性能会接近翻倍。
原理说得差不多,可以直接下结论了:二代 FSD Chip 在晶体管密度突飞猛进的基础上,芯片面积同样百尺竿头——最后的结果就是算力大爆炸。
我们用数字大概预测一下。
2019 年 11 月 7 日,特斯拉 AI 部门高级主管 Andrej Karpathy 在 PyTorch Developer Conference 2019 上面,公布了这样一个数字:Autopilot 硬件 3.0 的工作功耗是「sub 100W 低于 100 瓦」。
算下来硬件 3.0 总体的效率起码是 1.44TOPS 每瓦,而使用了 12 纳米工艺的英伟达 Xavier,芯片层面的效率大概是 1TOPS 每瓦(30W/30TOPS)。
初代 FSD Chip 用的是三星 14 纳米工艺,而 FSD Chip 2 代用的台积电 7 纳米工艺,理论晶体管密度是三星 14 纳米的 3.5 倍。
即使不考虑架构优化,硬件 4.0 也有望提供 6TOPS 的每瓦性能,也就是 100W 系统功耗,可以输出 600TOPS 的算力。
而英伟达最新的 Orin,系统级效率「只有」 3.08TOPS 每瓦(130 瓦/400TOPS)。
考虑到蔚来已经将自动驾驶计算系统的功耗上限,拉到了 200W+ 级别。一旦马斯克想狠狠来一把军备竞赛,也许 1000+,甚至 2000TOPS 才是硬件 4.0 的星辰大海。
当特斯拉每年卖出 100 万辆装有硬件 4.0 的汽车,DOJO 会不会喊一句「宝宝心里苦,但宝宝不能说」?
视觉能力飞跃?
如无意外,新一代 Autopilot 硬件会沿用 8 摄像头的配备。虽然数量大概率不会变,但下一代 Autopilot 摄像头的质量,很有可能迎来飞跃。
想要理解「飞跃」到底是什么,虽然技术路线不同,我们依然得先看看其他厂商。
年初的 NIO Day 上,蔚来首发了车规级的 800 万像素摄像头。
它可以以 4K 级别的精度收集视频数据。对比之下,目前辅助 Autopilot 硬件的,依然是 120 万像素摄像头。
其实符合车规级稳定性要求的高像素摄像头,多年前就已经出现,但却一直无法应用于 ADAS/自动驾驶,主要原因很简单——没那么强的车规级芯片处理如此庞大的数据流。
2020 NIO Day 上,李斌介绍称蔚来的 AQUILA 系统每秒会产生高达 8GB 的视频数据——8GB 相当于 1 秒钟看完 3 年 NIO Day 回放,或者 1 秒钟看完 2000 个抖音短视频。
2022 年开始,特斯拉/英伟达系在计算端万事俱备,800 万级别像素,将会顺理成章地成为 ADAS 行业下一个军备竞赛的必争之地。
1016TOPS 算力的英伟达 Orin 系统加持下,蔚来拥有了处理多个 4K 视频流的能力。同样将迎来算力爆发的特斯拉,没有理由不让 DOJO 看到更清晰的世界。
不过,高像素,只是自动驾驶视觉新时代的其中一个主旋律,我们下面结合具体的产品继续深挖。
先看一位车规级 800 万像素摄像头主要供应商:安森美 Onsemi。目前的 120 万像素 Autopilot 摄像头,就使用了来自安森美的 AR0136A 。
AR0820AT,这是安森美新一代旗舰自动驾驶摄像头型号。
它支持拍摄 3840x2160 分辨率,40fps 的 HDR 高动态范围视频,静态分辨率高达 830 万像素(3848x2168),同时符合 ASIL-B 级别车规认证。
除此之外,三星、索尼等主流 CMOS 厂商均已推出了 4K 车规级感光元件,比如索尼 IMX324/424、三星 S5K2G1,都支持 4K 40 帧的 HDR 视频拍摄。
4K、40 帧(或更高)、HDR,这就是自动驾驶摄像头新时代三大主旋律。
4K 和 1280x960 相比,分辨率达到了 6.75 倍,视频数据可以准确显示更远处的路况,以索尼 IMX324 的产品说明为例,4K 分辨率下远处的交通标志清晰可见:
40 帧则是画面流畅度(目前主流是 30 帧)的进步。视频帧率越高,视频中物体运动过程就会越流畅,有利于深度学习的预测和决策。
而 HDR,则是摄像头向人眼靠近的另一大步。
HDR 的全称是 High Dynamic Range 高动态范围。简单点描述 HDR的效果,就是极暗处(比如树荫下)不会黑成一片,极亮处(比如正午太阳下)也不会白成一片。
也许人眼已经对纷繁的世界习以为常,但对于汽车视觉来说,「工业革命」才刚刚开始。
新时代汽车工业的灵魂
DOJO、Autopilot 硬件 4.0、4K 摄像头,这是我们对特斯拉 AI Day的期待。
然而,AI Day 不仅是特吹的狂欢,它同时带来了汽车工业的思考:下一个时代的车企「灵魂」在哪?
先提一个业内观点:主机厂也许是更好的自动驾驶公司。
这个逻辑的起点很简单,因为主机厂拥有车辆制造权和运营权,丰田大众这样的车企,年销售规模甚至是千万级的。比起买几十几百辆车搞实验的自动驾驶技术公司,主机厂自研自动驾驶的数据基础极其优渥。
但优渥不代表门槛低。
摄像头→FSD Chip→车辆决策→DOJO 超算训练→软件 OTA 更新,这是特斯拉的自动驾驶闭环阳谋,但每一个环节,都是对传统车企的灵魂拷问:
传感器数据是否 100% 可控可收集?
计算硬件是不是「know how」级别地利用?
视觉融合是供应商包办还是自己搞定?
深度学习模型要不要自己训练?
能否在一个电子电气架构上做到长期更新,常用常新?
上文提到新车企「灵魂」,我们从不和稀泥,于是经过全文铺垫后,可以说得直白点:
新车企的灵魂不是旧时代的「制造」,而是融合了人工智能、软件开发、电子硬件架构等 ICT 行业特征的自研能力。
如果以上能力缺了一坏,甚至几环,你们觉得能叫「新车企」吗?