{{detailStore.author.is_follow?'已关注':'关注'}}
原创文章
管理
黑芝麻智能:大算力角斗下半场是极致「性价比」
新出行原创 · 文章

智能驾驶的光彩,让我们更多专注的是功能本身。

而在智能驾驶背后,却关乎着计算架构以及模型算法集一体的神秘美学,也值得我们去做更多探索。

黑芝麻智能在 BEST TECH Day 2023 上发布了全新「武当」计算平台,同时首发了首款芯片 C1200 。

而这也是目前国内首款用跨域的思路来设计计算平台的产品,它更重磅的意义在于基于单芯片来统筹座舱、智驾等平台,这也意味着黑芝麻开始从智能驾驶上升到智能汽车本身思考未来的计算平台。

我们这次会更聚焦在三个领域思考:

  • 黑芝麻的行泊一体带来了什么?(华山系列)
  • 黑芝麻为什么从智驾计算走向整车智能计算?(武当系列)
  • 竞争的终局是什么?

一、 黑芝麻的「行泊一体」带来了什么?

解决智能化,从解决智能驾驶开始。

而解决智能驾驶,始于计算。

在过去主流的 ACC 以及车道保持的阶段,也就是基于毫米波加单目摄像头的方案中,实际上用一个摄像头消耗的算力非常低,大概在 2-3 TOPS 之间,所以彼时 Mobileye 时代算力需求并不大。

伴随着 LCC 能力的提升甚至高速 NOA 、城市 NOA 以及记忆泊车等更高阶段的能力,例如去年理想 ONE 用 5 个摄像头 10 TOPS 的算力来完成高速 NOA 的能力。还有比如 P7 基于 Xavier 的 30TOPS 算力做到了高速 NGP 以及记忆泊车,P5 继续在 Xavier 把算力榨干到了城市 NGP 。

可以说小鹏开了一个先例,在看起来不高的计算平台上完成了一项“不可思议”的计算任务。

但伴随着传感器的数量、分辨率以及新算法模型的需求,实际上智能驾驶对计算的功耗、成本以及能效有更高的需求。

在智能驾驶迎来大规模量产之前,黑芝麻押注了基于单芯片的「行泊一体」解决方案,在高阶智能驾驶以及 LCC 辅助驾驶中走了条新路,也就是用单一芯片来解决行泊一体。比如黑芝麻在 2022 年量产的华山二号 A1000 系列,也将在今年交付的领克 08 上完成首发搭载。

故名思义,行、泊分别代表着基础辅助驾驶以及低速泊车的一体化平台。

在过去本身泊车需求并不高,更多的芯片供应商核心在单一的辅助驾驶领域或者高阶辅助驾驶倾斜,除了头部自研的主机厂,其他主机厂更多要利用两颗处理器来解决不同辅助驾驶功能需求。

黑芝麻采用了一种解决思路就是将辅助驾驶与低速泊车合二为一,并不是把两个芯片集成一起,而是多功能整合到在一个芯片上,在确保高性能的同时来降低功耗,并且满足软件的调度以及算法模型的需求。

当然它核心带来的还是更高性价比,将方案的成本下降到最低。

这对于芯片供应商而言,就需要在初期设计芯片架构的时候就需要把系统的完整性考虑进去,例如合理去分配好 CPU、GPU、NPU、DSP、ISP 等不同计算模块来达到更高效率的计算能力。

例如 3D 泊车上最吃的 GPU 算力,如果前期没有考虑会导致算力不足,需要再外接一颗处理器,但如果不考虑泊车时 GPU 又会消耗功耗。

所以芯片设计从最先开始必须先于功能、软件甚至算法前置一步,芯片不关乎只是满足某种算法或者某个视觉传感器,而是基于算法、传感器以及应用场景的完整功能。

基于工程化的能力,黑芝麻又研发了两大 IP ,有专注于图像处理的 ISP 以及专用开发的神经网络加速器 NPU,来解决智能驾驶的核心问题。

那 A1000 作为黑芝麻相对成熟的芯片,什么这时候黑芝麻没有发布 A2000 ,反而先掏出了相比华山系列更完整的产品,也就是武当系列?

二、 黑芝麻为什么从智驾计算走向整车智能计算?

相比华山系列专注于智能驾驶场景不同,武当系列是专注于跨域计算的场景。

它的核心不在跨域本身,而是具备多个不同域的融合能力,既能降维做高级智能驾驶,也具备多维拓展能力实现座舱、智能驾驶等不同域融合的需求

黑芝麻也开启公司定位升级,做智能汽车计算芯片的引领者。

而这种“押注”于跨域计算的“预测能力”,看起来也和黑芝麻彼时押注“行泊一体”如出一辙。

相比仅支持辅助驾驶、泊车场景不同,跨域计算需要兼顾的算力类型更多,包括通用 CPU 、AI 神经网络处理、图像渲染、专用的 CV 计算、音频音效处理以及高效安全的实时性算力等。

在智能驾驶上不同场景之间需要具备低延迟的能力,也就是即来即用,同时座舱、智驾不同功能也有不同的安全等级要求。

我们看看武当系列的首款芯片产品 C1200 的数据:

  • 基于 7nm 制程
  • CPU 核 A78AE(150KDMIPS算力)
  • GPU 核 G78AE
  • 自研 ISP 模块,支持 1.5GPPS 处理能力
  • 自研 NPU 模块,算力未公布
  • 双通道 LPDDR5 内存
  • 支持 12 路摄像头接入(最高可支持 1700 万像素)
  • 支持多路多屏 4k 视频接口
  • HiFi DSP 音频音效算力
  • 硬隔离独立计算系统(独立渲染、独立显示,满足快速启动)

C1200 是基于 CPU 核 A78AE(算力 150KDMIPS)以及匹配 GPU 核 G78AE。

实际上未来芯片要处理的功能不单需要解决前置的算法或者针对传感器,而是需要支持一个更完整的功能,同时无论是智能驾驶还是座舱有很多并发场景,这时候 CPU 变得非常宝贵。

除了需要一块 CPU 天花板做好预埋,实际上芯片公司也要更好的均衡 CPU 算力需求,比如通过软件定义芯片提高能效,或者黑芝麻通过放入多个 DSP 算力来协助 CPU ,让 CPU 可以专注在操作系统或者应用上。

而在通用计算和渲染算力上,黑芝麻自研 IP 可以得到进一步发挥。

比如黑芝麻自研的 DynamAI NN 神经网络加速引擎,可以支持 NOA 场景,同时还内置每秒处理 1.5G 像素的新一代 ISP 模块。

非常恐怖的是除了能同时处理大于 12 路高清摄像头的输入外,最高还可以支持 1700 万像素摄像头。

而作为一款主打极致性价比的计算平台,C1200 除了能够灵活组合目前主流或者未来芯片能力外,目前单颗芯片满足包括 CMS(电子后视镜)系统、行泊一体、整车计算、信息娱乐系统、智能大灯、舱内感知系统等跨域计算场景,而目前算力还没公布之时,也从侧面看出 C1200 芯片的灵活扩展性。

目前 C1200 预计在 2023 年内提供样片,预计也会在 2024 -2025 年正式量产。

三、竞争的终局:用质变的性价比

实际上从 PC 到智能手机再到现在的智能汽车、机器人,这三个阶段实际都代表了三种完全不同的计算架构,PC 阶段更重 CPU 、智能手机等在图形、 AI 上更需要 CPU+GPU ,而现阶段无论是智能驾驶的大模型,还是火热的 GPT 遇到最大的问题是 GPU 堆砌成本过高,这也预示着会有一种新的计算架构出现。

在针对汽车电子电气架构演进的同时,芯片设计上需要用新的计算架构来解决过去来自不同域的功能,以更简洁、性价比更高、更高效做集成化。

而针对芯片公司,在算力竞赛的同时也需要考虑如何以更合理、高效的算力排布,以平衡整个计算架构的性能。

从黑芝麻武当计算平台看,在行泊一体的基础上如何更高效的实现舱驾一体化,迈出了更大的一步。但它更合适的解释是如何在同一平台上实现跨域的融合,满足多场景应用、软件算法的复用需求。

最后当然还是要回归到问题的本质,就是极致的性价比。

A1000 随着系统的成熟以及开发成本的摊薄,成本也在快速下降。黑芝麻目前实现支持 10 路摄像头 NOA 功能的行泊一体域控制器,BOM 成本控制在 3000 元人民币以内,支持 100T 以上的物理算力。

未来 A2000 也会以 7nm 制程以及超过 256TOPS 算力来应对更高阶智能驾驶市场的需求。

而 C1200 的出现实际上要做到质变式的成本降低。量变式的只能通过压缩周边的软硬件的周边去降低成本,而 C1200 需要从整个系统层以及计算架构上创新,实际上才能带来核心成本的降低。

可以看到面对智能驾驶的上半场,核心的芯片公司玩家并不是为了追求的性能或者卷大算力,反而在行泊或者驾舱等场景上去推出满足智能汽车的最佳解决方案。

它的核心要素除了满足了性能,也要满足能效比,从而推动智能驾驶进一步下探,甚至做到中低端车型的标配...

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{digest?'撤销精华':'设为精华'}}
回到顶部
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

{{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

暂无相关评论

发表一下个人看法吧