有研究分析认为,自动驾驶有望减少96%的车祸率,在这个过程中,每个毫秒级的决策延迟都生死攸关。为了实现实时的相应,今天自动驾驶车辆装备的传感器可谓是武装到了牙齿,从几百万分辨率的摄像头走向上千万像素,再加上激光雷达、毫米波雷达,每天都将产生几百TB的数据。有资料显示,仅2000辆自动驾驶汽车每天产生的数据量,就超过了2015年全球互联网的整个数据量:250万兆字节。
这么大量数据全部传到云端再处理并不现实,这对车端的数据分析和计算能力提出了非常强的要求。数据的大爆发成为了智能汽车迅速发展的核心燃料,计算架构、开发范式也都因此发生了巨大变化,在“软件2.0”时代,数据驱动开始替代部分“软件1.0”时代传统基于规则的计算。
而实现数据驱动的关键,在于用智能计算取代逻辑计算——也就是规则计算。
以神经网络为代表的智能计算如今正逐渐成为车载计算的核心,但在传统汽车架构中,智能计算其实是割裂的。如下图所示,座舱IVI以及规控部分主要采用逻辑计算完成,以传统计算芯片为主,最典型的是各种CPU。这样的计算方式量低估了人机交互界面(HMI)的复杂度和价值,导致系统安全等级不足。
在传统汽车计算架构中,每辆车的功能可以拆分成多个ECU来实现,整车电子电气架构很多也是基于规则经验进行设计后才下放到每个ECU,再由ECU对接毫米波雷达、超声波雷达去完成必要计算。计算完回传到融合,进行设计。
这种设计理念不仅在软件上,甚至在整车硬件架构上都会拆分出大量琐碎的ECU。因此目前业界已经逐步过渡到以DCU(域控制器)为主的域控架构,把零碎的ECU集中到一块板子甚至一颗芯片中,集成度得到了提高。在此转变过程中,智能计算占比不断增大,并从规控走向逻辑计算和智能计算向协同,规控开始慢慢有了数据驱动的方式,并且可以借助规则让规控变得更可解释。
在自动驾驶发展到L2+、L2++甚至L3的过程中,大量人机交互开始出现,HMI变得越来越重要。这不仅体现在智能座舱的导航、点播功能,更表现在乘客开始主动确认整个系统是否处于安全可控的状态,准备随时接管回机器,这也是辅助驾驶进阶过渡到自动驾驶期间建立人机互信的重要过程。
“与此同时,汽车硬件架构也在往域控之后的方向演进,未来将成为个人超级数字终端,甚至某种意义上个人数据中心,计算——尤其是智能计算的部分完全中央化。”在日前地平线举办的「一路征程,胜算在5」技术开放日上,地平线联合创始人&CTO 黄畅博士说到,“未来,智能汽车中使用智能计算的占比将越来越高,增速远高于逻辑及规则计算。”同时IVI及很多控制部分会演变成域,当前部分国际车厂已经开始采用中央计算控制域,加上车控、轮控、底盘等车身各部分控制域的架构。
地平线联合创始人&CTO 黄畅博士
黄畅比喻到,这种架构就像人体的神经系统,绝大多数算力集中在大脑,控制域就像脊柱或神经末梢,要求响应特别灵敏,但对非常复杂的智能计算要求不高,这从仿生学的角度来说是合理的。此外集中式中央计算甚至可插拔像服务器一样,让汽车硬件升级变得更容易。
算力是智能化时代的“水电煤”,但物理算力(TOPS)正比于晶体管数量、芯片面积和芯片成本,算力的提升同时意味着成本提高,但高算力不一定能够带来更好的用户体验,尤其在自动驾驶领域。以特斯拉HW3.0为例,两颗芯片的峰值算力各为72TOPS,整合在一起是144TOPS,这个物理算力值甚至还不如此前HW2.5基于英伟达的Drive平台 ,但每秒处理图像帧率(FPS)却提升了21倍,这是算法性能提升带来的。
“每秒钟能够处理多少帧图像,这才是真实算力,而不是理论上的每秒钟能进行多少次计算。”黄畅说到,这也是地平线为什么一向反共识地坚持“算力大不如算的快”。
伴随着摩尔定律的放缓,借助工艺演进带来的芯片性能提升最近几年已接近饱和,但智能计算对于算力的需求在7年间提升了6倍。在后摩尔时代要实现芯片优化,满足指数级、爆炸式增长的智能算力要求,必须借助先进制程、先进封装和架构创新的“组合拳”。
FPS代表着处理器的真实计算效能,它与TOPS之间还隔着两个关键要素:名列前茅是算法效率,第二是有效利用率。这就是地平线早在2016年就提出的“智能计算的新摩尔定律”。所谓有效利用率,指的是每秒钟花费有效计算次数获得的处理性能,这个数字直接影响每秒钟处理的任务次数。
但这类算法部署在计算架构上时,有效利用率往往受限于带宽、计算架构适配性以及软件是否能够充分调度硬件上所有的计算器件等一系列问题。“峰值物理算力在适配越来越先进算法时,有百分之几能够真正用到?这个数值往往被很多人忽略,以我们过去的经验,好的能做到60-70%以上,差的可能1%都不到。”黄畅说到。
算法的快速演进,让TOPS和FPS在不同的处理器上、跑不同算法时呈现出巨大差异,因此在基于包括软件编辑和硬件芯片的计算架构上,做的设计优异程度差异也很大。
真实的算力实际上是芯片软硬计算架构和半导体制造本身所带来的收益,而软硬件计算架构带来的收益,实际上就是算法往前演进带来的收益,三要素共同决定了整个系统的性能。
1980年的个人电脑时代,计算架构主要采用通用任务处理器(CPU);2007年进入智能手机时代,采用的是CPU+GPU的通用多媒体联网交互平台;“2020年开始的智能汽车时代,我们认为会用BPU构建的智能驾驶及智能交互平台。”黄畅说到,“每一个时代会有一个时代的计算架构,智能驾驶和机器人我们认为一定是专用架构,软硬结合面向非常先进算法趋势进行联合优化设计。”
从智能计算架构1.0迁移到2.0,需要结合端云结合的数据、化繁为简的算法以及软硬结合的算力。这里存在很多范式级别的智能算法,并且支撑软硬体系相结合,特别是加速机器自编程和应用自适应。
但是地平线在做名列前茅代BPU时就发现,这个架构开始变得越来越复杂,存储分配和计算调度复杂度是指数爆炸级的,既不能靠人去填坑,也不能靠传统基于规则和动态规划的启发式搜索优化算法,而是要用更加智能化的正向学习方式去完成优化。这样优化的好处是未来编程会比以前更容易,以最近GPT的发展为例,黄畅认为将来可以用自然语言去描述编程目的,就可以把它转换成一个模型或算法,再高效对接到目标计算平台上去高效实现。
据介绍,地平线在做BPU设计时首先聚焦最新的神经网络架构,面向未来进行设计。例如2017年的卷积神经网络,2018到2020年的EfficientNet,BPU硬件都可以支持。而在进行贝叶斯架构设计时,地平线就设计了对BEV类型的算法融合。
“如今我们设计的是面向Transformer类型的算法架构,在明年下一代芯片上可以看到围绕AGI算法所能带来的性能提升。”黄畅说到,“我们始终关注未来最新神经网络算法发展趋势,并且结合支持自动驾驶,尤其聚焦在自动驾驶应用场景里所关注的算法。”
贝叶斯架构已经能够高效支持Transformer,最典型的两个例子,一是Swin Transformer获得2021年计算机视觉领域较高奖叫马尔奖。它应用Transformer获得层次化特征,成为卷积神经网络的潜在替代者。二是DETR,这是Transformer在自动驾驶核心任务——物体检测上的优异实践,在征程5中利用Transformer在时序上将检测和跟踪进行融合计算。
据悉,地平线下一代BPU将采用纳什架构,以AI辅助设计大幅度提升可编程性,具体包括三级存储架构、多脉动立方加速引擎、数据排布变换引擎以及浮点向量加速单元等。
据介绍,地平线征程5芯片在2021年正式发布后,已于2022年开始正式上车量产,其128TOPS算力也是国内名列前茅个跨过百T算力门槛的。计算性能达到1531FPS,在MS CoCo上达到中等性能,60毫秒低延迟,整体功耗不超过30瓦。
目前征程5已经获得超过10个车型的前装定点,并在2022年完成10万+出货,可实现高性价比的高速领航辅助驾驶(NOA) L2+产品组合。
与此同时,地平线也始终保持开放态度,未来将开启BPU的IP授权模式以及软件白盒赋能,就其实也是另一种意义上的“Arm + Android”模式。黄畅解释道,这就类似英伟达提供计算平台的模式,把操作系统也开放出来和伙伴一起共建。“以征程5为例,大概有50到60多个子系统,每个子系统里还有很多IP,非常复杂。地平线不可能做出一款芯片适配任何场景,也不可能设计多款芯片适配各种场景。所以我们将更聚焦在内核部分,BPU授权后,可以让整车开发从芯片到操作系统都和伙伴一起共创共建。”
现如今各大车厂对整车电子电气架构都有自己的认知和理解,自动驾驶或座舱域控只是其中一个子系统,要做一颗集成到整车电子电气架构中真正完美的域控处理器,恐怕没有一家芯片公司能够做到。所以BPU授权模式的合理性在于,在合适的场景中把IP授权出去,让客户、伙伴去完成整个设计和开发,把智能计算架构BPU尽可能做到极致。
如今,辅助驾驶功能已经在越来越多的中级车型上普及,带高速NOA功能的车型最低售价甚至已经下探到15万左右,“里面离不开地平线芯片做出的贡献,我们希望好用的功能和产品不止存在于高价车上,让大家有兴趣但是买不起。我们更希望做大家能够买得起而且用得好的产品。”地平线副总裁 & 软件平台产品线总裁 余轶南博士说到。
地平线副总裁 & 软件平台产品线总裁 余轶南博士
他表示,汽车用户的需求和价值这几年正开始发生变化。那些能让驾驶员开得更加轻松舒适、减轻驾驶疲劳的功能,正从需求榜上逐渐上升,如今智能驾驶相关的需求已经排在用户选择新车型最关注点的TOP3,并且排名还在持续上升。
尤其是NOA功能正得到越来越多用户的认可,在消费者认可的本土中高端的电动汽车品牌中,标配NOA已经逐渐成为共识。余轶南表示,地平线正朝着“用户价值不断提升,用户可获得价格不断降低”这两个方向努力,力求达到优异点,使得用户在可接受的价格范围内买到优异质的产品。
虽然算力的确会带来更多的价值潜力,但这个价值潜力需要被软件和算法变现,这也是今天制约整个智能驾驶市场和用户体验的核心。算力变现的关键在于软件,如下图所示,在给定算力上限的情况下,用户体验的上限是一根橘红色曲线。但如今用户的实际体验是橘线下的蓝色区域——体验被自动驾驶软件算法制约着,要将蓝线不断提高到能够匹配算力的高度,核心是更优的算法。
“如今智能车每天产生的数据规模已经相当大,通过更好的算法和这个数据量可以不断逼近这个上限。”余轶南说到,“从具体应用来说可能会分成若干个阶段,包括城区的导航辅助驾驶、高速的导航辅助驾驶,以及普通意义上L2 ADAS,地平线会在不同的市场阶段上都做到更好的性价比。”
据介绍,单颗征程5的定位是支持顺畅的高速NOA体验,可以实现在高速场景堵车流汇入/汇出,以及事故车、施工区域避让等功能的实现。
据悉,征程5名列前茅个量产车是理想L8 AD Pro平台,同时在理想L8、L7上作为标配搭载。
余轶南表示,最近自动驾驶算法层面有两大趋势,其一就是BEV(Bird’s Eye View)感知架构,这是一种端到端的感知框架,通过输入车载周视或环视图像 (序列),进行时空双维度中融合 (middle fusion) ,使得神经网络原生输出鸟瞰视角下的动静态感知、预测结果。
具体来说,就是通过不同路摄像头将原始图像视频输入到神经网络,经过处理给出动静态感知结果,比如车道线、停止线、道路边缘、路面箭头和红绿灯等等静止环境,以及车辆、行人、自行车、三轮车等交通动态参与者。通过所有信息整合,结合导航信息给到规控。
第二个是Transformer架构。从神经网络的角度,BEV和Transformer可以整合成完整的端到端架构。地平线在2022年已经完成相关paper和算法,今年这篇题为Unified Autonomous Driving的论文可能会出现在CVPR2023上。
这套架构被称为“自动驾驶通用算法框架(UniAD)”,它首次将检测、跟踪、建图、轨迹预测、占据栅格预测及规划整合到一个基于Transformer的端到端网络框架下。据介绍,UniAD在nuScenes及数据中的所有任务表现均达到State-of-the-art,并在预测和规划中远超其他模型。
“我们目标就是要确定一个大网络,使得它可以在全球各地能够被正确运用。所以这套架构真的是可以面向终局的架构,但终局一年两年还暂时不能达到。”余轶南说到,因为这需要更强大的算力和数据支撑,而目前的数据量还远远不够,“只有产品性价比做起来,让普遍用户都能用得起,才能够收集真正大量的数据去完成这件事,然后才是算法。
与黄畅之前提到的一样,余轶南也强调地平线并不想把整个智能汽车相关技术都做完,变成市场少数的主体,而是希望赋能整个行业。基于最底层的芯片和操作系统,通过各种各样参考算法、天工开物算法开发工具链以及云端开发平台艾迪,以平台的属性去支持不同合作伙伴去开发他们认为优异的方案。
生态方面,余轶南重点介绍了合作伙伴轻舟智航在今年3月27日发布的行业首款基于单颗征程5的城市NOA方案,在“高速+城市”场景下NOA首次完成了2000万级人口城市下的复杂道路挑战。
据介绍,地平线自己在做城区NOA时采用了两颗征程5,但轻舟智航基于地平线的工具链,在单颗芯片上就完成了这件事,着实令人惊喜。
这也反映出地平线在包括芯片、工具链、艾迪开发平台的整个生态底座上,无论是软件算法还硬件都能提供设计参考方案,支撑构建了多层次生态。
通过地平线TogetherOS把硬件IDH、软件商和Tier 1组合起来,形成一整套完整的系统,共同面向车企开发产品,才能给用户带来最的高性价比。
“我们已经看到了软件算法架构可以面向未来十年的趋势,十年后的终局可能还是L2+++。但算法只是智能汽车中的一部分,而整体产品的未来十年的终局会是什么样?可以把人和车的关系,类比成人和马的关系——人每骑一匹马,都需要相当长的时间去和这匹马做磨合。”余轶南说到,“不会有产品说明书告诉你,这匹马可以跳过几米的沟壑。但是作为马的主人和它相互适应一段时间后,你就感觉到这匹马的能力边界。”
从用户和车之间的关系来讲,用户需要适应和匹配车的能力边界,随着车辆能力变得越来越强,可能在十年以后用户会在行驶的车上睡觉。用自动驾驶的核心技术指标来说,也许就是百公里接管(MPI,自动驾驶每接管两次之间的距离)。数据显示,目前自动驾驶的百公里接管在高速公路上基本上在100-200公里之间,而城市的百公里接管大概在10-30公里之间,“这样的指标还不允许人在车上睡觉。”
但如果花十年时间,把这两个指标后面多加4个0,按照汽车生命周期十到二十年计算,就可以做到10万到20万公里不需要接管的水平。而且光有性能和技术的提升还不够,我们把性能推高不够,余轶南认为更重要的是基础设施也需要匹配智能车辆。“今天的道路不是一百年前的石子道路,我们相信未来也会出现自动驾驶专用道路。”
文章来自:https://www.eet-china.com/