一场国产大算力智驾芯片长跑,“后摩智能”要靠存算一体“新道超车”?
在算力需求蓬勃爆发的时代下,存算一体技术已逐渐走到落地爆发前夜。
这项技术诞生于1969年,彼时冯·诺依曼架构正强势引领着现代计算机时代的发展,是计算机发展“赖以生存”的基本准则。而存算一体概念的提出,颠覆性地将芯片的计算单元与存储单元融合,能够从根本上解决冯·诺伊曼架构计算与存储分离潜在的能效瓶颈。
(资料图片)
但存算一体技术十分依赖存储介质,且早期存储器和处理器的工艺和性能差距并不明显,因此在诞生后的数十年里,存算一体仍是一项实验室技术。
直到2018年前后,一面是人工智能应用与大数据产业的爆发性增长,摩尔定律逼近物理极限;一面是新型存储介质等存算技术实现突破性进展。随着传统冯·诺伊曼架构的能效瓶颈愈发突出,存算一体技术终于有机会拿到商业化的入场券,成为后摩尔时代极具潜力的技术趋势之一。
在这个背景下,近年来国内早有一批公司沿着存算一体的技术路径前行。但在现阶段,国内落地的存算一体芯片多以智能语音等端侧应用为主,对算力要求相对较小,若要真正实现大规模商业落地,仍缺少一个在大算力主流场景落地的契机。
后摩智能则是我国存算一体行业早期的践行者之一。从2020年创立之初,后摩智能就瞄准未来万物智能时代,通过底层架构创新,为行业提供极致效率的存算一体大算力AI芯片。经过两年多的一路“狂飙”,后摩智能终于交出了第一份答卷。
5月10日下午,后摩智能正式推出首款量产存算一体大算力AI芯片产品——鸿途™H30,具备256T物理算力,典型功耗仅约为35W。“受益于底层架构的创新,这应该是目前市面上效率最高的大算力智能驾驶芯片。”后摩智能创始人&CEO吴强笃定地说。
没错,后摩智能瞄准万物智能亮相的第一张王牌,就是一款智能驾驶芯片,剑指自动驾驶市场。
也许在一些人看来,2023年的智驾芯片已处于争抢上车的关键阶段,而此时向市场抛出一款新产品,后摩智能是否抓得住落地窗口?挑战丛生的行业环境,对后摩智能而言,这无疑是一场关键的自驾芯片市场抢位战。
01. 押宝智驾芯片,后摩鸿途™H30应运而生
基于存算一体重构智能驾驶芯片,是后摩智能面向万物智能未来的第一阶段目标,亦是早期战略聚焦方向。
原因无他,需求是最为关键的决定性因素。在吴强看来,人们平均每天将近1/8的时间都是在驾驶场景,智能驾驶无疑将成为未来智能生活最重要的组成部分之一,“智能驾驶的终局是要替代人类驾驶,用传感器替代眼睛,用各式各样的算法填补意识与灵魂,而底层智驾芯片则扮演着人类大脑的角色。”他说。
从这一角度看,智驾芯片一定需要无限接近人脑的计算方式和效率,而存算一体所拥有远超传统芯片架构的高计算效率,这点技术优势正与未来智驾芯片的关键需求高度吻合。
在这个机遇下,鸿途™H30芯片应运而生。
作为后摩智能首款存算一体大算力AI芯片,H30芯片采用12nm制程工艺,在Int8精度下最高物理算力可达256Tops,典型功耗不超过35W。在相同工艺下,基于传统架构的AI芯片SoC能效比多为2Tops/W,而基于存算一体架构的H30 SoC能效比高达7.3Tops/W,整体具有高计算效率、低计算延时、低工艺依赖等特点。
实际上,H30颇具差异化的特点其实是底层架构创新所带来的优势。
简单来说,过去传统架构芯片产品的效率提升多采用算法和芯片的深度耦合,将算法固化到芯片中,这一定程度上损失了芯片的通用性。而基于存算一体技术,H30能够从底层架构进行创新,在不损失通用性的情况下,实现性价比更高的效率提升。
也就是说,尽管H30是一款相对通用的智能驾驶芯片,但它与其他大部分专用智驾芯片相比,不仅实现了性能和计算效率翻倍,支持更多算法模型,同时功耗却只有它们的二分之一。
为了保证H30的核心竞争力,提高产品的易用性、降低客户迁移门槛并加速落地,后摩智能还基于H30推出了智能驾驶硬件平台力驭,以及软件开发工具链后摩大道两款产品。
其中,力驭平台作为一款域控制器,主要面向末端物流无人小车、乘用车智能驾驶、车路协同等场景。其CPU算力为200Kdmips,AI算力为256Tops,支持多传感器输入,系统可靠性进一步提升。同时,力驭平台功耗仅为85W,支持灵活散热方式,便捷部署成本大大降低。
后摩大道则支持Pytorch、TensorFlow、ONNX等主流开源框架,编程兼容CUDA前端语法,并支持SIMD和SIMT两种编程模型,无侵入式的底层架构创新设计也使H30更为高效、易用。
综合来看,力驭平台和后摩大道两款产品更多是解决H30的易用性和快速迁移性问题,在这两款产品的辅助下,H30也将实现更快速的应用落地,从而进一步推动大算力智能驾驶场景的普及应用。
02. 自动驾驶新战场下,存算一体的更优解法
推出市场,只是一款智驾芯片的开始,等待它的还有漫长且严苛的验证周期。实际上,2023年亦被称作国产智驾芯片上车落地的关键之年,而后摩智能选择在这个节点推出H30,这一入场时机不得不引人深思。
“晚吗?”——难免有一部分人对H30切入市场的时机产生疑惑,但吴强却不这么认为。他告诉36氪,如果将智驾芯片的市场脉络进一步细分,其实当下真正实现国产替代的只是低算力需求的L1、L2自动驾驶场景,这个赛道早已完成了国产替代从无到有的过程,接下来要走的是从有到优的路。
但在L2++新战场,尤其是几十T甚至几百T大算力需求的高级自动驾驶领域,国产替代仍未真正完成从无到有的第一阶段,也没有已经实现大批量落地的大算力芯片产品,国产化选择仍十分有限。“新战场玩家格局未定,H30入局为时不晚。”吴强说。
在吴强看来,面对如今的新战场,本土玩家提高智驾芯片国产化率的破局关键在于两点,一是芯片实际应用性能要迅速达到国际巨头的L2++水平;二是软件供应链一定要便捷易用,让客户实现快速迁移。
沿着这条玩家蜂拥而至的赛道,吴强自信满满,因为后摩智能选择了一条与众不同的技术路线,也就是其最大的技术底牌——存算一体。实际上对传统架构来说,存算一体是一个新的、互补的技术路线,能够在制造工艺和供应链安全需求越来越严格的后摩尔时代,实现独特的技术优势。
随着AI计算的不断演进,未来大算力AI应用将面临两个核心问题,一是数据带宽的瓶颈,二是功耗问题。正如前文所说,存算一体能从底层架构解决传统冯·诺伊曼架构越来越凸显的存储墙问题,打破能效瓶颈。
打个比方,芯片就好比一个巨大的工厂,它在执行每一次运算任务时,都需要将数据从存储器搬离,通过总线数据传输通道运送到处理器,待加工完毕后再搬运回存储器。这意味着,芯片的处理速度与总线速度息息相关,一旦需要处理的数据量越来越大,计算效率将会受到制约。
存算一体的核心就是将存储和计算紧密结合,以降低数据在两者之间频繁搬运导致的能耗和延迟,显著提升芯片能效,实现更高的计算效率。
但这条路并不好走。吴强直言,在H30诞生之前,后摩智能内部做了大量的测试验证,“两年来我们淌过了许多坑,不断把技术升级迭代,才向客户交了第一份答卷。”
从结果来看,H30的诞生背后实现了六大技术突破,即大算力、全精度、低功耗、车规级、可量产、通用性。
后摩智能联合创始人兼研发副总裁陈亮提到,在存储介质方面,H30基于SRAM,采用数字存算一体架构,可拥有更低的访存功耗和超高计算密度。同时在Int8精度下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上。
面对严苛的车规级要求,后摩智能还自主研发了硬件增强机制和检测机制,在提升H30可靠性的同时,进一步保障功能安全性。
为了充分发挥存算一体的高计算效率,后摩智能面向智能驾驶场景自主研发了第一代 IPU(处理器架构)——天枢架构,采用大布局设计保障计算资源的利用效率,以多核/多硬件线程的方式灵活扩展算力,H30在实现2倍性能提升且同时降低50%功耗的优势正得益于此。
陈亮透露,目前第二代天璇架构已在研发中,将采用Mesh互联结构,可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,将面向成本和功耗敏感的智能终端、大模型等场景。第三代天玑架构已开始规划,面向万物智能。
03. 智驾芯片落地之后,存算一体向明天加速快跑
正如中国电动汽车百人会副理事长兼秘书长张永伟在后摩智能首款存算一体智驾芯片发布会上所说,2023年中国汽车芯片市场正处于规模化上量期,预计芯片需求量约为1000亿颗左右,同时当前全球供应链形势也为国产汽车芯片提供了难得的发展机遇和时间窗口。
“中国超大规模市场为每个技术路线都提供了电动化的发展空间,芯片的发展亦是如此。”张永伟说,存算一体技术不仅能摆脱先进制程的供应风险,也推动着国内玩家通过多种技术路径进行国产化布局,进一步提升供应链的韧性和安全。
而在激烈的全球化竞赛中,落地是检验产品性能的唯一标准。
现阶段,H30的商业落地主要面向商用车和乘用车两大场景。后摩智能联合创始人、产品副总裁信晓旭透露, 目前公司基于H30已成功运行常用的经典CV网络和多种自动驾驶先进网络,包括当前业内最受关注的BEV网络模型,以及广泛应用于高阶辅助驾驶领域的Pointpillar网络模型。
以H30打造的智能驾驶解决方案,如今已经在合作伙伴的无人小车上完成部署,“这是业界第一次基于存算一体架构芯片成功运行端到端的智能驾驶技术栈。”信晓旭说。
不仅如此,H30将于6月份开始给Alpha客户送测。同时,后摩智能第二代产品鸿途H50已经在全力研发中,预计将于2024年推出,支持客户2025年的量产车型。
“L2++是全自动驾驶的必经阶段,但一定不会是终点。”谈及未来,吴强坚定地告诉36氪。他认为,全自动驾驶一定会通过L2++的不断普及,收集更多数据,从而反哺L3、L4技术的发展和普及,逐渐真正地把人们从繁重的场景中解放出来,去发挥更大价值。
基于此,后摩智能未来产品迭代的路径和方向也逐渐明晰。首先是算力维度,将往更高算力和能效发展;其次是产品的丰富度和集成度,会逐渐覆盖更多算力价值之外的场景。
“专注在中大算力场景,我们还会针对不同车型和对成本的考量,推出更丰富的产品系列,以满足不同类型客户对性价比的需求。”吴强说。
回归到技术本身,若将万物智能发展的时间轴进一步拉长,其实智驾芯片并不是后摩智能技术落地的唯一载体。这就意味着,未来的后摩智能,也将在智驾芯片之外的赛道实现多点开花,而这一切的根基,离不开多年来后摩智能对存算一体技术的打磨、积累与创新。
历经50余年发展,存算一体已走到正式爆发的前夜。鸿途™H30的亮相,正式开启了国内存算一体大算力AI芯片商用落地的新阶段。而它的诞生犹如蝴蝶振翅,其每一步技术创新、每一环生态布局,都将与行业玩家们一同推动着未来走向万物智能真正来临的那一天。