换道抢跑,性能直逼英伟达


(资料图片仅供参考)

文|在洲

冷静,理性,且对芯片行业充满敬畏。

和后摩智能联合创始人、研发副总裁陈亮对话的一个小时的时间里,他少有情绪上的变化,不过每次谈及技术相关的话题,他总会加重语气,讲起来滔滔不绝,对芯片制造和设计问题如数家珍。

5月10日,是后摩智能成立两年来最重要的里程碑,公司研发两年的存算一体大算力AI芯片产品——鸿途H30亮相,“就像自己培养的孩子开始接受检验一样。”

鸿途H30是国内第一款量产存算一体智驾芯片,于行业来说,将多了一个底层架构完全不同的大算力AI芯片的选择,于后摩来说,公司第一款产品,终于等到推向市场的时刻。

存算一体的优势在于,打破了现代计算机技术中冯·诺伊曼架构的存储墙和能效墙的瓶颈,既存储数据也能处理数据,可以显著提升能效比,实现大算力、低功耗。而且存算一体芯片,不需要依赖先进制程工艺和封装技术,成本大大降低。

基于这种底层逻辑的创新,让鸿途H30有了和大厂产品掰手腕的底气。

从账面数据来看,这款后摩花两年打造的芯片足够惊艳。鸿途H30基于 SRAM 存储介质,最高物理算力可以达到256TOPS,典型功耗 35W,在 Int8 数据精度条件下,其 AI 核心IPU 能效比高达15Tops/W,是传统架构芯片的7倍以上。

鸿途H30还支持运行点云网络,以及BEV网络,能够支持 L2+ 到L4 级自动驾驶。此外,这颗芯片采用了更加灵活的散热方式,车企可以实现更低成本的部署,开源的通用计算平台,也大大降低了主机厂开发的成本,并缩短适配周期。

在陈亮看来,车企搭载存算一体芯片,无论耗费的时间还是资金,都是一笔非常划算的买卖。

作为公司首款产品,鸿途H30的重要性不言而喻,但面对如此重要的时间节点,陈亮并没有太大波动,“平常心就好”。

在他看来,举办产品发布会只是第一步,后面还有很多工作要做,比如要做到量产,要满足客户的要求,还要卡在6月节点送测等。

虽然存算一体芯片行业站在爆发前夜,但产业化尚处于起步阶段,无论是初期开发还是产业链上下游适配,都在摸着石头过河。

陈亮清楚,作为存算一体行业的先行者,前路定会荆棘遍布。“被别人赶超也是好事,即便我们这个公司做不成,做这件事的价值还是非常有意义。”

作为在芯片行业扎根十几年的老人,陈亮认定了公司选定的方向不会错。基于芯片底层技术创新,其存算一体产品在同样的性能下功耗会低很多,同样功耗下性能会高很多。即便行业处于拓荒阶段,陈亮仍然笃定地认为,存算一体将会是未来人工智能发展的必然方向。

“我们用两年时间做到了业界没有人做到过的事情,真心为公司每一个人感到骄傲。”

在后摩智能这家初创公司里,还有很多像陈亮这种对于技术有着极致追求的研发人员,他们在待遇和公司体量都稍逊的情况下,仍然选择了后摩智能。“看中的就是从底层做起,还拥有技术创新。”

陈亮本硕博毕业于清华大学,曾任海思CPU芯片资深架构师、地平线AI芯片首席架构师具备10余年高性能CPU/FPGA/ASIC芯片内核设计及量产经验,主导过多款AI芯片设计,拥有美国及中国芯片相关发明专利近20项。

站在2023年这个时间节点,即便一些自动驾驶解决方案供应商大打价格战,并把产品做到几千元的成本,陈亮也不担心鸿途H30的产品力,因为“不能只看价格,还要看价值。”

以下是猎云网与后摩智能联合创始人、研发副总裁陈亮的对话:(略经整理)

时机已成熟

Q:两年前为什么会选择加入后摩智能?

A:2021年初,吴强(后摩智能创始人兼CEO)给我打了一个电话,说可以一起做存算一体芯片,当知道了他的想法和对公司的战略时,我没有考虑太久,很快就选择加入进来。因为后摩智能创立之初就选择从底层做起,还有技术创新。

而且存算一体带来的技术和产品的优势,和智能驾驶的关键需求天然吻合,因为智能驾驶的终局是要替代人的驾驶,我们用传感器代替人的眼睛,用各式各样的算法填补人的意识和灵魂。底层的智能驾驶芯片又扮演着人类大脑的角色,所以从终局的角度来看,智能驾驶芯片一定要无限接近人大脑的行驶和效率。

Q:发布会现场,你说很多人选择后摩智能的时候,薪资不是重要的考量因素。

A:是的,我们团队每个人都在专心做好自己的事情,觉得我们做的事非常有价值,每个人在这里都可以充分发挥自己的积极性,表达自己的想法,团队每天都非常有活力,这是他们最看重的。

Q:可以介绍一下团队研发人员背景吗?

A:团队基本都是科班出身,既有来自英伟达、海思、高通、寒武纪等芯片企业,也有来自阿里巴巴、百度等科技公司,主要以具有存算一体领域原创科研能力的人为主。

Q:现在研发部门有多少人?

A:研发团队占公司人数一半以上,有百分之七八十都是研发人员。

Q:两年来最大的收获是什么?

A:最大的一个收获就是要考虑的事情确实是更多了,比如人的因素、产品、客户等各个方面要考虑的因素更多。而且要把一件事或者一个很好的想法变成现实,需要综合各个方面考虑,而不能是像一个工程师一样去处理,按照工程师的思维,没办法运营公司。

Q:接下来最重要的一件事是什么?

A:最重要的其实有两件事,一个是我们第一代芯片交付,第二件事就是第二代芯片的研发。

价值比价格更重要

Q:新产品发布之际,自己的心情如何,激动吗?

A:没有什么特别的心情,继续做该做的工作,激动也谈不上,因为后面还有很多工作要做,要量产、要给客户送测,然后产品很多功能都要做,平常心吧。

Q:目前这个产品节奏符合自己的预期吗?

A:基本符合,当然我们希望能够越快越好,不过我们的AI处理器以及存算电路等,完全都是自己做的,这就意味着需要比别人做更多的工作,也会更深1~2个层次,所以也不能着急。

Q:那你们接下来如何说服车企搭载自己的产品?

A:首先从产品角度来说,鸿途H30有着256T的AI物理算力,这么大的物理算力,在当前的国内AI芯片是第一个。它的典型功耗只有35W左右,能效是其他产品的几倍,是目前国内效率最高的大算力智能驾驶芯片。

而且35W是我们芯片和一个主控芯片,两个加起来的功耗,我们单个芯片的功耗其实只有20W到25W。

从开发的角度来说,存算一体技术是对开发者无侵入式的底层架构创新,从编程角度来看用户感知不到任何底层硬件的影响,再有我们也会做一些车规的认证,这方面也不存在障碍。

Q:不过现在自动驾驶行业其实非常内卷,一些自动驾驶解决方案供应商都在压低价格,很多成本都控制在了万元以内,你们怎么看?

A:芯片的价值不在于单颗芯片的价格,不在于说卖多少钱一片,而在于长期上带来的好处,单一价格不能等同于价值。如果真是在要问多少钱一片的话,同样的性能,我们芯片的面积比其他产品小三倍,就是在同样的性能条件下功耗更小,功耗小带来的是整个系统成本的降低,其中就包括散热成本。

我们下一代产品就会主打自然散热,不需要风冷或者散热这些配件,可以为主机厂节省更多的成本。所以真正有价值的东西,不用局限于单一价格的衡量标准,需要从整体来看。

Q:发布会当天你们宣布了一个彩蛋,说是要设计开源,具体开放了哪些能力?

A:我们计划的开放是非常底层的,未来会开放整个硬件的设计,然后配合我们的软件工具链,就可以把我们的硬件设计直接用在自己的产品中。

大家可以在我们网站上下载IPU设计资料,在此基础上就可以做PPA的评估,做软件算法的开发。我们希望有更多的人和组织能够参与进来,相信以大家的智慧可以更好的让这个方向落地,大家可以共建生态,最终让整个产业链受益。

Q:所以你们设计开源也有打造生态的考虑?

A:是的,首先我们还是把自己定位为Tier 2,我们所做得是最底层的通用计算平台,这个计算平台包括了硬件底层的操作系统,上层的应用算法都是交给客户或者合作伙伴去做。

我们的芯片采用HDPL语言编程,它是我们IPU架构的CUDA语言拓展,金融CUDA的前端语法和CUDA运行时,高效解决了数据并行问题,而且支持消息传递机制。我们的Tile内部是有异构的计算单元组成的,所以我们在核内采用异构的SIMD编程模型。

而在核间、Tile间都是同构的设计,所以采用CMT的编程模型。像一些底层复杂的机制,比如数据共享,消息传递等等,都被我们出色的软件工具链团队包装起来。大家只要使用我们的开发套件,使用一些非常简单的简洁易用的编程接口,就可以在我们的IPU上高效的开发自己的软件和算法。

不担心被赶超

Q:在创投圈一直有个说法,就是初创公司做的这件事,BBA做了怎么办?你们怎么看待这个问题?

A:所有的初创公司都会面临这个问题,但你看还是有很多公司会活下来。与其杞人忧天地揣测会不会被大厂超越,不如先关心自己怎么能把产品做得更好。

我们作为一家初创公司,选择了一个相对前沿的技术路径,就是要做出人无我有、人有我优的产品。做芯片不是一蹴而就的,从硬件到软件,每一个环节都依赖于有效打磨,其中的先发优势不仅在于时间和资源,更重要的是工程化验证的有效经验。

Q:存算一体虽然处于爆发阶段,但智驾芯片的同行者并不多,后摩作为第一个吃螃蟹的人,会不会担心被后来者赶超?

A:我觉得赶超也挺好的,存算一体这个赛道值得更多人加入,就算这个公司做不成,我们做这件事的价值也不会消失,无论我们最后能不能成功,对于行业来说都是具有意义的。

Q:开发第一款量产存算一体芯片,在设计过程中有没有遇到一些难题?

A:确实有好多问题都是之前没有遇到过的,比如去年,我们发现存算电路会在非常偶然的情况下会出现计算的错误,无论怎么做试验总是找不到原因。

这个问题不解决,不管是性能还是良率都会出现问题。最后我们都几乎绝望了,甚至怀疑是不是有三体人发射质子来封锁我们的科技。好在反复确认后,发现就是因为电路里一个小小的行为没有反映在行为模型里导致的。

Q:这也说明开发过程中会产生很多意想不到的问题,其实自动驾驶技术的发展迭代本就是发现问题解决问题的过程,你们又是如何在交付非常紧张的情况下,保持技术领先性和应用的?

A:从技术的角度领先性的角度来说,我们的设计本就比其他产品的更深至少1~2个层次。我们也在不断迭代电路,优化的过程没有止境的,即使是用同样的工艺,也可以不断优化。有专门的架构和算法的团队去做更前沿的设计和研究,我们基本上是在实施一代、设计一代,然后再预演下一代的节奏在跟进。

Q:对于自动驾驶芯片来说,产品亮相往往是第一步,接下来还有更大的门槛,比如交付的压力和工程化的问题,你们怎么去解决这些问题?

A:芯片良率问题我们已经解决了,我们的芯片没有良率很低的问题。我们也会尽全力配合客户做相应的适配工作。不过我们是做的通用的计算平台,设计更加开源,可以最大程度保持用户的开发习惯,所以和用户适配的周期更短,相应地,用户花费的时间和资金成本也会更低。

至于工程化的问题,我们从设计、封装到成品的流程已经走通了,没有什么障碍。

Q:在接下来和主机厂合作的过程中,如果遇到一些任务难以厘清,你们怎么办?

A:肯定会尽全力满足客户的需求,如果客户觉得应该这么做,我们尽量按照他们的方式去做适配,也会提供一些建议或参考,比如说我会告诉客户,这么用的话芯片效率可能会更高,当然,也会提供有Plan A、Plan B等多个版本供客户选择。

推荐内容