11月12日,在第三届“中国超级算力大会”上,2021年第二十届中国HPC TOP100排行榜和国际人工智能性能排行榜AIPerf500正式公布。从2020年开始,北京超级云计算中心(以下简称“北京超算”)已连续两年入围中国HPC TOP100,连续两次获得“通用CPU算力性能第一名”。同时在2021年AIPerf500榜单中,北京超算10套AI算力系统上榜,获得总量份额第一名。对于北京超算来说,如果说去年上榜并勇夺HPC TOP100排行榜第三是“破冰之旅”,那么今年再次上榜,同时斩获AIPerf500榜单上榜总量份额第一名,则是其硬核实力的充分彰显。在超算商业化的征途上,北京超算已经声名在外。

在与众多“超算国家队”高手硬碰硬的过程中,以北京超算为代表的“通用超算”新势力,羽翼渐丰,快速崛起。从中国HPC TOP100上榜机器的变化中可以看出,超算市场三分天下——尖端超算、通用超算、行业超算的趋势更加明朗。毋庸置疑,在算力经济时代,超算商业化是必由之路。今年成立十年的北京超算,以客户真实需求为导向,引领通用超算建设与服务新模式,以自负盈亏、实现盈利的突破之举,为超算商业化正名。

算力就是硬实力

曾几何时,我们今日所谈的“尖端超算”,被人们笼统地称之为“超算”。超算是大国重器,是体现国家综合科技实力的一个重要标志。因此,可以不计成本投入,可以不问商业转化,只要能够有效促进科研水平的提升,即达到了目的。业内人士耳熟能详的国家超级计算中心“八大金刚”正是在这一背景下建设和发展起来的。

进入数字经济时代,人们对于算力的渴求更加迫切,且无止境,不仅大型的科研项目、基因测序、地球物理勘探等传统领域需要超算,越来越常见的防范金融风险欺诈、电影动画渲染,甚至是为消费者行为画像,都希望可以借助超算的一臂之力。我们不禁要问,难道超算只能具备一种“尖端”之高冷范儿吗?还是可以真正“飞入寻常百姓家”,在商业化的道路上迎来飞驰人生?

计算、存储、网络等技术的突飞猛进,各行各业数字化转型步伐的加快,尤其是云计算的快速普及,以及人工智能的广泛应用,极大地促进了企业对算力的需求。也是从去年开始,尖端超算、通用超算、行业超算的超算市场细分,得到了越来越多的认同。特别是在投资建设和运营模式,以及针对的具体应用场景上,通用超算与尖端超算之间的界限越来越清晰。在国家超算“八大金刚”之外,像北京超算这样以规模化、商业化运营为特征的通用超算服务商开始崭露头角,并渐成气候。

尖端超算与通用超算的“分水岭”

北京超算珠玉在前,超算的商业化是可行的。

成立于2011年的北京超级云计算中心,由中国科学院和北京市政府共建成立,总部位于怀柔科学城,中心以市场化形式运营,运营公司为:北京北龙超级云计算有限责任公司,在中科院计算机网络信息中心和北京市怀柔区政府共同指导支持下,2017年进一步深化市场化改革,引入超算商业化运营公司并行科技。从2018年起,北京超算便实现了盈利,从此步入规模化商业运营的快车道。秉承以用户为中心的产品与服务理念,北京超算的性价比优势得以凸显——在相同IT支出的情况下,能够获得3倍的计算算力。而连续两年荣登中国HPC TOP100榜单,也从一个侧面反映出,北京超算选择的商业化运作道路是正确的。如今,北京超算服务的海量中小企业用户已达16万,年交易量突破10亿元。

超算商业化有需求,更有市场。算力是数字经济时代的重要支柱之一。据测算,全球算力需求每三四个月就会翻一倍;IDC预估,未来全球算力规模将以超过50%的速度增长,到2025年整体规模将达到3300EFlops;计算的需求正从信息领域快速向工业、农业、医疗、教育、交通等众多行业扩张……传统那种举国家之力,主要服务于科研的尖端超算资源和能力,面对广阔的商业化应用市场,总给人一种“有劲使不出”的感觉。如果将尖端超算模式平移至面向中小规模海量运算的通用和商业计算市场,确实有些大材小用。

尖端超算与通用超算的分水岭就在“万核”这个量级。万核以上的应用场景,是尖端超算的用武之地,而万核以下,特别是花样繁多的千核级别的应用,则是通用和商业计算要深入开拓和挖掘的市场。北京超算正是瞄准国内通用算力这一市场缺口,为通用超算市场的中小用户,包括科研、教育、中小企业等提供随需供应、不排队且省心省时的高品质超算服务。

北京超算的同与不同

随着超算的神秘面纱被逐层揭开,超算已成为更多大众化商业客户的新选择,再加上云服务模式的快速普及,让用户可以更方便、快捷地从云中获取超算资源,超算商业化的呼声越来越高涨。但是,想做通用超算市场“吃螃蟹的人”,不仅需要极大的勇气,更要具备硬实力和对路的战略及战术。

仍以北京超算为例,在成立之初的几年,它也是按照传统超算的思路在发展,其建设和运营模式与国家超算中心如出一辙。转折出现在2017年,随着应用需求不断扩大,国家超算中心这种模式不能快速、经济地满足外溢的市场需求。由地方政府与多元化商业资本支持的北京超算不能享受国家超算的既得红利,实现商业化运营,以盈利反哺和带动自身资源与能力的建设成了唯一选择。逼上梁山也好,主动出击也罢,结果是北京超算在超算商业化的赛道上率先冲了出来。

现在回过头来看,北京超算当初选择商业化这条道路并不是盲目的,而是经过深思熟虑、有的放矢。商业化最重要的——不仅要盈利,同时还要兼顾可持续发展,保证市场的健康生态。过去尖端超算的模式有点像是在象牙塔中,而对于通用超算来说,必须经历市场风雨的洗礼。在任何情况下,满足客户的需求才是第一位的。

在我们的印象中,超算中心似乎从来“不差钱”。最近两年,各地方动辄数十亿元甚至上百亿元投资建设超算中心的声音仍不绝于耳。这种情景似曾相识。几年前,云计算刚兴起时,各地的云计算中心也是大干快上,结果是许多大型云计算中心空置现象严重。现在,人们的心态越来越理智,云其实就是一种资源,一种灵活调配和使用的方式,而不是又一堆新的软硬件的堆砌。超算中心的建设与运营亦是如此,关键是机器的有效利用,即“机器里有真实用户”,并且可以为真实用户提供专业化、高品质的服务,而不是一味“砸钱”搭建超算硬件。

作为一项新的国家战略,“东数西算”的提出,让我们更加清醒地认识到,数据中心、超算中心的建设应该因地制宜,跟着客户的需求跑,而不是像原来那样,先造好房子,然后等着客户上门。

北京超算采用了集约化的建设与运营模式,并且能够针对不同类型客户的需求,有针对性地提供不同的资源配置与服务。举例来说,北京超算A分区的建设由北京超算根据市场需求决定,主要基于市场上已有的技术设备,减少了技术攻关的时间成本,有效缩短了建设周期,使相关资源能够更快投入市场。在2020年年中的一次扩容中,只用了5周时间便扩容1000个节点。特别值得一提的是,A分区建在宁夏,从自然资源、电力成本等角度分析,那里是超算中心的“天堂”。北京超算超前一步实现了“东数西算”。

根据不同客户的需求,北京超算可以提供不同的资源配置,比如A分区就非常适合计算物理第一性原理、气动分析等用户,而像天文的蒙特卡罗模拟这样的海量作业,则可以选择北京超算的M分区或T分区。面向AI领域的超高速增长GPU算力需求,北京超算“AI智算云”提供了丰富的GPU算力资源,可按客户需求扩容,为AI产业发展提供基础设施赋能。在面对客户时,北京超算说得最多的并不是中心的资源情况,而是为客户提供定制化、专业化服务的能力。这也是作为商业企业所必须具备的心态和能力。

俗话说,术业有专攻。“让专业的人做专业的事”这句话在北京超算的身上得到了充分体现。在启动商业化运营之初,北京超算就遇到了像并行科技这样专业的商业化运营公司,双方一拍即合。找准市场定位,从用户的实际需求出发,基于“超级云计算”模式,使用政府产业引导基金和社会资本,贷款建设超级计算资源,并由专业运营服务公司负责商业化运行,实现自负盈亏,并逐步形成良性发展的循环,北京超算在业界树立了一个可以借鉴的典型。对于已建好的超算资源,或者待建资源,可以交由专业运营服务公司来运营。这类似于顶级的五星级酒店,通常都是由专业的酒店运营公司代为运营,这更利于实现优势互补与成本效益最大化。

现在,将北京超算的成功经验在业界进行复制,不是可能或不可能的事,而是能够以多快的速度、在多大范围内进行复制。从超算运营商的角度,并行科技不仅助力北京超算高速发展,而且还以同样的方式支持了宁夏超算云、浙江云谷超级云计算中心等超算中心的商业化运营。既不用政府补贴,帮助各级政府和单位减少重复建设,又可以让投资的服务器利用率最大化,不浪费。在超算资源端和科研人员的使用端搭建桥梁,促进双边降本增效。此外,北京超算还与并行科技一起,共建产业生态和人才培养。通过“网络直播课”,以赛促学、以赛代练的“应用挑战赛”等丰富形式,为更多的科研人员提供了使用超算的专业指导和培训。在2021中国HPC TOP100榜单和国际人工智能性能排行榜AIPerf500中,北京超算与并行科技共亮出了5套超算设备和10套AI算力系统上榜的优异成绩。

十年磨一剑,北京超算堪称中国超算商业化的最佳范例。超算商业化的新征程已全面开启,未来已来,将至已至。海量商业客户将迎来超级算力爆发的红利。

推荐内容