(资料图片仅供参考)
8月30日,阿里云宣布正式启动张北超级智算中心,总建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心,可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供强大的智能算力服务。
该智算中心由飞天智算平台支撑建设,以先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
同期,阿里云正式对外开放这座超级智算中心的技术底座“飞天智算平台”,可通过公共云和专有云的模式服务于各类企业机构,并同步启动另一座位于乌兰察布的智算中心,建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力。
两座超级智算中心能够实现规模和效率的突破,是自大数据AI一体化平台到算力基础设施体系化技术创新的结果。传统智算中心达到一定规模之后,增加算力资源反而会降低算力输出的能力。阿里云通过体系化的核心技术自研,改变了智能计算的损耗难题。
例如,在通信技术上,阿里云采用高性能自研Solar-RDMA网络,实现端对端最低2微秒延迟,配合阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。同时,自然风冷、液冷等绿色技术的应用,让智算中心的能耗降低,PUE最低可达1.09。
据介绍,这两座超大规模的智算中心正在服务于AI大模型训练、遥感探测、数字人、自动驾驶、生命科学、新药研发、元宇宙等前沿智能应用。其中,小鹏汽车基于飞天智算将自动驾驶模型训练提速近170倍。深势科技采用飞天智算让分子动力学仿真模拟训练效率提升了5倍。