近日,全球Top500组织在德国汉堡举行的国际超算大会(ISC 2024)上,正式发布了第63届全球超级计算机Top500榜单。其中,美国橡树岭国家实验室和AMD合作的Frontier以 1.206 EFlop/s的峰值性能排名第一,美国阿贡国家实验室和英特尔合作的Aurora则首次突破E级大关,以1.012 EFlop/s的峰值性能排名第二。中国的超算依旧是无缘前十,并且不再参与该HPL基准测试。
Frontier蝉联第一,Aurora排名第二
在Top500超算榜单中,前十大性能最强超级计算机的排名基本上与六个月前在SC23会议期间公布的排名保持一致。唯一的新进前10的超级计算机是来自瑞士国家超级计算中心(CSCS)的Alps machine,排名第6名位。
具体前十名单如下:
1、Frontier以 1.206 EFlop/s的HPL性能继续蝉联第一。该超算位于美国田纳西州的橡树岭国家实验室(ORNL),由美国能源部(DOE)运营。其采用了HPE Cray EX235a架构,2GHz AMD EPYC 64C CPU和AMD Instinct 250X GPU,共有8699904个CPU和GPU核心,并借助于Slingshot 11网络进行数据传输。此外,Frontier还具有高达52.59 GFlops/W的额定能效,
2、Aurora以1.012 Exaflop/s的HPL性能排名第二。相比去年首次上榜时(当时未全部安装完成)性能几乎翻了一倍。该超算安装在美国伊利诺伊州的阿贡国家实验室,也是由美国能源部运营。Aurora 基于HPE Cray EX网络,整合了21248个Intel Xeon Max系列CPU、63744个Intel Max系列GPU、20.42PB内存,峰值性能号称可达 2 EFlop / s,远超 Frontier。
3、Eagle以561.2PFlop/s的HPL性能排名第三。该超算安装在微软Azure云平台上,并且它依然是Top500超算中最高排名的云计算系统。这款微软NDv5系统的强大性能,源于英特尔Xeon Platinum 8480C处理器和英伟达(NVIDIA) H100 GPU加速器的结合。
4、Fugaku凭借其442 PFlop/s的HPL性能排名第四。该超算安装在日本神户的理研计算科学研究中心(R-CCS),基于 2.2GHz Fujitsu A64FX 48C处理器,Tofu interconnect D互联,共计拥有7630848个核心,继续保持了美国以外地区排名最高的超级计算机的地位。
5、LUMI以379.7 PFlop/s的HPL性能排名第五。该超算安装在芬兰CSC EuroHPC中心,是欧洲最强的超级计算机,其基于HPE Cray EX235a系统,AMD第三代EPYC 64C 2GHz处理器,AMD Instinct MI250X加速器,Slingshot-11网络、
6、Alps 以270 PFlop/s的HPL性能排名第六。该超算安装于瑞士国家超级计算中心 (CSCS),基于HPE Cray 254n系统构建的超算,3.1GHz NVIDIA Grace 72C处理器,NVIDIA GH200超级芯片,Slingshot-11网络互联。
7、Leonardo以241.2PFlop/s的HPL性能排名第七。该超算安装在意大利CINECA的EuroHPC,基于Atos BullSequana XH2000系统,由英特尔Xeon Platinum CPU和NVIDIA A100加速器提供强大的计算能力,还采用了四轨NVIDIA HDR100 Infiniband。
8、MareNostrum 5 ACC以175.3PFlop/s的HPL性能排名第八。该超算安装在西班牙的EuroHPC/巴塞罗那超级计算中心,基于BullSequana XH3000系统,采用了英特尔Xeon Platinum 8460Y处理器、NVIDIA H100加速器以及Infiniband NDR200网络连接技术。
9、Summit以148.6PFlop/s的HPL性能排名第九。该超算是IBM公司在美国橡树岭国家实验室建造的超级计算机,拥有4356个节点,每个节点配备了两个22核的3.07GHz IBM POWER9 CPU和六个NVIDIA Tesla V100 GPU,每个GPU上集成了80个流式处理器(SM)。
10、Eos以121.4PFlop/s的HPL性能排名第十。该超算是英伟达内部使用的 DGX SuperPOD,由Xeon Platinum 8480C 56C 3.8GHz,NVIDIA H100加速器共同驱动,还采用了英伟达Infiniband NDR 400G交换机。
对于排名第二的Aurora超算实际测试性能仅1.012 ExaFlop/s,远低于号称性能最高可达2 EFlop/s的问题,阿贡国家实验室的副主任兼杰出研究员Rick Stevens表示,2 exaFLOPS这一数值是基于Aurora核心处理器数量与处理器峰值性能相乘得出的理论峰值,但这并非负责维护和运营Aurora的阿贡系统经理所设定的实际性能目标或期望。
Stevens解释说:“峰值性能是一个通过计算得出的理论数字,它基于时钟速率与单个计算元件运算次数的乘积。实际上,典型的系统只能达到这个峰值的一小部分,这取决于它们所执行的任务,通常在50%、60%或70%之间。Aurora上标称的2 exaFlop/s峰值实际上是结合了GPU和CPU的FLOPS得出的。在基准测试中,通常不会这样做。如果查看Top500榜单中其他类似的系统,就会发现它们同样拥有非常大的理论峰值,但实际达到的峰值比例与Aurora类似。因此,这并不是一个根本性的问题。”
Stevens表示,Aurora在基准测试中应该能够实现LINPACK性能的提升,因为在最近的基准测试执行时,Aurora的11%计算能力尚未被激活。他预测,当整个系统安装完成之后,将会产生更高的基准测试数据。然而,他拒绝透露阿贡国家实验室对于Aurora在完全运行状态下的具体性能目标数字。
根据HPC-AI行业分析机构Hyperion Research公司的首席执行官Earl Joseph的预计,随着时间的推移和系统的进一步调优,Aurora最终将会超过1.5 exaFlop/s。
中国不再参加Top500的HPL基准测试
在中国的国家级超算去年跌出Top500榜单前十之后,依然无缘于最新的前十榜单。在去年的榜单上,中国的神威·太湖之光和天河二号A也进入了前十五,分别排名第11和第14位。
Top500组织在最新发布的报告中指出,中国已决定不再参加Top500的HPL基准测试。
在最新的Top500名单中,美国依然是拥有超级计算机数量最多的国家。美国在其之前的基础上新增了7台超级计算机,使得其总数达到了168台。而中国则从104台减少到了80台。
Top500组织表示,“事实上,中国在这份新名单上并未报告任何新加入的超级计算机。”
从大的区域变化来看,北美地区依然保持领先地位,从上一份榜单的160台系统增加到171台。而亚洲地区则出现了下滑,从169台系统减少到148台。与此同时,欧洲地区实现了显著的增长,从143台增加到160台,位列北美地区之后,成为了全球第二大超级计算机分布区域。
英特尔拿下63%的处理器份额
从核心数量来看,TOP500超算的平均并发级别达到了每个系统229426个内核,高于六个月前的212027个。
今年的超级计算机Green500榜单也有了显著的变化,前三名的绿色超级计算机均为新上榜者。
排名第一的是JEDI–JUPITER Exascale Development Instrument,这台超级计算机由德国的EuroHPC/FZJ开发。在TOP500超级计算机排名中,JEDI位列第190位,展现出了不俗的性能实力。其能效评级高达72.73GFlop/W,HPL得分为4.5 PFlop/s。JEDI是一款配备NVIDIA Grace Hopper Superchip 72C的BullSequana XH3000架构的超级计算,总共有19584个核心处理器。
英国布里斯托尔大学的Isambard-AI以68.83 GFlop/W能效评级和7.42 PFLop/s的HPL得分位居第二。Isambard-AI在TOP500中排名第129位,拥有34,272个核心处理器。
排名第三的是来自波兰Cyfronet的Helios system。该机器的能效得分为66.95GFlop/W HPL得分为19.14 PFlop/s。
Top500组织在讨论能源效率时,还特别提到了Top500榜单第一的Frontier系统。Frontier系统取得了1.206EFlop/s的HPL成绩,这一成绩证明了其优秀的计算能力。同时,Frontier在能源效率方面也表现出色,获得了56.97GFlop/W的分数。这使得Frontier在Green500榜单中排名第11。
编辑:芯智讯-浪客剑