7月6日消息,美国劳伦斯利弗莫尔国家实验室于当地时间周三宣布,它已经开始安装即将具备超过2ExaFLOPS(2百亿亿次)性能的El Capitan 超级计算机,该超级计算机预计将于2024年某个时间正式上线。该系统的采用了AMD最新发布的 Instinct MI300 加速处理单元。
据介绍,El Capitan超级计算机将会有很多个节点,每个节点都会配备多块 MI300 APU,将安装在新款SH5插座(LGA 6096)上。
结合此前AMD公布的信息来看,El Capitan超级计算机应该是采用的是AMD MI300系列当中的MI300A APU,基于Chiplet设计,内部拥有多达13个小芯片,均基于台积电5nm或6nm制程工艺(CPU/GPU计算核心为5nm,HBM内存和I/O等为6nm),其中许多是 3D 堆叠的,以便创建一个面积可控的单芯片封装,总共集成1460 亿个晶体管。
具体来说,MI300A与上一代的MI250X一脉相承,采用新一代的CDNA 3 GPU架构,并集成了24个Zen 4 CPU内核,配置了128GB的HBM3内存。从芯片的照片上我们可以看到,MI300A的计算核心被 8 个HBM3内存包围,单个HBM3的带宽为6.3GB/s,八个16GB堆栈形成128GB统一内存,带宽高达5.2 TB/s。
据了解,AMD 几个月来一直在内部测试其 MI300A 处理器,并已经开始小批量出货。根据美国劳伦斯利弗莫尔国家实验室公布的照片显示,该实验室的工程师已经安装了相当多的服务器。而为了确保软硬件运作正常,El Capitan大概在一年前已经进行了第一阶段的安装工作。
美国劳伦斯利弗莫尔国家实验室在推文中写道 :“我们已经开始接收并安装 El Capitan 的组件,首先是百亿亿级超算。” “虽然我们距离 2024 年将其部署用于国家安全目的还有很长的路要走,但看到多年的工作变成现实令人兴奋。”
与另外两个具备每秒百亿亿次计算能力的超级计算机 Frontier 和 Aurora 一样,El Capitan 基于 HPE 的 Shasta 超级计算机架构,因此由 HP Enterprise 构建。该机器预计将在 2024 年中期完工,届时将提供高于 2 ExaFLOPS 的性能。
值得注意的是,目前世界第一的超级计算机是隶属于美国能源部橡树岭国家实验室的“Frontier”,最大性能每秒1.19百亿亿次浮点计算,峰值性能可达1.68百亿亿次,其采用的是正是AMD EPYC 7A53 64核心处理器,以及Instinct MI250X GPU加速器。
但是,在今年6月22日,英特尔(Intel)官方宣布,美国能源部阿贡国家实验室已经完成基于英特尔Xeon MAX CPU及MAX GPU的新一代超算“Aurora”的安装工作,今年晚些时候上线后将提供超过2 ExaFLOPS(2百亿亿次计算每秒)的FP64浮点性能,将超越隶属于美国能源部橡树岭国家实验室的“Frontier”,有望成为全球第一台理论峰值性能超过2 ExaFLOPS的超级计算机。
作为同样具备超过2ExaFLOPS性能的超级计算机,Aurora明显是领先于El Capitan,至于谁的性能更强,恐怕要等到2025年上半年的全球超算500榜单才能揭晓了。
编辑:芯智讯-浪客剑