搜索
NFT元宇宙Web3
近期热门

重夺全球超算第一!人类实现百亿亿次E级超算,Frontier屠榜全球Top500

Founder

太长不看系列:

  • Frontier:突破百亿亿次

那么,Frontier的性能到底达到了怎样‘逆天’的程度呢?简单来说,就是把排在它之后的468个超算的算力加起来,都比不过一个Frontier。除了如此炫目的算力之外,Frontier还是全球跑AI最快的超级电脑之一。在HPL-AI基准的混合精度性能测试中,Frontier跑出了6.88 ExaFlops的成绩。

用白话说,这个性能相当于,给一个860亿神经元组成的智能体中的每个神经元,每秒都下达6800万个指令。

用这个训练AI大模型,那可真是火箭发动机搭上了一级方程式赛车,可以直接在赛道上起飞。

科普版:

功能详解:

由AMD驱动的Frontier超级计算机现在是世界上第一台官方认可的超大规模超级计算机,在持续的Linpack运行中达到1.102 ExaFlop/s的最高水平,这在新发布的世界最快超级计算机Top500名单上排名第一,因为今年名单上由AMD驱动的系统的数量大幅增加。Frontier不仅超过了之前的领导者–日本的Fugaku,而且事实上,Frontier的速度比名单上接下来的七台超级计算机加起来还要快。值得注意的是,虽然Frontier在持续的Linpack FP64基准测试中达到了1.1 ExaFlops,但该系统的峰值性能高达1.69 ExaFlops,但在进行更多的调整后,还有空间达到2 ExaFlops。作为参考,一个ExaFlop等于每秒五亿次的浮点运算。

Frontier现在也是地球上最快的人工智能系统,在HPL-AI基准测试中提供了6.88 ExaFlops的混合精度性能。这相当于大脑中860亿个神经元中的每个神经元每秒发出6800万条指令,突出了巨大的计算能力。看来这个系统将与新近宣布的以人工智能为重点的超级计算机竞争人工智能领导地位,这些计算机由Nvidia基于Arm的Grace CPU超级芯片驱动。

此外,Frontier测试与开发(Crusher)系统也在绿色500强中排名第一,表示Frontier的架构现在也是世界上最省电的超级计算架构(主要的Frontier系统在Top500中排名第二)。在合格的基准运行中,整个系统每瓦可提供52.23GFlops,而消耗21.1MW(兆瓦)的电力。在峰值利用时,Frontier消耗29兆瓦。

Frontier超级计算机的庞大规模令人叹为观止,但这只是AMD在今年Top500榜单中取得的众多成就之一–由AMD EPYC驱动的系统现在在全球十大超级计算机中占了五个,在前二十个中占了十个。事实上,AMD的EPYC现在出现在全球Top500超级计算机中的94个,与2021年11月列出的73个系统和2021年6月列出的49个系统相比,标志着稳步增长。AMD还出现在今年榜单上超过一半的新系统中。正如你在上面所看到的,英特尔CPU仍然充斥着Top500中的大多数系统,而英伟达GPU也继续作为主导的加速器。

然而,就电源效率而言,AMD在最新的Green500榜单中占据了至高无上的地位–该公司为世界上最高效的四种系统提供动力,还拥有前十名中的八个和前20名中的17个位置。

Frontier超级计算机由HPE建造,安装在田纳西州能源部(DOE)的橡树岭国家实验室(ORNL)。该系统有9,408个计算节点,每个节点有一个64核AMD “Trento “CPU,搭配512GB DDR4内存和4个AMD Radeon Instinct MI250X GPU。这些节点分布在74个HPE Cray EX机柜中,每个机柜重达8,000磅。总的来说,该系统有602,112个CPU核心,与4.6PB的DDR4内存相联系。

此外,37,888个AMD MI250X GPU具有8,138,240个内核,并有4.6PB的HBM内存(每个GPU有128GB)。CPU和GPU使用基于以太网的HPE Cray Slingshot-11网络结构连接起来。整个系统使用直接水冷来控制热量,6000加仑的水由350马力的泵在系统中移动–这些泵可以在30分钟内填满一个奥林匹克大小的游泳池。系统中的水在温和的85度下运行,这有助于提高电力效率,因为该系统不使用冷却器来降低水温。

整个系统与一个性能惊人的存储子系统相连,该系统具有700PB的容量,75TB/s的吞吐量和150亿IOPS的性能。元数据层分布在480个NVMe SSD上,提供10PB的整体容量,而5400个NVMe SSD为主要的高速存储层提供11.5PB的容量。同时,47,700个PMR硬盘提供679PB的容量。

组装Frontier本身就是一个挑战,因为ORNL必须采购685个不同部件号的6000万个部件来建造这个系统。芯片短缺在建造过程中出现,影响了其中167个零件编号,因此ORNL发现自己缺少200万个零件。AMD公司也遇到了问题,因为其MI200 GPU的15个零件编号遇到了短缺。为了帮助规避短缺,ORNL与ASCR合作,为这些部件获得了国防优先权和分配系统(DPAS)评级,这意味着美国政府援引「国防法」来采购这些部件,因为Frontier对国防的重要性。

尽管该系统目前的峰值功率为29兆瓦,但Frontier的机械工厂可以冷却高达40兆瓦的计算功率,或相当于3万个美国家庭。该工厂可以扩展到70兆瓦,为未来的增长留下空间。

虽然Frontier被认为是世界上第一台被官方承认的Exascale超级计算机,但人们普遍认为中国有两台Exacscale超级计算机,即天河三号和海洋之光,它们在一年前打破了这个障碍。但这些系统还没有提交给Top500委员会。

就目前而言,Frontier正式成为世界上最快的超级计算机,也是第一个正式突破百亿亿次级的计算机。近乎神话般的、经常被推迟的由英特尔驱动的Aurora预计将在今年晚些时候或明年年初上线,其性能高达2 ExaFlops,可与Frontier相媲美,成为超级计算排名的榜首。

AMD的下一个目标是什么?El Capitan,一个2+ ExaFlop的机器,据说将在2023年上线。这台由Zen 4驱动的超级计算机将与由英特尔驱动的Aurora争夺Top500中最快超级计算机的称号。

编辑于 2022-06-01 01:00
「 真诚赞赏,手留余香 」
赞赏

发表评论已发布0

手机APP 意见反馈 返回顶部 返回底部