近日,在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,在Top10排名中,日本理化学研究所和富士通共同推进开发的超级计算机富岳(Fugaku)再次夺冠,第二和第三名均为美国的超级计算机,中国的神威·太湖之光超级计算机位列第4位,天河2A位列第6位。
与2020年11月份发布的第56版相比,Top10排名变化很小,只有一个新入围者,那就是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。该超级计算机基于HPE Cray“Shasta”平台和由GPU加速器和CPU节点组成的异构系统,实现了64.6 Pflop/s,它在新排名中位列第5。
尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。
首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMD EPYC 7763处理器,排在第6的Selene也采用了AMD EPYC 7742。
另一个是,近些年来,异构计算在超级计算机中使用越来越多,且大多数采用了NVIDIA的GPU或英特尔基于X86的Xeon Phi作为协处理器。在今年的TOP500中,共有145个系统采用了加速器/协同处理器技术,与第56版的147个相比,有所下降。其中有96个系统使用了NVIDIA Volta芯片,26个使用了NVIDIA Ampere芯片,9个使用了NVIDIA Pascal系统。
英特尔处理器在超级计算机中的份额仍然最高,为86.2%,但低于第56版的91.8%。此外,名单中有49个系统使用了AMD的处理器,高于之前的4.2%。
TOP500排名是针对全球已知最强大的电脑系统做出的排名,该计划始于1993年,并且一年出版两次最新的超级计算机排名表。每年的第一次排名公布于6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算机会议上。
TOP500的排名表是由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编的。
下面我们来看看这些超级计算机:
富岳
富岳(Fugaku)是由日本理化学研究所和富士通共同开发的超级计算机,是“京”的后继机型。它在2014年就开始研发,2021年正式激活。富岳部署在兵库县神户市中央区港湾人工岛上的理化学研究所计算科学研究中心内,其运算能力为京的100至120倍,耗电为30兆瓦至40兆瓦,京的耗电为12.7兆瓦。其实,“富岳”是富士山的别称。
富岳是全球首度夺冠的ARM架构超级电脑,采用富士通48核心A64FX SoC,与过往超级计算机大多采用的Intel或AMD的x86、x64主流平台不同。富岳拥有 7,630,848 个内核,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国Summit超级计算机的3倍。
恐怖的是其峰值性能可达到1 exaFLOPS(1,000 petaFLOPS)。而且它除了在Linpack中拿到好成绩,也在新的HPL-AI基准测试中获得了2 exaFLOPS的好成绩。
2020年6月23日,富岳正式获认证,以415 PFLOPS计算速度成为TOP500排名第一的超级计算机。之后同年11月17日发表的TOP 500排行榜成功蝉联第一。如今又再次夺冠。
Summit超级计算机
Summit超级计算机(中文有翻译顶点,或者高峰),实验室代号“OLCF-4”,是IBM为美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,2018年6月25日正式获TOP500认证为全球最快的超级计算机。随后被富岳超越。但仍然是美国最快的超计算机。
Summit在 HPL 基准测试中的性能为 148.8 Pflop/s,在全球排名第二。Summit 有 4,356 个节点,每个节点使用的是与泰坦类似的CPU GPU异构计算架构,包含两颗Power9 CPU(每颗CPU有 22个内核),以及6块NVIDIA Tesla V100 GPU组成。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。
Sierra超级计算机
Sierra,代号ATS-2,是IBM为美国能源部下属的劳伦斯利佛摩国家实验室建造的超级计算机,由美国国家核安全局管理,也是该局的第二套“先进技术系统”(Advanced Technology System,ATS),本机组与橡树岭国家实验室的高峰使用几乎相同的架构。
Sierra的运算节点采用IBM的Witherspoon S922LC OpenPOWER主机,每台主机中配备IBM POWER9 CPU配以NVIDIA Tesla V100运算加速卡,CPU和加速卡之间使用NVLink连接,每颗CPU配以两块运算加速卡,不过原始计划里是每颗CPU配以三块运算加速卡。节点之间的连接采用EDR InfiniBand。
神威·太湖之光超级计算机
神威·太湖之光超级计算机(Sunway TaihuLight)是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,搭载了40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1亿为1亿亿)
神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。
2020年7月,中国科大在“神威·太湖之光”上首次实现千万核心并行第一性原理计算模拟。
天河二号超级计算机
天河二号(简称:TH-2),是一组由国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继机型。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市的中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。
天河二号造价达一亿美元,整个系统占地面积达720平方米。它于2013年6月起至2016年6月之前,为世界上最快的超级计算机。目前,天河二号由国防科技大学和中山大学共同使用和维护。
天河二号的处理器是英特尔的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。
运算加速使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。
不过基于美国商务部限制中国超级计算机采购美国器件,我国在2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。
在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。
但在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。
,