欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

全球超算TOP500新榜单:日本蝉联第一、中国屈居第四

程序员文章站 2022-07-08 15:06:27
本文经授权转载,其它媒体转载请经超能网同意top500官方公布了第56期榜单,日本的fugaku超算巩固了在榜单中第一的地位,也反映出榜单上性能增长曲线趋于平缓。虽然有两个新系统成功进入前十名,但整个...

本文经授权转载,其它媒体转载请经超能网同意

top500官方公布了第56期榜单,日本的fugaku超算巩固了在榜单中第一的地位,也反映出榜单上性能增长曲线趋于平缓。虽然有两个新系统成功进入前十名,但整个榜单录得的新入榜数量是自1993年该项目开始以来最少的。

在高性能linpack(hpl)基准里,榜单的入围门槛上升至1.32 petaflops,与2020年6月排名中记录的1.23  petaflops相比有小幅增长。

top500的总性能也从6月的2.22 exaflops增长到最新榜单上的2.43  exaflops。但每个系统的平均性能几乎没有任何增长,从6个月前的145,363个核心增长到当前榜单中的145,465个核心。

不过前十名中也有一些显著的进展,包括两个新系统,以及排名第一的fugaku超级计算机创下的新高。

得益于这段时间内添加的新硬件,fugaku将其hpl性能增长到442 petaflops,与该系统在2020年6月首次亮相时的416  petaflops相比,有小幅增长。

更重要的是,fugaku将其混合精度hpc-ai基准上的性能提高到2.0 exaflops,优于其六个月前1.4 exaflops的记录。这代表着在任何类型的硬件上,对任何精度的基准测量值首次超过1 exaflops。

全球超算TOP500新榜单:日本蝉联第一、中国屈居第四

top500前十名:

1、fugaku,由富士通建造,安装在日本神户的riken计算科学中心(r-ccs)。拥有442 petaflops的新世界纪录。这使其领先榜单中排名第二的系统三倍。

2、summit,是ibm在田纳西州橡树岭国家实验室(ornl)建造的系统,以148.8  petaflops的性能保持着美国最快的系统。拥有4356个节点,每个节点都容纳了两个22核power9 cpu和6个nvidia tesla v100 gpu。

3、位于加利福尼亚州劳伦斯-利弗莫尔国家实验室的系统sierra,以94.6  petaflops的hpl排名第三。其架构与summit非常相似,其4320个节点中的每个节点都配备了两颗power9 cpu和四颗nvidia tesla v100 gpu。

4、由中国国家并行计算机工程与技术研究中心(nrcpc)开发并安装在无锡国家超级计算中心的神威太湖之光位列第四,它完全采用了sunway sw26010处理器,在hpl上实现了93 petaflops。

5、selene,它是nvidia公司内部安装的nvidia dgx a100 superpod。在6月份的时候是第七名,但现在规模已经翻了一番,使得它的排名上升了两位。该系统基于amd epyc处理器,采用英伟达新的a100 gpu进行加速。由于升级,selene在hpl上实现了63.4 petaflops。

6、天河-2a(milky way-2a),由中国国防科技大学开发的系统,部署在广州的国家超级计算机中心,排名第六。它采用英特尔xeon cpu和nudt的matrix-2000 dsp加速器,在hpl上达到61.4 petaflops。

7、新上榜的juwels booster module,位列榜单第七。阿托斯制造的bullsequana机器最近安装在德国forschungszentrum jülich(fzj)。它是模块化系统架构的一部分,第二款基于xeon的juwels模块单独列在top500的第44位。这些模块通过使用partec modulo集群软件套件进行集成。增压模块使用amd epyc处理器与nvidia a100 gpu进行加速,与排名第5的selene系统类似。juwels booster module单独运行时能够达到44.1 hpl petaflops,这使其成为欧洲最强大的系统。

8、意大利eni s.p.a.公司安装的戴尔poweredge系统hpc5排名第八,使用了英特尔xeon gold cpu和nvidia tesla v100 gpu,性能达到35.5 petaflops。在榜单上用于商业用途的系统里,以这台性能最为强大。

9、安装在德克萨斯大学德克萨斯高级计算中心的戴尔c6420系统frontera现在列在第九位,它使用其448,448个英特尔platinum xeon核心,实现了23.5 petaflops。

10、排名第十的dammam-7安装在沙特阿拉伯的沙特阿美公司,是目前前十名中的第二台商用超级计算机,也是前十里第二台新上榜的机器。hpe cray cs-storm系统采用英特尔xeon gold cpu和nvidia tesla v100 gpu。它在hpl基准上达到了22.4 petaflops。

green500的情况:

1、最节能的系统是美国nvidia新推出的dgx superpod。它在2.4 hpl性能运行期间取得了26.2 gigaflops/watt的能效,功耗为38mw(忽略扩展所需的额外硬件),位列top500的第172位。

2、虽然上届green500冠军mn-3的得分从21.1提高到了26.0 gigaflops/watt,但却滑落到了第二名的位置。该系统采用mn-core芯片,这是一款针对矩阵运算进行优化的加速器。它在top500中排名第332位。

3、安装在德国forschungszentrum jülich(fzj),它实现了25.0 gigaflops/watt,在top500中排名第七。

4、阿托斯制造的另一台机器spartan-2。它在hpl上实现了24.3 gigaflops/watt,在top500榜单中排名第148位。

5、selene,效率为24.0 gigaflops/watt。它也占据了top500榜单的第五位。

6、除mn-3系统外,其余排名前五的green500系统均采用了全新的nvidia a100 gpu作为加速器,同时这四款系统均采用amd epyc作为主cpu。

7、在green500排名前40的系统中,有37个系统利用了加速卡,2个系统使用了a64fx矢量处理器,1个系统(神威太湖之光)是申威多核处理器。

top500其他一些数据:

1、共有149个系统使用加速卡/协从处理器技术,比6个月前的146个有所增加,其中140个采用了nvidia芯片。

2、intel继续在top500的处理器份额中占据主导地位,超过90%的系统配备了xeon或xeon phi芯片。尽管最近高性能计算领域的替代处理器架构兴起,但amd处理器(包括中国海光的芯片)在目前的榜单中仅占21个系统,还有10个基于power架构的系统和5个基于arm架构的系统。不过,采用基于amd处理器的系统数量比半年前增加了一倍。

3、系统互连的分类基本没有变化,大约一半的系统(254个)使用以太网,大约三分之一的系统(182个)使用infiniband,大约十分之一的系统(47个)使用omnipath,一个系统使用myrinet;其余的系统使用定制互连(38个)和专有网络(6个)。在总容量方面,infiniband连接的系统仍然占主导地位,其性能超过1个exaflops。由于fugaku使用专有的tofo d互连,6个专有网络系统的总性能(472.9 petaflops)几乎与254个基于以太网的系统(477.7 petaflops)相当。  

4、中国以212台机器上榜,继续在系统占有率上领先,轻松击败美国的113台,和日本的34台。尽管系统数量较少,美国仍以668.7 petaflops的总性能领先于中国的564.0 petaflops。得益于排名第一的fugaku系统,日本593.7 petaflops的总性能超过了中国。

全球超算TOP500新榜单:日本蝉联第一、中国屈居第四

- the end -