欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

挑战神威太湖之光 日本超算有什么独到之处?

程序员文章站 2022-03-08 12:46:03
在中国神威太湖之光率先将性能冲到100p后,日本也按捺不住了,日本富士通发布了要建1000p超算的ppt,而且还引arm为外援。也许有人会问,能成么? 其实,日本在超...

在中国神威太湖之光率先将性能冲到100p后,日本也按捺不住了,日本富士通发布了要建1000p超算的ppt,而且还引arm为外援。也许有人会问,能成么?

其实,日本在超算上的技术实力并不差,而且还曾经有过京这样曾经雄踞top500榜首的大机器,虽然在top500上被后来者超越,但在graph500上依旧雄踞榜首。只是日本经济持续低迷和时运不济,日本超算逐步被中国和美国拉出了距离。

日本超算京才是世界第一?

就在神威太湖之光在top500荣登榜首之际,日本经济新闻报道,“神威太湖之光虽然排名比较靠前,但其适合的领域有限,对于用户而言是比较难用的机器”,日本很多相关人士表示,“超级计算机要有用才行”。

日本东京工业大学教授松冈聪说——

“京与神威背后的设计思想有很大的不同,京是通过扩充海量内存,可广泛应对各种现实运算的超级计算机。在500强中速度虽然仅为神威的九分之一,但京即使面对复杂的运算也不容易减速。神威虽然排名比较靠前,但被认为其适合的领域有限。松冈表示神威对于用户而言是比较难用的机器,这点不可否认。”

 为此,笔者咨询了业内专家,他认为松冈说的有一定道理,并表态:“客观地说,如果我自己出钱买的话,我选择京”。

也有业内专家表示——

“毕竟异构众核是大趋势......从计算性能上看,神威太湖之光依然是世界第一”

京有什么独到之处?

虽然京在linpack性能上大约是神威太湖之光的九分之一,尽管日本目前并没有建设出能与天河2号、神威太湖之光相匹敌的超算,但就京本身而言,还是有其独到之处的。

2016年7月,在graph500排行榜上,京连续第三次夺得冠军。在测试中京用0.45秒时间成功解开了由大约1万亿个根节点及16万亿个分支节点组成的大规模图表广度优先搜索问题。基准测试得分为38621gteps。排名第二的是中国的神威太湖之光,成绩为23756gteps;排名第三的是美国的红杉,为23751gteps,排名第四的是美国米拉,14982gteps。什么是graph500呢?其实,除了强调linpack性能的top500,还有强调内存带宽和延迟的graph500,和强调节能环保的green500。

graph500对全系统的内存带宽和内存延迟有很高的要求,而计算能力本身已经不影响测试结果了,这种测试偏向于访存密集型运算,在大数据分析以及大规模图表分析等场景下比较有意义。

近年来,有观点认为linpack测试已经过时了,top500创始人之一的田纳西大学教授jack dongarra就提出了hpcg测试,与linpack关注线性方程的计算性能不同,hpcg更加看中整体性能的平衡,能代表了共轭梯度迭代法的一类应用的计算和通信特征,但也仅仅代表了某一个方面的特征,并不能涵盖超算的所以特征。如果计算性能和通信不是一个量级的,即便两项指标分开看都很强,但也会导致hpcg偏低的结果。截至目前,hpcg还没有被业界广泛接受。

在hpcg测试中,京的表现也不错,仅次于天河2号,成绩为554.4tflops,天河2号的成绩为580tlfops,位列第三的神威太湖之光hpcg性能是371.2tflops。如果用代表运算实际效率的hpcg/hpl这项指标看,天河2号的hpcg/hpl参数为1.1%,神威太湖之光的hpcg/hpl参数为0.4%,而京的hpcg/hpl参数为4.9%。hpcg更看重综合性能,要求计算性能、内存带宽、延迟等指标兼顾,一旦出现某项性能特别强的情况,也就是出现偏科的情况,即便几项指标都不差,也会出现hpcg运算速度偏低的情况。

计算和通信的不平衡导致hpcg/hpl偏低

神威太湖之光hpcg/hpl偏低的原因就在于计算性能和通信等要素之间的不平衡程度较高——神威太湖之光之所以能在top500排名第一、green500排名第三、在linpack浮点性能93pflops、linpack效率高达74.16%的情况下,性能功耗比达到6g/w,做到了兼顾计算性能和节能环保,而且这还是在处理器的制造工艺落后intel两代,采用28nm制造工艺的情况下做到的。

原因就在于借助大量处理器并行来提高运算速度,同时通过降低耗电极大的存储器性能来削减能耗,这会加重综合性能上的不平衡——这种不平衡并非是计算性能差,或者互联网络差——在计算性能上神威太湖之光是*的,在互联网络方面,神威太湖之光只是主流水平,还称不上*的互联网络正是因为计算和通信上的不平衡,导致神威太湖之光hpcg/hpl参数偏低。

而京在这项参数上之所以高,就是因为虽然在计算性能和通信并非*水平,但因为计算性能和通信属于一个量级,加上属于同构超算的因素,所以hpcg/hpl参数会比较高。

这两个测试的意义在于说明了京的易用性较好,而且通过扩充海量内存,可广泛应对各种现实运算,具有较广的应用面,而且在计算性能和通信上做的非常均衡。相比之下,神威太湖之光就属于各方面性能都不错,但计算性能特别强悍的类型,在均衡性上是不如京的。但这并不意味着神威太湖之光就不如一台几年前的大机器,实际上,在绝对性能和在神威太湖之光所擅长的应用上,京是无法企及的。

日本下一代超算会是什么样?

在德国法兰克福举办的国际超级计算机大会上,日本富士通公司透露它的下一代超级电脑post-k将使用armv8 架构,根据富士通公布的计划post-k计划在2020年推出,计划应用性能是k的100倍,也就是性能将达到1000 pflops,换言之就是神威太湖之光性能的10倍。

另外,富士通还公布了可以用于建设100p超算的技术储备——sparc64 xifx处理器,该款处理器有32个核心用于计算,2核心用于运行os服务,有点类似于bluegene/q,采用20nm制造工艺,双精浮点性能超过1tflops。至于日本能不能将技术图纸变成现实,只能有时间来检验了。

挑战神威太湖之光 日本超算有什么独到之处?