3.6万CPU核心、1550万GPU核心:AMD+NVIDIA打造世界第一AI超算
为了冲击百亿亿次计算,美国官方准备了三套不同系统,分别由intel、amd、amd+nvidia联合打造。现在看起来,amd+nvidia的联合方案进展最快。
这套名为“polaris”(北极星)的超算,隶属于美国能源部阿贡国家实验室alcf(阿贡领先计算设施),主要为用户的算法和科学领域的超级规模的研究和探索提供支持,并对学术界、*机构、行业研究人员开放使用。
它基于cray slingshot 10高性能可扩展互连架构,惠与(hpe)负责建造,共有560个节点,每个节点配备两颗amd epyc 7532处理器、四块nvidia a100计算卡,合计1120颗处理器、2240块计算卡。
epyc 7532拥有32核心64线程(zen2机构),a100计算卡则有6912个cuda核心(ampere架构),因此这套超算总共有多达35840个cpu核心、15482880个gpu核心,只是不知道a100这里的显存是40gb还是80gb。
整套系统的fp64双精度浮点峰值性能将达44pflops(44千万亿次每秒),在当今全球超算top500榜单上可以排在第十位。
不过,它的理论ai性能可以高达惊人的1.4eflops(140亿亿次每秒),通过处理数据密集型和ai高性能计算工作负载,将模拟和机器学习相结合。
polaris超算将在今年年内上线,明年3月份升级为slingshot 11架构,处理器更换为zen3架构的epyc 7543,仍是32核心,但性能将再上一个台阶。
amd为美国能源部橡树岭国家实验室(ornl)打造的百亿亿次超算名为“frontier”,配备zen4架构下代epyc处理器、instinct计算卡,合同价值6亿美元。
intel中标的超算名为“aurora”,基于其下代sapphire rapids至强处理器、xe hpc ponte vecchio计算卡。
不过,amd、intel的新平台都尚未发布,大部分都要到明年才会完成,超算系统也顺应延期,预计会在2022-2023年才会陆续上线。
- the end -
转载请注明出处:快科技