Tesla P100怎么样?NVIDIA Tesla P100计算卡性能首发评测
nvidia在之前的gtc大会上正式发布了全新一代的计算卡tesla p100,这也是世界上首款采用pascal架构的计算卡,那么对于这么一块计算卡来说,它的性能如何呢?下面就详情来看看相关评测吧!
gtx 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是*大核心gp100,拥有3840个fp32单精度、1920个fp64双精度cuda核心,主要面向高性能计算领域。
担任首发的tesla p100(似乎也叫tesla p1),只开启了3584个单精度、1792个双精度核心,即便如此单、双精度浮点性能也高达10.6tflops、5.3tflops,同时还搭配了4096-bit 16gb hbm2高带宽显存,并支持全新的nvlink互连总线,取代传统pci-e。
那么它到底性能如何呢?圣地亚哥超级计算中心的scott le grandross walker、亚马逊网络服务的scott le grand联合编写了一个通用计算测试工具amber,可模拟生物分子周围的力场,并与nvidia合作对tesla p100进行了一番测试,包括单路、双路、四路。
由于测试所用硬件还是工程样品,操作系统是linux,而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的,所以结果反映的只是纯计算能力,和游戏表现无关。
事实上,gp100核心应该永远不会出现在消费级领域,gtx 1080 ti、gtx titan x 2之类的*卡会使用gp102。
参与对比的产品中,tesla m40基于麦克斯韦架构大核心gm200,3072个流处理器,单精度性能突破7tflops,双精度只有0.21tflops,搭配384-bit 12gb gddr5显存。
tesla k80使用的是两个开普勒架构大核心gk210,4992个流处理器,单双精度浮点性能8.74、2.91tflops,搭配两组384-bit 12gb gddr5。
tesla k40的核心是gk110,2880个流处理器,单双精度浮点性能4.29、1.43tflops,搭配384-bit 12gb gddr5。
gtx 1080、titan x、980 ti、980也都加入了对比,另外还有几颗纯cpu,包括双路的e5-2697 v4/2698 v3/2650 v3,分别有32/32/20个核心。
具体测试原理、流程啥的就不多说了,专业性太强,只简单看看结果:
相比于前辈m40,p100的计算性能提升相当猛,绝大部分项目都在50%左右,少数甚至超过80%,有的甚至接近100%!
事实上在大部分时候,单路p100都能干掉双路m40,领先幅度10-20%不等。
对比消费级游戏卡,p100单路已经相当于gtx titan x四路的水准,也可以看到gtx 1080同样十分凶猛,多数情况下都达到或者接近m40的水平,但不够稳定,有时候相当于单块titan x,有时候超过人家两块。
最遗憾的是,nv-link总线的威力还没有发挥出来,双路、四路p100的提升幅度普遍还不如pci-e。
八路tesla p100
综上的就是汇总的关于nvidia tesla p100计算卡性能首发评测,大家可以参考学习一下,希望会对大家有所帮助!欢迎大家继续关注其他信息!
推荐阅读