欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Intel 14nm末代服务器增加新指令 10nm又砍掉

程序员文章站 2022-06-30 17:20:17
intel近日发布了第二代可扩展至强处理器,代号为cascade lake,工艺还是14nm,架构还是skylake-sp,而接下来在明年,intel还将再拿出一代14...

intel近日发布了第二代可扩展至强处理器,代号为cascade lake,工艺还是14nm,架构还是skylake-sp,而接下来在明年,intel还将再拿出一代14nm服务器平台,代号为cooper lake,而且很可能更换接口和主板,再往后才轮到10nm ice lake。

Intel 14nm末代服务器增加新指令 10nm又砍掉

cascade lake在机器学习、人工智能方面做了显著增强,cooper lake则会继续改进。根据intel发布的最新版开发者文档,cooper lake会引入新的avx512_bf16适量神经网络指令,也就是支持bfloat16(bf16)格式。

bfloat16(bf16)浮点格式介于标准化的半精度fp16、单精度fp32之间,指数位和fp32一样而多于fp16,但是小数位比fp16更少。

它能让开发者在16位空间内通过降低精度来获取更大的数值空间,在内存中存放更多数据,减少数据进出空间的时间,还能降低电路复杂度,最终带来计算速度的提升。

这种格式已经成为深度学习事实上的标准,google tpu、intel未来的fpga及其nervan神经网络处理器都会支持,xeon至强家族支持也在情理之中。

cooper lake支持的avx512-bf16指令包括vcvtne2ps2bf16、vcvtneps2bf16、vdpbf16ps,而且都有128位、256位、512位三种模式,因此开发者可以根据需要选择九种不同版本。 

Intel 14nm末代服务器增加新指令 10nm又砍掉

不过奇怪的是,intel每次公布新指令的时候,都会确认支持的首个架构以及此后支持的架构,比如最初的avx指令集,支持的架构就标注为“sandy bridge and later”。

但这次,avx512-bf16指令的支持架构却只写着“future cooper lake”,并没有看到惯例的“and later”。

这似乎意味着,只有14nm cooper lake才会支持avx512-bf16,而接下来的10nm ice lake反而会砍掉。

intel对此回应称:“目前,cooper lake会为机器学习加速(dlboost)加入bfloat16指令。除此之外在路线图内没有可分享的。”

Intel 14nm末代服务器增加新指令 10nm又砍掉