欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

CPU与GPU、VCU的关系 愈加“微妙”

程序员文章站 2022-08-16 11:46:25
一个gpu总需要一个cpu,但cpu的选择已经不再单一,gpu的功能也不再“简单”,曾经稳固的关系,不再是单纯的合作。四月份,英伟达发布了采用arm架构的首款数据中心cpu g...

一个gpu总需要一个cpu,但cpu的选择已经不再单一,gpu的功能也不再“简单”,曾经稳固的关系,不再是单纯的合作。

四月份,英伟达发布了采用arm架构的首款数据中心cpu grace引发广泛关注。本月,外媒tomshardware报道,像cpu一样总需要一个cpu的谷歌自研视频编解码处理单元argos vcu,预计可以替换3000-4000万个英特尔cpu。

依赖cpu的gpu和vcu为什么会有替代cpu的势头?芯片巨头与互联网巨头间的竞合关系,是如何加深的?

cpu市场的双重变化

回答cpu与其它依赖cpu处理器关系变化之前,不妨先了解cpu市场本身的变化。在很长一段时间,由于cpu的性能已经足够满足包括pc在内的各种应用需求,再加上内存和带宽成为cpu性能提升的瓶颈。cpu王者英特尔在提升cpu性能动力不足,以及先进制程工艺进展不如预期的情况下,连续多代cpu性能提升幅度不大,被称作“挤牙膏”。

英特尔在领先位置缓慢前进的几年间,amd凭借zen架构的迅速迭代以及台积电先进制造工艺的加持,性能迅速接近甚至超越英特尔酷睿和至强cpu的性能。“amd yes”表达了消费者对于amd产品迅速提升的认可。

英特尔和amd的x86 cpu是pc时代的标志,然而在性能提升陷入瓶颈,以及先进半导*程提升难度越来越大的背景下,两家最具代表性的cpu公司表现相差甚远,并且开始在市场份额上有所体现。

依旧有领先优势的英特尔感受到了老对手带来的竞争压力,因此无论是产品性能提升还是市场策略都更加积极。然而,英特尔在服务器cpu市场除了要面临同为x86阵营amd的竞争,arm阵营的公司也来势汹汹。

ampere董事长兼首席执行官renee james说:“我们知道未来将与过去不同,因为软件环境变了,不再是关于pc和pc服务器的业务,而是围绕云和云边缘。现在,需要另一种不同的微处理器。”

ampere基于arm neoverse n1内核,推出了80核的altra cpu和128核altra max cpu,持续刷新服务器cpu核心数的纪录,突出与x86 cpu相比更高的核数以及在云原生市场的优势。

同样是强调差异化优势,英伟达的grace主要是面向数据密集型hpc和ai应用。英伟达首席执行官黄仁勋称基于grace的系统与英伟达gpu紧密结合,性能将比目前最先进的nvidia dgx系统(在x86 cpu上运行)高出10倍。

无论是ampere还是英伟达,其差异化高性能cpu的基础都是arm。而arm也在今年三月推出了面向未来十年的新一代架构armv9,arm希望将其架构在智能终端的成功扩展到高性能计算市场,包括边缘、云端及5g等。基于armv9架构的neoverse n2正是arm向高性能市场拓展的关键产品。

整体看来,已经在pc和服务器cpu市场大获成功的x86阵营正开始一场激烈的竞争。此时,面向云计算、ai的arm架构cpu迅速发展,要在新兴市场分一杯羹。未来,risc-v cpu会以怎样的方式参与到cpu市场的竞争,也让人充满期待。

异构时代,定制cpu优势突显

cpu市场发生双重变化的一个关键因素是市场需求,在市场的驱动下,cpu的价值也更多体现在异构系统中。英伟达在今年四月发布grace cpu的时候,也同时将其数据中心产品路线图升级为gpu+cpu+dpu的三类芯片,逐年飞跃,一个架构的策略。在这个新的策略中,gpu和dpu性能的充分发挥依旧需要有cpu强大的性能,也就是说,cpu计算和控制的基础和核心作用没有改变。

CPU与GPU、VCU的关系 愈加“微妙”

变的是新兴应用对于算力的大幅快速增长,异构系统的性能是更重要的关注点。“目前市场上每年交付的3000万台数据中心服务器中,有1/3用于运行软件定义的数据中心堆栈,其负载的增长速度远远快于摩尔定律。除非我们找到加速的办法,否则用于运行应用的算力将会越来越少。”黄仁勋说,“新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。”

这也是英伟达推出dpu,并且将dpu归入其数据中心产品路线图的原因。“现代超大规模云技术推动数据中心从基础上走向了新的架构, 利用一种专门针对数据中心基础架构软件而设计的新型处理器, 来卸载和加速由虚拟化、网络、存储、安全和其它云原生ai服务产生的巨大计算负荷。bluefield dpu正是为此而生。”黄仁勋此前表示。

异构组合才能更好满足未来市场的需求,这也已经是业界共识,从英特尔拥有cpu+gpu+fpga+ai加速器的完整芯片组合,到英伟达宣布收购arm,再到amd宣布收购赛灵思,芯片巨头们都希望通过不同类型的芯片组合满足云计算、ai等计算更加密集应用的需求。

在这种变化中,cpu的选择也会更加多样。computex 21上,黄仁勋在回答雷锋网等提问时表示:“未来的世界非常多样,当然也会有不同的cpu,包括x86架构和arm架构,大型cpu和小型cpu,面向边缘、数据中心、超算等cpu,我们的策略是在我们服务的市场,选择最合适的cpu,我们会继续支持x86 cpu。”

面向特定的市场,并非所有cpu都合适。因此在不同的市场需要不同的cpu,比如在笔记本电脑市场,英特尔的x86 cpu是不错的选择,在dgx系统中,amd的cpu表现非常好。在5g基站中,基于arm的marvell cpu是一个理想选择。在云计算市场,ampere的cpu性能出色。英伟达的cpu为的是解决ai推荐系统和自然语言理解这样大型ai模型的计算挑战。

“我相信未来既需要通用cpu,也需要定制cpu。支持arm和x86对我们来说都是很好的战略。”黄仁勋表示。

cpu与gpu、vcu更加微妙的竞合关系

既有自研的arm cpu,也支持x86 cpu,让英伟达与cpu巨头间的竞合关系中竞争的成分更高。在pc时代,芯片巨头间的竞争,是cpu公司或者gpu公司之间的竞争,cpu与gpu公司以合作为主旋律。

迈入ai时代,英伟达凭借其gpu硬件加上通用的软件,成为了ai芯片公司的代表,在ai市场成为了英特尔强大的竞争对手。面向市场空间巨大的云计算和5g市场,英伟达的gpu依旧离不开英特尔和amd的cpu,但同时英伟达会更加注重arm架构cpu的开发,芯片巨头间的竞合关系进一步加深。

这种关系变化更明显的转变在芯片巨头与互联网巨头之间。比如文章开头提到的谷歌argos vcu,多年来谷歌都使用英特尔cpu中的视频编解码引擎,但随着视频内容越来越多,以及分辨率越来越高,谷歌需要性能更强但是功耗和成本更低的芯片。

定制的专用芯片性能往往会比通用芯片更强,通过自研核心功能加上集成第三方ip,能在规模应用中实现优势。谷歌表示,与英特尔skylake驱动的服务器系统相比,其基于vcu的设备在性能、tco(总体拥有成本)、计算效率方面实现了7倍(h.264)和高达33倍(vp9)的提升。

cpu、gpu 和配备 vcu 的系统离线双通道单输出 (sot) 吞吐量

除了vpu,谷歌也已经通过自研的tpu减少了购买cpu和gpu。谷歌与芯片巨头们的关系,不再单纯是紧密的合作伙伴,在特定市场也成为了竞争对手。

对于这种转变,英特尔公司副总裁兼中国区总经理王锐此前对雷锋网(公众号:雷锋网)表示,“竞争对手可以在某一参数或者是在制程上缩短与我们的差距。但要打造整个架构,在计算和ai的各个方面都要能够赶超英特尔,不是那么容易的事情。”

这是芯片巨头应对技术、市场变化的自信和底气,当然,芯片巨头们也需要更多地考虑与自研芯片的互联网巨头们的关系。

不要忽略,无论是芯片巨头们之间的竞争,还是芯片巨头与互联网巨头们之间关系的变化,本质上除了市场和应用变化的驱动,还有成熟的芯片产业链,包括成熟的设计工具、ip、代工厂和封装,很大程度降低了gpu公司设计cpu,以及互联网巨头设计定制芯片的门槛。

芯片行业的门槛还在进一步降低,这还会带来怎样的变化?

CPU与GPU、VCU的关系 愈加“微妙”

- the end -