第一次!手机GPU实现了桌面级光追效果
智能手机的全面普及,以及手机性能的持续提升,带来了手机游戏市场的快速增长。即便在整个游戏市场收入整体小幅下滑的2021年,手游表现依旧强劲。
newzoo今年7月发布的《2021年全球游戏市场报告》预测,移动游戏市场将在2021年产生907亿美元的收入,同比增长4.4%,这部分收入将占全球游戏市场总收入的一半以上。
手游市场的快速增长,除了玩手游更加便捷之外,体验不断接近桌游也是关键。最近几年,光线追踪进一步提升了游戏体验。2018年,英伟达发布了十多年来在计算机图形领域的重要创新——图灵gpu架构,首次将光线追踪带入桌面级市场。
2021年11月,imagination也发布了代表其十年来推动光线追踪在低功耗设备上应用的发展成果powervr photon光线追踪架构,首款gpu ip img cxt也一同亮相。这是业界首次在移动 ip上实现了桌面级质量的光线追踪视觉效果,也是全球首款在移动端实现硬件光线追踪的gpu。
雷锋网(公众号:雷锋网)了解到,基于powervr photon光线追踪架构的终端产品有望最早在2023年上市,这就意味着,手游玩家也将享受到光追游戏体验,手游市场的变革时刻也即将到来。
移动设备上的光线追踪效果如何?
光线追踪的目的是通过模拟真实世界中光线的表现,创造出与现实生活几乎无异的三维(3d)场景。光线追踪不是新鲜事物,在许多电影中已经有所应用,比如《玩具总动员4》的开场镜头中,雨坑里反射的光线就是光线追踪渲染的效果,《阿凡达》《头号玩家》《失控玩家》等电影也运用了光线追踪。
但是,光线追踪在游戏中还非常新鲜,这是因为光线追踪涉及巨大的计算量,桌面级和移动设备的计算能力无法满足所需的高计算负载。2018年,英伟达的图灵架构gpu打破了瓶颈,将光线追踪技术引入桌面级游戏市场。
实际上,imagination在光线追踪方面的研究也有大概十年的时间,2014年就采用28nm工艺就设计测试了一款光线追踪gpu。
“当时整个生态还没有准备好,图形api也没有与光线追踪相关的标准。”imagination中国区战略市场与生态副总时昕说,“从2018年桌面级gpu公司开始推出pc上的光线追踪开始,整个业界生态开始投入,在2020年khronos图形标准化组织也推出了vulkan api的光线追踪extension,我们认为推出具有光线追踪功能的芯片的时机已经到来。”
将光线追踪引入移动端,效果自然要向桌面级看齐。用一个直观的例子来展示imagination实现的光线追踪效果,没有光线追踪的情况下,物体之间的反射并不能很好的呈现,比如图片中的罐子,开启光线追踪功能后墙面的绿色从反光材料上反射出来,所有物体都具有柔和的反射效果。
开启光线追踪,阴影的部分也会变得非常柔和,几乎看不见,但巧妙地增加了照明的真实感,更接近现实世界。
还有,光线追踪中的全局照明,能为场景中的物体增加出色的环境照明效果,实现最真实的照明。
如何实现移动端光追性能和功耗的平衡?
实际上,想要在已有的移动设备上实现光线追踪功能并非不可能。
“采用软件方案也能在移动端实现光线追踪效果,但那只能在演示当中,如果应用于游戏,效果一定不太好。” imagination技术前瞻副总裁kristof beets 指出,“因为这种方案没办法在功耗和效果之间达到一个很好的平衡,软件仍然要使用大量的计算资源用于阴影和多边形的贴图。”
为了更直观反映实现光线追踪不同方案及效果的差别,imagination对光线追踪进行了分级,建立了光线追踪等级系统(rtls):
1级为现有硬件上的软件解决方案。性能低,效率低。
2级增加了用于光线追踪的第一部分硬件。与1级相比,可以将基本光线追踪效果的效率提高44倍。
3级增加了用以处理发射光线的硬件,与2级解决方案相比,可大大降低功耗。
4级增加了相干性聚集功能,针对复杂的桌面级效果大大提升了性能,让其可以在移动端功耗预算下应用。
5级是一项未来等级,可在场景中实现更大数目的动态目标,并带有额外的硬件加速。
imagination新发布的cxt gpu ip是一个rtls 4级的光追产品,目前业界的其它移动端解决方案为rtls 1级。imagination能够实现rtls 4级光追的核心是img cxt-48-1536 rt3 内核具有三个光线加速集群(rac),可提供总体高达1.3 gray/s的性能,即使在移动设备低功耗的情况下,也能以1080p分辨率实现30~60fps的实时光线追踪渲染,满足日常游戏高端需求。
rac包含了光线存储(ray store)、光线任务调度器(ray task scheduler)和相干性聚集器(coherency gatherer),并与两个128宽的统一着色器集群(usc)紧密耦合,着色器集群有高速专用数据通路,可以实现高效且功耗最低的光线追踪部署。
时昕解释,“很多光追算法用传统的方法实现效率很低,用过专门的硬件单元,比如rac,效率成倍提升。”
imagination给出的数据显示,在光栅化图形处理性能方面,最新的cxt与imagination的上一代gpu ip相比,计算、纹理和几何性能都提高了50%。
功耗方面,得益于低功耗超标量(superscalar)架构可在低时钟频率下提供高性能,从而实现更高的帧率功耗比(fps/w)效率,imagination图像压缩(imgic)技术也可以大幅降低带宽需求。
高性能和低功耗看似对立,但实际并不矛盾。
“以前在复杂场景的光照效果,包括反射、阴影、全局照明等,都要靠着色器一个个去模拟计算,我们的cxt把渲染的负载转移到更为专用的硬件上面,效率更高的同时实现更低功耗。” kristof beets解释。
当然,讨论光线追踪的性能和功耗不能抛开技术路线。光线追踪有两种方式来实现,一种是用光线查询的方式,一种是用光线管线的方式,这两种方式都需要计算10亿条及更多数量的光线。
光线管线的方式是计算光源发射出的光子,碰到场景当中物体的反射、折射等反应,最终达摄像机位或者游戏玩家的眼睛。光线查询方式就是反过来,从摄像机位或游戏玩家的角度,计算出光源。
“光线查询浪费的计算比较少,所以有功耗优势,但是技术难度也更大一些。目前很多宣称有光线追踪技术大部分是用光线管线实现,imaginatiom同时支持光线管线和光线查询两种方式,客户和合作伙伴可以*选择。”时昕表示。
光追普及的关键是生态
kristof beets说,“基于我们十多年在光线追踪方面的投入和积累,我们可以推出rtls 5级的产品。之所以现阶段推出rtls 4级产品,主要是出于市场考量。我们跟市面上的光线追踪开发者沟通后发现,如果我们成为市场上唯一提供rtls 5级光线追踪硬件的公司,不会有多少开发者来开发相应的应用。”
先推出rtls 4级光追产品培育市场,比如说游戏的3d引擎、游戏开发者,再慢慢把光线追踪市场做大。imagination推出gpu ip的同时也推出了软件开发套件pvrtune工具,可以支持开发者查看底层的光线追踪计数器,例如:每秒的光线数、包围盒测试器负载、缓存命中率、每秒遍历(递归)的光线数等,还可以模拟cxt的功能和行为,降低使用者门槛。
这也容易理解,imagination在2014年就测试了其光线追踪的技术和硬件,但并没有推出产品的原因也是生态原因。处理器的成功离不开整个生态,包括接口、工具等。imagination作为ip提供商,并不直接出售芯片及解决方案,想要直接推动光线追踪的发展难度很大,只能等有一定的生态基础后,再推出相关产品。
“在标准化方面,我们大量参与了与微软的沟通和讨论,在此基础上,再继续提升gpu架构。”kristof beets说。
未来几年,移动市场上的光线追踪产品仍然会在软件层面,直到硬件方案进入市场并呈现出巨大的优势。
那时候,imagination不仅能推动移动和嵌入式终端光线追踪的发展,也能帮助其将gpu的市场从移动端拓展到更高性能的桌面和数据中心市场。
imagination中国区董事长白农告诉雷锋网:“功耗一直不是目前桌面市场gpu的优势,但随着应用的多元化以及对功耗的更高要求,功耗一直是我们的优势,我们的光线追踪产品能够让客户定制更高能效的产品。imagination的商业模式,也支持客户的创新。并且,我们提供gpu、cpu、ai加速、连接网络的全面产品组合,适应异构的发展趋势,能够满足客户多样化的需求。”
据悉,imagination photon架构的可扩展性,可以实现高达 9 tflops(每秒万亿次浮点运算)的fp32光栅化性能和超过7.8 gray/s的光线追踪性能,同时能够提供比当今的rtls 2 级或rtls 3级光线追踪解决方案高2.5倍的功耗效率。
写在最后
在英伟达的推动下,光线追踪的生态在过去几年间已经有了明显的发展,这也是imagination能够推出移动端光线追踪gpu产品的关键。光线追踪是一项改变游戏规则的技术,可以使图形真实感达到跃升式变化。
光线追踪不是全新的技术,但却有可能改变gpu市场的格局,市场的定制需求以及对功耗的更高需求,都是imagination从移动市场进入桌面和数据中心市场的机会。
当然,除了更高效和更低功耗的产品,构建强大的生态才是imagination在光线追踪变革中成功的关键。目前imagination已经与carbonated、腾讯游戏、完美世界、网易游戏合作,推动高性能渲染和光线追踪等图形新技术在移动游戏中的应用。
待到2023年基于硬件光线追踪的移动端产品推向市场之后,我们就能够更清晰的判断光线追踪对手游以及imagination的影响。
- the end -