PS4 Pro显卡解析:显存带宽相当于标准版PS4的1.73倍的秘密
今年10月下旬,身为企业经营者和科技记者双重身份的西川善司参加了索尼互动娱乐(sie)面向*内游戏企业经营者的技术报告会,马克塞尔尼与伊藤雅康两人主持报告会。报告会上有一部分内容是此前西田宗千佳在采访时问到的,还有一部分硬件架构上的问题,揭晓如下:
ps4 pro的定制gpu从polaris架构上采纳技术的部分例子:
polaris世代架构gpu特有的节能机能,(polaris主打的节能机能分别是「adaptive voltage & frequency scaling」和「multi-bit flip-flop」,前者是根据芯片不同的体质自动调整电压和频率,相比以往电压频率控制来说更加灵活;后者涉及笔者并不谙熟的电路术语,恕难翻译其原理,但最终的效果是节省电路面积和控制功耗)
改进版lossless delta color compression,可以翻译成“无损三角色压缩技术”,运用这种技术,可以将贴图材质中的色彩数据以压缩格式写入和读取,在渲染时交由gpu解压,从而最大限度地节省显存带宽,或者说提高实效显存带宽。
根据amd的介绍,ldcc可以使得实效显存带宽平均提高40%,ps4 pro的理论显存带宽是218gb/s,在无损三角色压缩技术的加持下,实效相当于305gb/s,相当于标准版ps4的1.73倍。
西川善司在此前的文章中误认为第一代“无损三角色压缩技术”已经在ps4的gpu上装备,索尼在前不久要求西川订正:ps4标准版的gpu没有装备无损三角色压缩技术。
primitive discard accelerator 字面可翻译成”原始丢弃加速器“,是一种将大小、位置不足以显示在画面上的多边形排除在渲染管线之外的节省渲染资源的技术,跟以往的同类技术相比,该技术可将某些由于方位、距离等原因,在显示屏上大小不足一个像素的多边形排除出渲染管线,集中有限的渲染资源渲染可见多边形。
对16bit数据处理的改进:在记录器上以原生方式处理16位浮点和16位整数运算;在同时完成两个16位数据的处理之时,还可以将两个数据记录在32位的记录器上。
ps4 pro的定制gpu从vega架构(由于vega还没上市,马克在讲座上表述成“polaris之后的架构”上采纳的部分例子:
真正的倍速半精度浮点运算
ps4 gpu的浮点性能是 单精度4.2tflops 半精度8.4tflops 考虑到法线矢量、像素色值这些数据是可以用半精度来处理,加上前文所说的16bit数据处理改进,如果开发者充分运用,可以大大提升游戏表现
work distributor 当大量多边形数据有待处理时,进行高效率的分配调节,提高处理效率。