Intel Xe HPG锐炫游戏显卡架构公开:台积电6nm、驱动完全重写
intel日前宣布基于xe hpg架构的高性能独立显卡命名为“锐炫”(intel arc),首款产品alchemist(dg2)将在明年初发布。
今天的架构日活动上,intel公布了xe hpg架构的不少细节。
可以说,这一次,intel是很认真的,尤其是经过xe lp低功耗架构的试水之后,xe hpg高性能架构将真正向nvidia、amd发起挑战!
intel gpu多年来的基本模块一直都是“执行单元”(eu),这次变成了全新的“xe核心”(xe core),包含矢量和矩阵(张量)alu单元、零级和一级缓存、载入存储单元等等。
大致看来,intel xe核心的组织方式有点像nvidia sm,只是少了纹理单元,当然内部结构肯定是迥异的。
xe核心内有16个矢量单元,或者叫矢量引擎,每个每时钟周期可处理256位,又可细分为8个fp32 alu单元,因此每个xe核心每时钟周期颗处理器128个fp32操作。
同时还有16个矩阵数学单元,或者叫矩阵引擎(xmx),处理矩阵、张量操作,每个每时钟周期可处理1024位,可以是64个fp16操作,也可以是128个int8操作。
xe核心的上一层级是“渲染切片”(render slice),专为dx12 ultimate设计,每个包含4个xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、2个像素后端。
值得一提的是,光追部分支持directx光追(dxr)、vulkan光追。
alchemist dg2 gpu包含最多8个渲染切片,共享大容量二级缓存。
不过架构图上并未画出pcie控制器、多媒体引擎、显示控制器等固定功能单元,但我们知道,它会首发支持displayport 2.0。
这颗gpu将交给台积电代工,采用后者的n6 6nm工艺,也就是7nm的优化升级版。
台积电对此也是相当兴奋,称将为intel gpu提供优化的性能、密度、能效平衡。
intel宣称,通过架构、逻辑设计、电路设计、制程工艺技术、软件的全方位优化,相比于xe lp微架构,xe hpg微架构可以实现1.5倍的频率提升、1.5倍的能效提升。
照此推算,alchemist显卡的频率应该在2ghz左右,fp32算力大约16.4tflops,是之前dg1低功耗独显的几乎8倍。
当然,软件开发是释放硬件设计潜力的关键,这方面intel也是倾尽全力,并公布了最新的进展。
目前,intel正与开发人员密切合作,进行xe微架构的设计,力求与行业标准保持一致。
驱动程序也在统一的代码库中涵盖集成、独立显卡,intel称第一款高性能游戏显卡将性能和质量放在首位。
同时,intel已经完成了内核显卡驱动程序组件的重新架构,特别是内存管理器、编译器,号称计算密集型游戏的吞吐量平均提高了15%,最多可达80%,而游戏加载时间缩短了25%。
alchemist只是intel高性能显卡的第一步,接下来还会有基于第二代、第三代xe hpg微架构的battlemage、celestial,然后将是全新下一代xe架构的druid。
- the end -
转载请注明出处:快科技