抛弃寒武纪:华为麒麟810自研达芬奇架构NPU揭秘
2019年6月21日,华为在武汉发布nova 5系列手机。发布会上简单的开场之后,华为消费者业务手机产品线总裁何刚表示,好销量源于好产品,好产品源于更用“芯”,并宣布在麒麟9系列和7系列处理器的基础上,推出全新的高端8系列处理器,首款产品是麒麟810。
此次发布的麒麟810最大的亮点在于搭载全新华为达芬奇架构npu。此前,华为麒麟970和麒麟980处理器都采用寒武纪的npu,此次则采用了自研npu。
对于自研的达芬奇架构npu,何刚列出了四大特性:
- 创新架构 达芬奇魔方 张量化立体运算单元
- 澎湃算力 单位晶元面积 最佳能效
- 算子多 支持数量多达240+ 通用性好
- fp16 精度 int8量化精度业界领先
具体的性能表现上,何刚给出的数据显示,在eth zurich开发的ai-benchmark跑分中,麒麟810以32280的成绩领先于骁龙855的25428分和骁龙730的13908分。
根据在ai-benchmark查询到的以处理器ai跑分进行的最新排名,麒麟810以23944分排名第一,骁龙855和heliop90分列第二和第三。
麒麟810能够取得这样的成绩架构能发挥重要作用,华为的达芬奇架构在去年十月的huawei connect 2018正式发布,是华为未来ai战略中非常关键的项目。当时华为发布了基于达芬奇架构的ascend系列处理器。
不过那时除了知道达芬奇架构能满足从终端到云端的运算需求之外,华为并未透露关于这一自研架构的更多消息。
关于麒麟810的npu,华为表示,不同于以往的二维运算模式,达芬奇架构以高性能3d cube计算引擎为基础,针对矩阵运算进行加速,大幅提高单位面积下的ai算力,充分激发端侧ai的运算潜能。
何刚表示,华为将会更加注重软硬件的协同,会在硬件领先的基础上增加在软件方面的投入。
据悉,2017年华为推出hiai移动开放平台,与合作伙伴共同推动首批ai应用上线。2018年,华为推出hiai生态2.0,在麒麟980强劲ai运算力下,使能开发者创新ai应用,大幅缩短ai应用的开发周期,提升开发集成效率。
麒麟810的推出,更多算子、开源框架的支持以及提供更加完备的工具链将帮助开发者快速转换集成基于不同ai框架开发出的模型,增强华为hiai移动计算平台的兼容性,易用性,提高开发者的效率,节约时间成本,加速更多ai应用的落地。
ai性能是目前手机soc比拼的一项重要指标,除了架构,制程也非常关键。
7nm是目前业界最领先的量产半导体工艺,已经采用7nm制程的手机soc包括麒麟980、a12、骁龙855,最新推出的麒麟810也采用7nm工艺,这就意味着麒麟810是全球第四款采用7nm工艺的手机soc。
先进的半导体工艺是提升处理器性能最直接的方式,根据何刚的说法,7nm制程对比8nm和10nm制程晶体管密度分别提升50%和64%,能效分别提升20%和28%。
cpu和gpu依旧是手机soc的重要参数。麒麟810采用的是2x2.27 ghz cortex-a76 和6x1.88 ghz a55的组合,华为表示他们采用了全新系统级ai调频调度技术,2+6大小核架构也是创新的设计。
不是麒麟980的big middle little架构,也没有采用arm最新发布的cortex-a77,当然这也符合华为对麒麟810高端系列,强劲性能的定位。
cpu跑分华为用麒麟810和骁龙730进行对比,单核性能和多核性能分别高11%和13%。
何刚还给出了日常应用冷启动时间的对比,包括qq、手机淘宝、百度等应用。
gpu方面麒麟810也没有采用arm最新的mali-g77,而是使用定制的mali-g52 gpu,这个定制的gpu针对游戏场景深度优化。
在游戏方面,华为通过ai调频调度、gpu负载优化、60fps高性能hd画质优化,何刚说要用更底层的麒麟gaming+技术让玩游戏更痛快。
图像性能方面,麒麟810采用的是ivp+isp,具备新升级旗舰级像素处理单元;增强白平衡算法;增加de模块 增加raw域降噪处理 支持深度信息模块 支持畸变矫正模块。
通信性能方面,麒麟810支持一卡volte通话,一卡4g上网,可以让通话不断,娱乐不间断,同时支持一卡volte通话,一卡volte来电,能够让来电不漏接。
华为nova 5将是首款搭载麒麟810的华为手机。