欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

从机器学习到视觉感知:英特尔为AI布下两颗棋子

程序员文章站 2024-01-12 20:19:58
作为过去 50 年领导整个世界计算进步的英特尔,下一步又该如何应对人工智能带来的机遇和挑战?科技公司的年度大会有两种,一种是推出普通消费者日常生活使用的用品,如苹果一年一度或一年两度的iPhone发布...

作为过去 50 年领导整个世界计算进步的英特尔,下一步又该如何应对人工智能带来的机遇和挑战?

从机器学习到视觉感知:英特尔为AI布下两颗棋子

科技公司的年度大会有两种,一种是推出普通消费者日常生活使用的用品,如苹果一年一度或一年两度的iPhone发布会,另一种则是针对技术开发者发布的SDK、API、开发套件等,一如英特尔的开发者技术大会——IDF。

如果说苹果的发布会讲述的是当下最好的软硬件集成,那么英特尔的发布会则是探讨未来的各种可能。

这其中,最让业界关注的恐怕还是英特尔打算如何切入当下最火的人工智能领域。放眼业界,人工智能成为当下技术公司发力的方向。AlphaGo用一场完胜将Google深度学习推进人工智能的野心展露无疑,Facebook给未来十年规划了社交、人工智能、虚拟现实、无人机的发展路线,微软则通过云、基于人工智能的Bot开发框架打造新一代软件开发平台,而作为过去50年领导整个世界计算进步的英特尔,下一步又该如何应对人工智能带来的机遇和挑战呢?

围绕机器学习,从算法和硬件上寻求突破

基于深度神经网络的机器学习崛起于2012年的 ImageNet 挑战赛,来自多伦多大学的一个明不见经传的团队利用深度学习训练的图像识别模型,不仅取得了冠军,并将错误率降低到20%以下,震惊产业界和学术界。自此之后,基于深度神经网络的机器学习成为人工智能重新崛起的巨大推动力,Google、Facebook、微软先后建立深度学习研究团队,在多个产品中部署深度学习技术,成绩斐然。

当业界越来越来多依靠深度学习,也带来对新一代计算的要求,而且更重要的一点则是,深度学习对计算力资源的需求到底有多高,其实谁也不知道,着就像个「计算黑洞」,也使得异构加速技术在过去几年成为该领域应用广泛的技术,比如 FPGA。

所谓 FPGA(Field-ProgrammableGate Array,现场可编程门阵列),是一种介于专用芯片和通用芯片之间,具有一定的可编程性,可同时进行数据并行和任务并行计算,在处理特定应用时有更加明显的效率。更重要的是,FPGA具有明显的性能功耗比优势,其能耗比是CPU的10倍以上、GPU的3倍。FPGA在诸多领域得到应用,如逻辑控制,信号处理,图像处理等方面。

2015年12月,英特尔完成了对可编程逻辑器件厂商Altera的收购。这是英特尔公司历史上规模最大的一笔收购,这也让英特尔成为第二大可编程逻辑器件厂商,并且将Altera的FPGA纳入到英特尔的产品线中。

这次收购对于英特尔接下来的发展至关重要。

众所周知,英特尔在业界的影响力建立在PC、服务器的CPU基础之上,但在PC销量持续下滑的残酷面前,英特尔的收入和利润都将受到很大影响。根据2015财年财报,英特尔全年营收同比下滑1%,净利润同比下滑2%,毛利率同比下滑1.1%。华尔街分析师将下滑的原因归结为PC芯片业务处于持续的疲软状态,该业务一度是英特尔最核心的产品线。

从机器学习到视觉感知:英特尔为AI布下两颗棋子

Gartner2016Q1全球市场PC出货量数据(单位:千台)

在服务器层面,包括Facebook、Google在内的主要客户,其对大型网络服务计算的需求不断增长,传统意义上,英特尔会在每块硅片上集成更多晶体管,不过随着摩尔定律失效,这种方法也越来越难以满足客户需求。

FPGA则有望给英特尔带来新的业务增长点,那就是机器学习。在英特尔全球副总裁兼中国区总裁杨旭看来,将Altera的FPGAs和英特尔处理器结合在一起的「一个很激动人心的领域就是机器学习,它是影像识别、目标探测、发现大数据规律的关键要素。」具体来说,英特尔会把FPGAs和英特尔处理器封装到一颗芯片里,当用FPGAs来运算一些机器学习的任务时,就像CNN影像识别算法,这些算法能大大提高它的性能。根据英特尔并购副总裁文德尔·布鲁克斯2015年接受采访时的说法,相对于传统的处理器和FPGA独立组建,新的一体化芯片最初将带来30%至50%的性能提升,而最终的性能提升将达到2到3倍。

也正是在这样的背景下,英特尔与科大讯飞联手推出的深度学习计算平台备受瞩目。在这个平台上,底层硬件来自于英特尔的至强助力器和Altera FPGA技术,依托科大讯飞在自然语言处理、语音识别方面的核心技术,可实时将发言者语音转化成文字,准确率高达95%。

硬件层面的进展令人眼前一亮,而在软件尤其是算法层面,英特尔想做的则是通过2015年发布的数据分析加速库DAAL(Data Analytics Acceleration Library)来帮助第三方开发者更好地在英特尔的底层硬件上进行机器学习模型的搭建和训练。与此同时到2017年,英特尔会在另一个名叫「数学核心函数库」的产品中发布神经网络API,上述资源会让开发者直接调取,极大地降低了开发者入门机器学习的门槛。

从机器学习到视觉感知:英特尔为AI布下两颗棋子

DAAL

总体上说,英特尔的确在为机器学习,尤其是深度学习做了很多布局,但也真如深度学习还处在早期发展阶段一样,英特尔的各个产品(硬件、软件/算法)也并不成熟,但在另一个层面来看英特尔对于人工智能发展的思考,则别具深意。

把感知能力赋予机器人

在去年的IDF上,英特尔CEO Brian Krzanich向观众不断重复实感技术(RealSense)的重要性,并进行了多次演示。而到了一年后的主题演讲中,当现场观众再次被一年前的这项技术欢呼鼓掌时,某种意义上也展现了实感技术的确有着巨大的应用场景。

英特尔新技术事业部副总裁兼感知计算事业部总经理鲍克勤在谈到实感技术时表示,「我们正处于计算设备寒武纪物种大爆发的起始阶段」,如果人类经过寒武纪物种大爆发看到了世界,那么「我们的智能设备也处在这样一个时代,有了『眼睛』以后,它们也可以去理解世界了。」

所谓实感技术,就是一整套软硬件解决方案,硬件层面由色彩传感器、红外传感器、红外激光发射器和实感图像处理芯片等部件组成了3D摄像头。软件方面,这个摄像头可以捕捉物体的色彩、计算物体深度和运动轨迹,并且还支持3D建模、实时渲染等。

简而言之,就是通过摄像头把感知能力和理解能力赋予新一代的计算设备。格莱美颁奖礼上,Lady GaGa向刚刚去世的摇滚巨星David Bowie的致敬环节令人激动。演出中,Lady Gaga的脸上出现了变化莫测的华丽妆容,起初仿佛岩浆流淌而过,后来随着妆容的不断变化出现闪电。David Bowie实时投影在Lady Gaga的脸上,接着一只逼真的蜘蛛突然从左眼爬到右眼,缓慢划过脸颊,最终在额头处化成魔洞。这一切都依靠实感技术,这也是该项技术众多应用场景中的一个。

从机器学习到视觉感知:英特尔为AI布下两颗棋子

Lady Gaga脸上不断变化的华丽妆容

在今年的IDF上,英特尔带来三种不同型号的实感摄像头,包括适合近距离感知的SR300、远距离的R200/LR200以及适合远距离并可进行运动感知的ZR300。同时还发布了针对不同领域的实感技术开发工具套件。

首先,将实感技术武装到机器人身上。机器人自然需要「眼睛」感知世界,不过过去缺乏一种让机器人「看见」周遭世界的方法。因此,英特尔希望通过实感技术机器人开发工具包,让机器人拥有一双「眼睛」。这个工具包集成机器人开发主板和R200相机,这是一个交钥匙方案(所谓「交钥匙」,是承包公司为客户方建造工厂或其他工程项目,一旦设计与建造工程完成,包括设备安装、试车及初步操作顺利运转后,即将该工厂或项目所有权和管理权的「钥匙」依合同完整地「交」给对方,由对方开始经营。英特尔已经在多个领域启动「交钥匙」方案)。

从机器学习到视觉感知:英特尔为AI布下两颗棋子

Ninebot公司的segway机器人

特别要指出的一点,利用实感技术,Ninebot公司的赛格威机器人在今年CES上可谓大展身手,目前,这个机器人已经将视觉识别、语音交流和定位运动能力完美融合,而赛格威机器人也已一个开放平台项目,全球各地的软硬件开发者可以在这个平台上开发、优化自己的机器人项目。

其次,推出英特尔实感技术SDK。提供了更多API,包括姿态识别、人脸跟踪、3D扫描、场景感知,还有SLAM,并且真正实现了跨平台操作,为纵深相机提供开源的驱动程序,支持Linux、Android、OSX和Winows。这些跨平台的API也为机器人操作系统ROS提供了交互界面,对于未来机器人的开发有重要意义。

第三,把实感技术放入无人机平台(Aero Drone Board)。这块主板的中间有个100针的接口,可以通过上面的FPGA对它进行再编程、再优化。而主板的外围设备支持包括SSD存储、LTE通讯网络、RealSense视觉。它运转Yocto Linux软件,可以和大量商用的飞行控制器连接。

另外,围绕实感技术周边,只有「钮扣」大小的计算模块Curie、轻便型移动网络设备平台Atom、适应物联网(IOT)和可穿戴设备的芯片Edison、以及云计算技术FreeD都将成为英特尔为机器人、无人机带来感知的重要辅助力量。

从机器学习到视觉感知:英特尔为AI布下两颗棋子

计算模块Curie

相较于可用于机器学习的昂贵一体化芯片,英特尔的实感技术颇具亲民之意,更多的还是聚焦于正奋战在一线的机器人、无人机开发者们,上述诸项举措也将伴随英特尔针对中国创客的「创客爆米花」计划在中国落地。

2015年以来,英特尔一直力图摆脱对于PC、服务器的过度依赖,通过强大的研发能力,在多个领域寻求突破。比如在物联网方面就有不小的进展,根据2015年第四季度的财报,物联网部门第四财季营收为6.25亿美元,高于上年同期的5.91亿美元。

而在当下最火热的人工智能领域,以硬件擅长的英特尔选择提供计算能力和感知能力,这既是对原有业务的延续和补充(毕竟,芯片还是该公司的支撑业务之一),也是英特尔最熟悉的商业模式。从新一代计算芯片到新一代视觉感知,英特尔为人工智能布下的这两个棋子,未来将带来多大的产业影响力,我们不妨拭目以待。