从云端到终端 机器学习也能在嵌入式设备上实现
开发者需要能够快速开发出实施机器学习功能的深度学习神经网络,并将其转换到低功耗的嵌入式终端设备上,集成了神经网络算法的DSP芯片将成为这一难题的解决方案。
终端设备智能化的需求催生本地智能化(local intelligence)
当联网的终端设备越来越多时,产生的信息数据也将呈指数式增长。如果将所有数据和数据处理全部都交给云端,必然会产生通信拥堵、传输变慢、处理时延等问题,无用的数据也会浪费云端的存储资源。
因此需要本地智能(local intelligence)让终端设备有能力判断数据的价值,只将真正有价值的数据传到云端存储。而终端设备也需要分析数据做出决策的智能化功能,尤其家庭中的图像识别和语音识别设备需要在本地实时处理信息,以保护用户的隐私。
近来,具备深度学习功能的卷积神经网络(CNN)在图像处理和计算机视觉领域得到广泛的应用,其识别正确率也大大提高。在一些生活场景中,如无人机自动避障、家庭服务机器人路径规划等,需要将这些神经网络应用到嵌入式设备上,甚至是一些低功耗的嵌入式设备,以提高设备的智能化程度和与人的交互能力。
▲深度学习技术取得显著成效
与神经网络深度结合的DSP处理器将成为机器学习的实施方案
目前,因为内存、功耗、计算能力等限制,在传统CPU+GPU架构的嵌入式设备上实施神经网络还有难度。业界需要一种将神经网络引入到低功耗嵌入式设备的方法。
11月23日,全球领先的信号处理器IP授权公司CEVA在深圳召开了年度技术研讨会,并发布了专为在低功耗嵌入式设备上实现深度学习和人工智能应用的第五代图像处理器IP CEVA-XM6。
其主要参数包括:最高频率1.5GHz;采用8路VLIW以提高并行计算能力;创新矢量处理单元架构,确保95%以上的MAC利用率;32路SIMD矢量浮点单元可选项,支持IEEE半精度标准及常用的非线性运算增强。
为了让开发者更好的使用CEVA-XM6,CEVA还提供基于CEVA-XM6的软件开发平台,包括硬件加速器、神经网络软件框架、软件库、CDNN工具包。CDNN是CEVA的一套深度学习综合开发工具包,这次研讨会发布了其第二代产品。用户可以先在线下训练深度学习的神经网络模型,然后使用CEVA网络生成器将线下的网络模型转换成适用于CEVA-XM6处理器的实时嵌入式网络。
▲CDNN开发包与CEVA-XM6软硬件组合使用
在研讨会上,CEVA给出了一个对比案例,使用CEVA-XM6处理器的参考设计开发板,相比于NVidia今年推出的TX1 GPU在实现AlexNet和GoogleNet两种神经网络时,处理速度快4倍,同时能耗效率提高25倍,十分适合应用在低功耗的嵌入式设备上,如智能摄像、人脸识别、无人机、全景拼接、3D重建等。
▲CEVA-XM6的应用场景
具备机器学习功能的终端设备将催生更多的应用场景
智能家居要真正做到智能化,与用户之间良好的交互能力必不可少,比如语音控制、手势控制等,这些都需要产品具有深度学习的功能,能够识别出用户的语音命令和手势动作。
在本次研讨会上,美国的一家语音处理技术公司展示了他们基于CEVA的处理器IP开发的低功耗语音控制芯片方案,应用于智能手机、智能家居的语音交互和语音控制,工作电流低于1mA,可以去除静态和非静态噪声,根据使用场景做定制化开发,通过前期的语音训练后能够只识别主人的语音,过滤其他人的语音命令,防止别人的误操作。
在机器视觉领域, Arcsoft公司展示了他们的最新的照片美化技术,除了传统的白肤、瘦脸等美颜功能外,还可以基于图像识别分析出拍摄对象的年龄、性别、人种、情绪和拍摄环境(如白天、夜晚)等因素,针对不同场景和对象做定制化美颜处理,省去了用photoshop做后期处理的环节,让一个普通人也可以非常简便地拍出专业级的美丽图片。他们还推出了画面防抖功能,当用户手持相机走动拍摄视频时,通过处理可以使画面保持静止状态,消除走动带来的画面抖动。
总结
随着技术的发展,原本只能在大型高功耗计算平台上实现的深度学习神经网络,将逐步在低功耗嵌入式设备上实现,使得人工智能离我们的日常生活又近了一步,也提高了物联网设备的智能化程度。在产品开发上,软硬件深度结合的开发模式将越来越普遍(比如CEVA推出的CDNN开发包与CEVA-XM6的组合使用),基于特定场景应用的算法优化和数据训练之后的智能设备才能跟人们的日常生活无缝对接,物联网技术与具体行业具体领域的联系将会越来越紧密。
上一篇: 深度学习在计算机视觉领域的前沿进展