欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

谷歌百度脸书IBM,人工智能四巨头2014盘点

程序员文章站 2022-03-05 11:57:57
2014年,人工智能得到了前所未有的关注, Eron Musk和霍金的“人工智能恶魔论”在学术界和产业界引发了激烈争论;资本对这个方向也是趋之若鹜,截止到2004年,有超过20...

2014年,人工智能得到了前所未有的关注, Eron Musk和霍金的“人工智能恶魔论”在学术界和产业界引发了激烈争论;资本对这个方向也是趋之若鹜,截止到2004年,有超过20亿美元的风险投资流入到基于认知技术研究的产品和服务里,超过100家的相关公司被互联网巨头收购。而对于普通用户来说,只有当那些科技巨头在人工智能领域实现布局,并将这些技术应用到具体的产品和服务中时,他们才能真正感受到人工智能带来的优势。而去年恰恰是这些科技巨头动作极其频繁的一年,接下来,本文将对谷歌、百度、Facebook和IBM四家科技公司在人工智能领域的布局和研究成果进行盘点。

谷歌百度脸书IBM,人工智能四巨头2014盘点

谷歌

KK在谷歌创业初期跟拉里·佩奇聊过,已经有一个性能不错的搜索引擎,为什么还要做一个?拉里·佩奇说,不是要开发新的搜索引擎,我们要做的是人工智能。而对于“一家科技公司如何才能保住主导地位?” 佩奇认为,最好的方式就是投资未来。佩奇希望继续增强对未来科技的布局,继续以最不可思议的方式改变世界,而人工智能就是其中非常重要的一个方向。

1) 对DeepMind的收购及后续运作

2014年年初,谷歌以4亿美元的架构收购了深度学习算法公司——DeepMind,公司创始人哈萨比斯是一位横跨游戏开发、神经科学和人工智能等多领域的天才人物。7月,谷歌以DeepMind为主体与牛津大学的两支人工智能研究队伍建立了合作关系。

DeepMind也很快发布了研究成果,它在10月份公布了一种新的模拟神经网络,旨在模仿人类大脑的工作记忆原理,拥有更加强大的归纳整理和联想演绎等逻辑处理能力,从而带来更快的任务处理速度,还可以通过训练去自行处理任务,这种全新的深度学习算法可用于计算机视觉和语音识别等领域。

2)自动驾驶汽车

奇点大学的网络与计算部门负责人Brad Templeton认为,在接下来的10-20年里最具改变世界潜力的技术是自动驾驶汽车,而谷歌在这方面要领先于传统汽车厂商。

此前,谷歌的自动驾驶汽车已经完成了总计70万英里的高速公路无人驾驶巡航里程。在此基础上,谷歌于7月份推出了100辆原型车来执行小规模的市区道路测试,这是自动驾驶行业首次进行的规模化城市道路测试。谷歌的原型车安装了17个感应装置,搜集来的信息能快速建立起一个半径200公尺的3D信息图,让车辆对外部环境进行分析判断,实现360度的全方位防护。谷歌预计在2014年底前打造200辆测试车,并在寻求与汽车制造商进行合作,计划五年内实现无人驾驶汽车的量产和投放市常

3) 以Nest为基础的智能家居生态系统建设

谷歌于2014年1月份以32亿美元收购了智能家居制作商Nest,该公司主要提供智能恒温器和智能烟雾探测器,并已经拥有 100 多项专利,200 多项专利已在美国专利局备案,另有 200 多项专利准备备案。6月份,谷歌通过Nest花费5.55亿美元收购了基于云端的家庭监控公司Dropcam,10月份,又收购了智能家居中枢控制设备公司Revolv,该公司将参与Nest的开放计划“Works with Nest”。Nest对于产品的研发也是马不停蹄,于2014年年底一口气发布了四款产品,包括一款室内自动恒温计、两款网络监控摄像头和一款烟雾警报器。

谷歌已经意识到智能家居领域将是未来人工智能应用的一个重要市场,所以通过一系列并购、开放平台的建立、软件硬件一体化来打造这个生态系统,而Nest创始人Tony Fadell一篇文章的标题《欢迎回家》也反映出了谷歌在智能家居领域布局的前瞻性和决心。

4) 在图形识别和语音识别研究领域的重大进展

2014年,谷歌开始了开发一套能够整合公司海量数据的语音系统,这个正处在测试阶段将会使计算机从本质上“听懂”和“思考”人们向谷歌设备输入的语音。这个团队将前馈神经网络替换成了递归神经网络,提高了系统对语音信息的存储和处理能力,并能够使用上下文、物理定位及其它方式对谈话者的真正含义进行预测,就像人在谈话时大脑所做的一样。

在图像识别方面,谷歌在8月份收购了一家图片分析公司Jetpac。Google研究院也发表了一篇文章,表明未来Google的图形识别引擎不仅仅能够识别出照片的对象,还能够对整个场景进行简短而准确的描述。除此之外,谷歌一直在积极吸引图像识别和计算机视觉方面的专家参与到谷歌的项目研究中来,比如说向研究计算机视觉和模式识别的助理教授Devi Parikh授予了谷歌内部研究奖项Faculty Research Awards和 9万美元的无限制基金,并允许她直接同谷歌的其他研究者和工程师进行合作。

根据德勤发布的一份报告显示,Google在2014年将语音识别的精准度从2012年的84%提升到如今的98%,移动端Android系统的语音识别准确性提高了25%;计算机视觉技术也取得了突飞猛进的发展。如果以计算机视觉技术研究者设置的技术标准来看,自2010年到2014年,图像分类识别的精准度提高了4倍。

5)总结

总体看来,谷歌在人工智能的布局依然符合它“将全世界的信息联系起来并给出最佳处理结果”的使命,在这一目标下,谷歌的行为可以大致分成两个路径,第一是覆盖更多的用户使用场景,从谷歌传统业务覆盖的互联网、移动互联网延伸到智能家居、自动驾驶、机器人(2013年收购了8家机器人公司)等领域,从而抓取到更多信息,这可以看做是信息积累和输入的过程。第二个方面是不知疲倦的做好底层人工智能技术的积累,研发更加高级的深度学习算法,增强图形识别和语音识别能力,从而能对第一阶段收集到的信息进行更好的处理和反馈,这可以看做是信息的处理和用户服务的输出过程。在这两个过程下,谷歌就将人工智能渗透到了其各种产品的方方面面,从而为用户带来更多的使用场景和更加智能的功能。

百度

中国的搜索巨头百度公司与谷歌有些类似,都是以互联网搜索为基础,都是技术导向型公司,而且在人工智能领域的布局也是走在互联网行业的前列。我在文章《搜索引擎到人工智能的终极演进》中提到了目前的搜索引擎看以看作是未来人工智能的雏形,依托于搜索本身积累的用户和数据,再加上云服务、深度学习等技术,很有可能实现从传统的互联网搜索服务向人工智能高级形态的进化。而百度的Andrew Ng也在演讲中提到了人工智能的正循环——拥有深度学习算法之后,将不再惧怕海量数据,反而会因为数据的增长而取得更好的效果,而这些效果将直接体现在图像搜索、语音识别等具体的互联网服务中,从而为用户提供更好服务并吸引更多用户,这又会产生更多数据。因此,百度在人工智能领域的布局既表现出了其作为技术公司的敏感性和前瞻性,同时也可以看做是百度走向未来的必由之路。

1)引进Andrew Ng及组建北美研究院

2014年5月,深度学习专家Andrew Ng(吴恩达)加盟百度,并负责同期成立的北美研究中心。由于相对于传统互联业务,人工智能的技术门槛相对较高,而对于相关技术人才的引起也就显得尤为重要。在谷歌和Facebook相继聘用了Geoffrey Hinton和Yann LeCun之后,百度将另一位人工智能大师Andrew Ng引入,这体现出百度与美国互联网巨头谷歌和Facebook在人工智能领域展开竞争的勇气和实力,而北美研究中心的建立也表明百度将继续与硅谷的互联网巨头争夺人工智能领域的人才。而Andrew Ng与余凯、张潼、AdamCoates、徐伟等组成的顶尖团队将会成为百度发展人工智能坚强后盾。

2)大数据积累和平台开放

大数据是人工智能的基础,而作为天然的大数据企业,百度拥有强大的数据获取能力和数据挖掘能力,百度副总裁王劲更是将百度技术布局描绘为一张剑形图,人工智能、大数据等技术化作剑锋。百度除了做好数据积累和挖掘以外,还加快了大数据平台的开放步伐,于2014年4月发布了大数据引擎,向外界提供大数据存储、分析和挖掘技术,而且在医疗、交通和金融领域有了具体应用。

2014年7月14日,百度凭借自身的大数据技术14场世界杯比赛的结果预测中取得全中的成绩,击败了微软和高盛。2014年9月,百度正式发布整合了大数据、百度地图LBS的智慧商业平台,旨在更好在移动互联网时代为各行业提供大数据解决方案。

3)语音识别和图像识别

2014年12月,美国《福布斯》发布文章称,吴恩达及研究团队发明了一种新的语音识别方法,这款基于深度学习的名为“Deep Speech”语音识别系统可以在嘈杂环境下实现将近 81% 的辨识准确率。卡耐基梅隆大学工程学助理研究教授Ian Lane对其的评价是“百度研究院最近的工作有可能颠覆语音识别在未来的应用效果。” 吴恩达表示,该语音识别系统采用深度学习算法取代了原来的模型,在递归神经网络或者模拟神经元阵列中进行训练,让语音识别系统更加简单。同时这套系统还使用了Nvidia等芯片制造商出品的多枚图形处理器(GPU),这些处理器通过并行连接,能够用比普通计算机处理器更快的速度训练语音识别模型,从而提高工作效率。

在图像识别方面,余凯称摄像头成为连接人和世界信息的重要入口之一。而百度也一直在利用深度学习技术来提高图像识别的精度。2014年9月,百度云结合百度深度学习研究院提供的人脸识别及检索技术,推出云端图像识别功能。11月,百度发布了基于模拟神经网络的“智能读图”,可以使用类似人脑思维的方式去识别、搜索图片中的物体和其他内容。

4)人工智能算法和云计算

百度大脑既需要人工智能算法,也需要云计算中心提供硬件支持。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,构建了世界上最大规模的深度神经网络。

百度在国内拥有十几座云计算中心,为满足人工智能在计算和存储上的高要求,还投入使用了4万兆交换机,并在探索10万兆交换机。百度还是全球首家将GPU用于人工智能和深度学习领域、并规模化商用ARM服务器的公司。百度将这些整合在一起,就形成强大的存储计算能力,从而可以进行多样的并行计算,支持生成、配置针对不同应用和场景网络结构,从而为人工智能提供有力的硬件支持。

5)自动驾驶项目

2014年9,百度宣布已经与宝马正式签署合作协议,共同研发自动化驾驶技术。其中,百度的三维地图及相关数据服务也将被融入宝马的车辆导航系统中,为自动驾驶汽车提供技术支撑。双方计划在接下来三年时间内,合作研究高度自动化驾驶在中国道路环境下面临的技术挑战,通过智能技术加强道路行驶安全性,减少交通事故及人员伤亡。

6)总结

百度在人工智能领域的布局可以总结为三点,第一,具有战略眼光,与世界科技巨头保持同步;第二,自身技术基因又使其非常注重技术人才的引进和人工智能底层技术的积累;第三,互联网入口的地位和丰富的产品线使得人工智能技术能够迅速落地,转化成具体的产品和服务。也正因如此,2014年11月首届百度技术节才会以“奇点临近 技术引领未来”为主题,展望如何通过人工智能来改变世界。

Facebook

Facebook在人工智能领域的布局主要围绕着其用户的社交关系和社交信息来展开,在2013年加入公司的深度学习鼻祖Yann LeCun的帮助下,公司的图像识别技术和自然语言处理技术大幅提升。

Yann LeCun是纽约大学终身教授,是卷积神经网络领域的重要推动者,而该技术的最主要应用就是图像识别的自然语言处理,这与Facebook的需求和已经积累的数据类型非常匹配。在Yann LeCun的帮助下,2014年Facebook的DeepFace技术在同行评审报告中被高度肯定,其脸部识别率的准确度达到97%。而他领导的Facebook人工实验室研发的算法已经可以分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。而不久后,那些算法还能够分析用户在状态帖子中输入的文本,进而自动提示相应的标签。他还表示,想在Facebook中建立一个智能助手,如果用户上传的照片中又令人尴尬的内容会进行识别和提醒。用LeCun的原话来说就是——Facebook人工智能实验室的职责就是给予用户更多的在线身份控制权,而不是削弱你的控制。

IBM

IBM目前看起来可能没有谷歌和Facebook这样酷,但其在人工智能领域有着丰富的底蕴,并在2014年采取了若干举措。主要是开放了Watson平台和发布了模拟人脑芯片SyNAPSE。

1)超级计算机沃森的开放战略

2014年1月初,IBM宣布组建“Watson Group”,旨在进一步开发、商用及增强“Watson”及其他认知技术,还将给其投入10亿美元资金用于研发和其他投资。现在,IBM宣称如今的Watson比2011年参加《危险边缘》“智能”了2400%,而且尺寸也已经从过去的卧室那么大缩减成三个披萨盒那么大。同时,IBM还推出了两项Watson数字顾问服务,一项用于帮助企业从海量数据获得洞见,另一项则旨在使得数据可视化。Gartner预计在2015年之前,将会形成一个由Watson衍生出来的巨大的智能顾问市场;而法国农业信贷银行预测那些系统创造的收入将在2018年占到IBM总收入的12%以上。

2014年3月,已经在医疗和金融行业都有所应用的Watson又开始与纽约基因中心(New York Genome Center, NYGC)的合作。8月,IBM声称Watson即将被用于科学研究,目前,测试科学假设和理论常常需要花费几天甚至几个月时间。不过,借助沃森的“Discovery Advisor”项目,这样的工作可以更快地完成。

2014年5月,IBM通过Watson Group收购了人工智能创业公司Cognea,该公司开发了一个认知计算和对话式人工智能平台,为用户提供个性化虚拟助手服务。IBM对于 Cognea的定位是能够理解用户的个性化需求,将互动提升至一个新的水平。

本年,Watson也被部署在IBM去年收购的云计算基础设施业务Softlayer上,成为IBM与亚马逊、谷歌、和微软、等大型科技公司在云计算领域展开竞争的武器。

2)人脑模拟芯片SyNAPSE发布

2014年8月,IBM再度发布能模拟人类大脑的SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自适应塑料可伸缩电子神经形态系统”)芯片,相比前一代原型,新的芯片已达到量产要求,并且拥有100万个“神经元”内核、2.56亿个“突触”内核以及4096个“神经突触”内核,而功率则仅有70毫瓦,该芯片能够模仿人脑的运作模式,更擅长进行模式识别,而且低功耗,在认知计算方面要远远穿过传统计算架构。

3)总结

IBM在人工智能领域的布局还是在围绕着Watson和SyNAPSE做文章,这代表着他们在人工智能领域长时间技术积累,同时IBM也在越来越开放,希望能像其他科技巨头一样,建立一个真正的开放性的技术平台,真正组建一个生态系统,因为人工智能领域的技术门槛相对较高,所以在这个时代来临时,或许会成为IBM逆转的好时机。