沈向洋谈AI:AlphaGo让人敬仰 但未见商业化能力
作者︱崔玉贤
在微软总部西雅图传闻中的34号楼,几家媒体已经开始在会议室落座等待。与其说是等待,不如说是翘首以盼。因为即将接受采访的这个人刚刚入选了美国工程院院士,工程界最高的荣誉之一。他就是微软全球执行副总裁沈向洋,微软核心管理层唯一的大陆华人,职位仅次于CEO ,也是美国科技行业职位最高的华人。
除此之外,媒体更愿意让他能够分享一些对人工智能的思考与看法,去年(2016年)9月份微软新成立的“人工智能与研究事业部”由沈向洋全权负责。当然,还有一个八卦心(也可以说是好奇心):对于被誉为“硅谷最有权势华人”陆奇离开微软,加入百度的看法,毕竟当时陆奇进入微软还是因为沈向洋的介绍。
果然,沈向洋如期而到。据说,采访当天早上沈向洋才从外地匆匆忙忙赶回西雅图,但看到媒体的沈向洋完全没有倦容,很是兴奋的给大家介绍微软园区的情况。他总是能够知道媒体想要什么,不经意间透露一些料。
“他更懂得识人”
据说,在微软总部园区有一个停车场最靠近电梯,只有4个车位,其中有一个是萨提亚纳德拉的,还有一个就是沈向洋的,足以证明其在微软的位置。从1996年毕业于卡内基梅隆大学,然后进入微软研究院;再到2013年成为微软全球执行副总裁,职位仅次于CEO;再到2016年全面负责微软全球人工智能战略;2017年被选入美国工程院院士,沈向洋的每一步都成为了一个传奇。
虽身居高位,但沈向洋从来没有架子。来自微软的员工透露,沈向洋非常随和,而且非常幽默,敢于自黑,在路上相遇总是喜欢主动和人打招呼。同时,在工作上沈向洋非常认真,在此次媒体采访之前,他还特意要了所有媒体的资料和介绍,做好了功课。
在他负责微软人工智能与研究事业部之后不久,微软便在语音识别上取得了历史性突破。微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了出错率低至6.3%的突破,这意味着微软的语音识别系统的语音识别能力已经与人类专业高手持平。此前,更多是IBM在语音识别领域取得领先的地位。
带领团队取得这一突破性进步的正是微软首席语音科学家黄学东,当问起为何微软能够取得这样的突破时,黄学东更愿意把功劳归为沈向洋。黄学东只提到了一句话“他更会识人”。
微软员工透露,沈向洋用人举贤有不避亲,即使是空降到新团队也会把得力亲兵带过去一起干,同时也深入新团队了解情况,和一线码农一对一谈队伍,抓问题。
对于被誉为“硅谷最有权势华人”陆奇离开微软,加入百度,沈向洋表示“我只能祝福,非常感谢陆奇过去八年在微软做出的巨大贡献,我也非常相信陆奇在新的岗位上会再创辉煌。” 最初陆奇加入微软时,正是沈向洋向当时微软CEO鲍尔默进行的推荐。
沈向洋当选为美国工程院院士正是因其“在计算机视觉和图形学的突出贡献,以及在业内的研发领导力。”
AlphaGo让人敬仰 但未见商业化能力
人工智能已经成为一个热词,每个公司CEO如果不谈那么一下人工智能都称不上是一个科技企业了。科技巨头纷纷投入人工智能当中,谷歌、IBM、微软以及英特尔等等。“人工智能实际上已经成为了一种文化。谷歌会说他们就是一家人工智能公司,就连Salesforce也会提到说要做人工智能,启动了一个叫’爱因斯坦’的项目。”沈向洋表示。
谷歌因其AlphaGo大胜韩国世界围棋冠军李世石而被人所知;IBM的人工智能助手沃森被认为是其发展一百多年历史当中最具创新力第一次举措,也代表着人类进入人与机器相互融合阶段;微软则单独成立了人工智能与研究院……
对于人工智能的发展,最让沈向洋兴奋的两点:一个是人工智能能力的增强;另外一个就是人机交互界面的彻底颠覆。
“人工智能能力在不断增强,尤其在语音与计算机视觉方面。我认为,五年之内计算机视觉一定会超过人类;而十年之内,计算机视觉识别也一定会比人类更强。”沈向洋认为。
正如上文提到的,微软语音识别技术出错率低已至6.3%,已经与人类专业高手持平。
“最让我激动的还有就是所谓人机交互界面的彻底颠覆。”沈向洋表示,“无论人工智能到底怎么定义,这么多年以来,计算机科学的发展自始至终都在做一件事情——人机交互。包括手机、笔记本的发展都是如此。我们一直在研究如何与计算机同存共进。”
沈向洋认为“用户图形界面”的概念正在被颠覆,语音用处越来越多,未来视频类技术也会随着跟上。而这也是微软一直在提的概念:对话式人工智能。比如其小娜、小冰。
相比谷歌的AlphaGo在围棋方面大战人类,沈向洋更看重人工智能在商业领域的突破。
“我对AlphaGo除了敬仰还是敬仰,真的非常了不起,的的确确打破了很多人对人工智能的想象。”沈向洋坦言,“但是AlphaGo虽然很了不起,我们却看不到它能真正应用到商业领域的地方。我个人认为,近三到五年,人工智能的突破还是在商业领域的应用。”
具体来说是人工智能在传统商业领域,比如销售市尝客户支持、人力资源等领域的应用。
沈向洋以市场销售为例。过去销售一件商品可能需要打很多拜访电话,有一个非常长的潜在客户名单。在面对这么多客户名字、公司的时候,需要判断在有限的时间里应该先联系谁,后联系谁。但是有了越来越多的数据可以参考和分析之后,可以利用人工智能技术让效率提升五倍、十倍。
“脑科学+AI”将是最有意义的方向
“AlphaGo已经证明了在围棋这个场景,机器比人厉害。但是未来,人工智能不需要证明它的计算能力和算法高于人,而是在无法理解的领域有所突破,也不光光是情感。”沈向洋表示。
相比计算能力,沈向洋一直在强调人工智能的“情感”能力。他认为,虽然情感到底是什么至今都没有定论,但情感肯定不是计算,也不是计算出来的。之所以认为人类是智能的,就是因为人类有大脑。但对于大脑的神经科学的研究进展还非常缓慢,因此,沈向洋认为接下来“脑科学+AI”一定会成为科研角度最激动人心的方向。
“如果我的学生说他想念博士的话,我会鼓励他们往这个方向去思考,这一定是接下来三十年最有意义的方向。”沈向洋提到。
其实,微软的人工智能助理小冰已经带有“情感”的成分。这一“情感”成分来自大量的社交网站数据。小冰从诞生到现在已经有31个月,拥有4000万用户,在不断与其对话过程中,小冰也在不断深入学习,沈向洋认为小冰其实是数据驱动的方式在学习人类的情感。
但是,当人工智能发展到拥有语言能力,语音能力,视觉能力以及理解能力的时候,人类是否会开始畏惧人工智能的发展呢?
沈向洋直言:“我觉得畏惧也没有用。在任何一个技术浪潮到来的时候,我们都会非常谨慎。比如核能的例子,我们需要监管核能,因为一不小心就可能出大事。人工智能其实也产生过很多问题,包括伦理和偏见的问题。”
因此,微软在公司内部成立了一个人工智能伦理委员会,不断学习和探讨这方面的问题。
微软人工智能普及化
在人工智能方面,微软一直强调“人工智能普及化”。这一概念是萨提亚在2016年Ignite大会上提出来的,并且描述了人工智能普及化的蓝图。
微软这一概念更多的是针对开发者。微软上线了基于微软智能云的微软认知服务,在这个服务上微软开放了25个API,对于开发者来说可以介入语音、视觉、自然语言或者搜索等各种功能。据沈向洋透露,上线后很短时间内,微软已经累计了接近一百万个开发者。
“我们相信,只有让这些开发者真正利用上最新的人工智能技术,才能通过他们让人工智能普及起来。”沈向洋表示。
微软希望能够让更多人用到人工智能,享受到人工智能带来的技术、商业和用户体验上的提升。