微软人工智能愿景:根植于研发 寄望于“对话”
过去25年来,微软公司持续投入人工智能的发展愿景。现在,借助全新发布的聊天机器人Zo、Cortana Decices SDK和智能套件、以及扩展智能工具,这一愿景即将成为现实。
12月13日,在旧金山的一次小聚会上,微软全球执行副总裁、人工智能与研发集团负责人沈向洋博士表示:“根据多个行业标准,我们的计算机视觉算法已经超过了行业内的其他竞争者——甚至是人类自身。更让我兴奋的是,我们在计算机视觉领域的技术成果已被用于HoloLens全息眼镜等产品,甚至应用到了客户的产品(如Uber开发的程序)中。”
1991年,当比尔·盖茨创建微软研究院时,曾提出过一个愿景:让计算机能看会听,并可理解人类的想法。这一理念一度吸引了许多顶尖天才加入微软研究院。
今年10月,微软成为业内第一家实现了对话语音识别技术达到人类专业水平的公司。Skype Translator获得了突破性进展,现已支持9种语言的互译,这是微软加速从技术研究到产品落地的一个实证。通过Skype Translator,微软可以让世界各国的人在交流时能即时了解对方的意图,但面对面实时翻译的梦想是否真能实现呢?基于微软新的智能语言和语音识别技术,Microsoft Translator现在可以实现现场实时翻译多钟语言,在人与人之间建立联系,破除语言的藩篱。
微软还建立了或许是全球最大的知识图谱(Knowledge Graph)。这要归功于必应搜索引擎与Office 365,是它们使得了解数十亿“人、地点、事物”成为可能。现在,我们有机会将“世界知识”与人类的“工作知识”联系起来。
微软的愿景极具勇气且涵盖甚广——构建跨越媒介、应用、服务与基础架构的真正的人工智能系统。这一愿景还有着很强的包容性。微软旨在面向所有人和组织普及人工智能,无论消费者、商家还是开发者,都能从人工智能获益。
“我们一直在努力普及技术全民化。有了人工智能,我们便可以通过以下两种方式来实现这个目标:一种是将其融入像Office 365这样的产品中,另一种是构筑一个平台,让其他人也能在此平台上开发产品和不断创新。” 沈向洋博士说。他称自己即是由“研究员转型为产品经理”的典型。
这个平台被称为“微软认知服务” ——它包含了25个应用程序接口(API),可以提供诸如语音、语言、知识和搜索之类的智能功能。
微软的新一轮创新要想取得成果,还需要与合作伙伴进行深度合作。
“几周前,就在这个房间,我和Sam Altman一起宣布了与‘AI开放联盟’(OpenAI)的协作计划。与其他人合作,在其他人工作的基础上继续前进,这是一件很美妙的事。”沈向洋说。
当前,我们正处于向计算领域下一代主流平台进军的早期阶段。借由人工智能领域所取得的一系列重大进展, 新一代平台将以“对话”这一人类最自然的行为为核心来构建。新的时代已呼之欲出——数字体验映射出人们互动的方式,我们从人类学着了解计算机操作的时代进入到另一个时代——让计算机了解人类和人类的动机,并积极予以回应。
Zo正式发布
“对话计算”(Conversational Computing)一体两面——一面是强调完成任务、提升生产力;另一面是情感连接。要想真正实现人工智能的梦想,就必须从两个方面同时发力。
微软的长远战略是,像Cortana这样的应用不但要有智商(IQ),还要有情商(EQ)。基于这一理念,微软在聊天机器人领域屡屡斩获重大的且具开创性的研究成果。
这一革命的下一幕就是Zo。
Zo是一款社交聊天机器人,她是基于微软在中国和日本大获成功的人工智能社交聊天机器人小冰与凛菜而打造。现在,你可以在Kik社交平台上与她交谈,就像和人类朋友聊天一样。未来, 微软计划将Zo扩展到其他社交平台,例如Skype和Facebook Messenger。
Zo是利用海量互联网社交内容构建而成的。她从人类互动行为中学习,以便从情感与智能角度做出响应,提供独特的观点,并懂得礼节与表达情感。但是她同样还有强大的核对与平衡机制,以保护自己免遭不当利用。
微软聊天机器人的开发历程始于2014年5月,当时,微软在中国推出了小冰。如今,她已拥有超过4000万用户,比整个加州的总人口还多。她与用户的平均对话轮数为23次,是行业平均值的十倍还多。小冰还是第一个在东方卫视承担主播职责的人工智能聊天机器人——东方卫视是中国上海最大的电视台,拥有逾8亿观众。继小冰在中国获得成功后,2015年7月,微软又在日本推出了凛菜(Rinna)。时至今日,大约相当于全国20%人口的日本用户经常和凛菜交流。
在美国,Zo已与超过10万人交谈过。迄今为止,有超过5000名用户与Zo有过超过1小时的交谈。最长的单人单次对话则创下1229轮、持续9小时53分钟的新纪录。
“这是一种非常个性化的体验,”沈向洋说,“我们正在真实地经历从‘让人类了解计算机’到‘让计算机了解人类’的时代转变,也就是从以机器为中心转向以人类为中心,从感知到认知,从理性转向感性。”
在机器人框架下构建
微软已经推出了机器人框架(Bot Framework),以及相关的工具、服务和数据,以方便规模大小不一的各类开发者和企业用户都可以使用微软技术来进行构建和实验。
微软认识到,企业用户希望打造出先进的机器人,来简化流程,更好地为他们的客户提供服务。例如The bank of Kochi in Japan正在开发一种机器人接待员;Rockwell Automation想要开发一种用于生产自动化的机器人; the Department of Health Services in Australia想要开发一种机器人,帮助改善与客户互动关系。
“我们讨论的是机器人大脑的概念,从各个层面来说,这都应该算是今后十年里软件开发领域的一个重大挑战。”杰出工程师、微软FUSE实验室总经理Lili Cheng说:“我们的机器人框架(Bot Framework)及其开发服务并不止是为了让人们能在这一领域更轻松地起步,我们还希望这些充满未来色彩的场景能够早日实现。”
超过67,000名开发人员目前正在使用微软的机器人框架(Bot Framework)及认知服务。未来的更新将包括服务于微软Teams与Cortana Bing Location的机器人连接,以及新的QnA Marker服务,此项服务可以处理商家收到的最常见问题,甚至可以让非开发人员都能轻松构建自己的机器人来回答问题。
“利用微软机器人框架(Bot Framework)工具和微软知识图谱,我们正在为客户创造崭新的个人生活与工作环境应用场景,”Skpye全球资深副总裁Amritansh Raghav说,“这些创新将用于各种应用程序、电子邮件、聊天平台、移动设备以及连接设备。”
客户如果想要充分利用这些机器人所带来的机遇,一个可以取得成功的途径就是利用Skype与 微软Teams之类应用程序的体验。利用使用广泛的Skype调用应用程序接口,Skype现在提供交谈机器人服务,并为合作伙伴提供构建富媒体卡片的工具,允许用户将视频、动画GIF和音频添加至此类机器人中。
合作伙伴对于帮助构建富有吸引力的全新客户体验至关重要,Hipmun是微软最早的合作伙伴之一,去年春天发布了构建于Skype之上的机器人。
“我们存在的意义就是让旅行不再痛苦不堪,”Hipmunk联合创始人兼首席执行官Adam Goldstein说,“我们认为虚拟助手是这一服务的自然延伸——迄今为止这看起来是帮助人们轻松规划和预订旅行的最佳方式。可发现性至关重要,Skype的机器人目录让那些想要让旅行生活变得轻松有条理的人能够很快找到机器人。”
一个智能助理解决一切
微软在描摹人工智能与对话计算的前景时,还有一个很重要的部分是应用所扮演的角色,比如Cortana。现在,在全球13个国家和地区,有超过1.45亿人正在使用Cortana。Cortana可以没有限制地跨平台,跨各种连接设备使用。
每个人都应该拥有自己的个人助理,以便在我们奋力打拼的同时,帮我们处理好一切问题。
“要实现这样的目标,我们需要先关注一下个人助理可以帮助你分担哪些工作。我们当中有一半人会通过电子邮件,定期为自己发送任务或提醒。许多人会使用任务清单。我就曾在办公室的墙壁上贴便笺,”微软合作伙伴群组计划经理Marcus Ash说,“所以,我们正在想方设法,把那些影响用户掌控全局的问题清除掉。”
Cortana可在多种移动平台上使用。目前已在电子邮件中,以Calendar.help新服务形式出现;在旅游行业,以Expedia的新技能形式出现;在银行业,以Capital One的新服务形式出现。下一步就是让所有的计算机与设备制造商都能够使用Cortana,以便在所有平台上构建更智能、更有用的设备。这就是微软推出Cortana Devices SDK的目的所在。
微软正在和众多设备领域的合作伙伴合作,以将Cortana集成至他们的连接设备中。Devices SDK可将Cortana技能应用到生产、音乐、家用自动化和设备控制等领域。
很快,Cortana会以一种全新的方式出现在千家万户,这要归功于微软的合作伙伴——高端音频设备制造商哈曼卡顿(HarmanKardon)。
微软的下一步
微软认为,开创性技术必须来源于不间断的尝试、无畏的探索,以及对创新的长期投入。
虽然取得了诸多成果,然而在人工智能发展的进程中,仍有许多亟待解决的棘手问题。在此前一波又一波新技术(例如互联网、移动、APP应用)面世的早期阶段,都曾感受过成长的烦恼。人工智能也不例外。
“探索与学习,无远弗界。”沈向洋博士说,“我们将会和整个行业分享我们学到的知识,我们将推动人工智能技术的全民化普及,加快人工智能惠及社会的步伐。”