欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

一起进入超级机器人的探寻之旅

程序员文章站 2023-11-11 12:48:40
机器人的时代已经来临,而且随着它们的不断学习,在 2016 年它们可能会取代现有的网络。我认识的第一个机器人叫 Googly Minotaur,诞生于 2001 年,当时刚出世的它肩负着一项重任:为我...

机器人的时代已经来临,而且随着它们的不断学习,在 2016 年它们可能会取代现有的网络。

我认识的第一个机器人叫 Googly Minotaur,诞生于 2001 年,当时刚出世的它肩负着一项重任:为我今生挚爱的乐队 Radiohead 做《Amnesia》专辑的宣传工作。我和 Minotaur 打得火热,聊 Radiohead 乐队的历史,它为我提过巡演的资讯,还能提供 MP3 歌曲下载。所以 Minotaur 在乐队粉丝中大受欢迎,有超过一百万的人将它加为好友,在 Minotaur 的一生中总共发送了约六千万条信息。

然而,和当时其他机器人的命运一样,Minotaur 出生没几个月就夭折了,消失在人们的视野里。此后的十年里,机器人行业似乎一直处于冬眠状态,直到近些年,才又慢慢的活跃了一些。

XOXCO 是一家小而美的软件开发设计公司,对于公司员工来说,他们和机器人的交集要从墨西哥玉米卷开始说起。约莫是在 2013 年底,不管是在软件开发公司里光鲜亮丽的白领员工,还是在德州奥斯丁的办公室员工,每天都面临着人类的世纪性难题:中午吃点啥?是买流动餐车 Veracruz All Natural 上的墨西哥卷呢,还是附近就有的大众品牌 Torchy’s 的卷呢?还是说要买附近停车场的 El Primo,被老板 Ben Brown 称为“好吃的飞起的墨西哥玉米卷”呢?

所以,软件开发和技术出身的老板 Brown 决定出面为员工解决这个超级难题,治好他们的选择恐惧症。这要是放在 2000 年,任何公司的老板可能就只会 Google 一下哪家比较好吃。在 2010 年的话,他们可能会参考像大众点评的 Yelp 软件或者签到软件 Foursquare 来做决定。但在 2013 年,Brown 决定要写一个小机器人程序,很简单的软件,发送“中午吃啥好”,机器人就会从 Brown 事先建好的数据库里的约 20 家餐厅、餐车中选择一家进行回复。Brown 叫它 LunchBot(午餐机器人),虽然初期设计简单,但后期很快就发展得愈发成熟了。其他员工也开始向机器人数据库加入餐厅信息,随后,升级版本的午餐机器人能够记录下员工最近去过的餐厅,避免连续光顾同一家餐厅。

在互联网科技行业,有这么一个看起来好笑但业内人士引以为豪的传统,即原先闹着玩开发的东西最后却成了一门正经生意。

自然,原本公司员工自用的 Lunchbot 机器人也正式立项了。去年十月,XOXCO 公司宣布成功融资 150 万美金,用于开发机器人“Howdy”,致力于将日常工作任务自动化。Howdy 将立足于 Slack 发展,Slack 是一款将各种碎片化的企业沟通和协作集中到一起的社交应用,也是成长最快的团队沟通平台。Howdy 会在后台运行 “聆听”用户需求,在出现关键词和问题时激发运行。Howdy 能自动统筹会议,询问员工手头任务,收集回馈,并分配团队任务。(不用担心,你的午餐也包在 Howdy 身上)

2015 年,为数不少的投资人和创业者将注意力转移到了信息接口上,也越来越关注互联网机器人的发展。在智能手机市场,微信,WhatsApp,Facebook Messenger 崛起成为最受欢迎的手机应用。Slack也相应推出了聊天沟通的功能,并开放平台接纳开发者编写的机器人程序。而这一切的进步都要归功于自然语言处理技术的发展,使得搭建程序变得方便,在此基础上诞生的机器人才能明白我们的需求并作出不同的回应。

在过去的五年中,互联网的发展明显受挫——桌面网络发展缓慢,移动网络更是差强人意,人们开始着眼于其他市常近年来,发展势头不错的是原生程序。(译者按:基于智能手机本地操作系统如 iOS、Android、WP,并使用原生程式编写运行的第三方应用程序,也叫本地 app)大多数的手机应用在2015年的发展并不尽如人意,根据 ConScore 公司的数据显示,个人使用手机的总时间中,有 80% 的时间花在三个应用软件上;据一家社交广告公司 AdParlor 所称,对于开发者来说,用广告来吸引新用户太过昂贵,每吸引用户安装一次的平均成本就要 4.73 美金。

聊天机器人得以乘势发展。在 2016 年初始,硅谷里弥漫着一种不言而喻的共通感,老掉牙的数字助理将要卷土从来,回到主流市常像是 Siri,Alexa(亚马逊公司旗下的一款网页工具条软件),Cortana(微软开发的人工智能助理,微软小娜),过去几年中这些数字助理以语音辅助为主,但是 2016 年的发展趋势将转向文本辅助。机器人的时代终将来临,许多业内人员对这一点坚信不疑,若真如他们所料,随之而来的还有许多弊端:当人工智能包揽了一切工作,Google 将变得门可罗雀。智能助理将接管我们所有的数字类活动,直到最后完全接管独立运行的应用程序,以及维系着应用程序存亡的手机应用商店。许多网站开始感觉到自己已经是明日黄花,就像当年第一个提供个人主页服务的网站 GeoCities 一样,因为过气而被公司彻底放弃。因为现在可以把网页提供的信息写入机器人程序,用通信软件进行传输,完全不需要再诉诸网页。

好话说尽了,也总是有怀疑论者跳出来的。一位风投人层这样告诉我,机器人这个概念听起来就像是当年红极一时的“比特币”一样新潮,让人心甘情愿的掏出成千上百万美金来投资相关产业,为自己抢占市场先机而沾沾自喜不已。但硅谷永远在追逐下一个潮流:机器人可能只是这个炒作周期中较为新颖的技术罢了。也有技术人员告诉我,现有的技术还不足以真正搭建成基于文本的虚拟助理。然而我所认识的一些创业者们丝毫没有被这一技术难题震慑住,Operator 是一款结合人工智能和人工服务的在线购物

软件,通过文字对话方式为用户提供服务,公司的首席执行官 Robin Chan 表示“信息将成为互联网下一阶段的主要界面——或是反其道而行之。这种大趋势已经成为市场主流,许多大型的应用程序也开始追逐潮流。”

一起进入超级机器人的探寻之旅

就在这礼拜,Facebook 的创始人 Mark Zuckerberg 宣布 2016 年他要打造电影《钢铁侠》里的 Jarvis 那种人工智能机器人帮他管家、分担工作。据他说,灵感来自于团队正在开发的 Facebook Messenger 功能,宗旨是“为您解决一切问题的智能机器人”。

虽说好一部分业内人士是最近才开始关注机器人行业的,但是机器人技术早有一段源远流长的历史。计算机之父图灵早在其 1950 年发表的划时代论文中,就提出用图灵测试来检测机器模仿人类智力的能力:将人机之间进行的一段文字对话进行分析,看旁观者是否能分出哪一方是机器。如果机器人成功迷惑了旁观者,就被视为通过了测试。

第一个通过测试的机器人程序出现在 1966 年,这个叫做 ELIZA 的程序能在脚本中根据用户的回答做出反应,其中最著名的一次是扮演一位精神治疗医师,她会询问你的病症,在你的回答中寻找关键词,然后编出一个像模像样的回答。如今我们会把很多东西叫做“机器人”,有的机器人会潜伏在网络中爬行,不断收集内容以增加自身的可搜索性;有的能控制游戏人物;还有黑客利用终端电脑组成“僵尸网络”,不停发送垃圾邮件、诈骗广告或是攻击网络使之拒绝服务,这也算是“机器人”。但是 ELIZA 程序的出现指向了一种特定的机器人模式:基于文本形式的虚拟助理。

机器人在 2001 年的时候再次掀起热潮,一家叫 ActiveBuddy 的公司开发了一款叫 SmarterChild 的机器人程序:这是一款 ELIZA 风格的聊天机器人,内置于美国当时风靡一时的 AIM 即时通软件中。SmarterChild 可以为用户提供新闻,天气预报,电影时间和其他一系列的咨询。当时,有近三千万的用户在他们的 AIM 中安装了 SmarterChild 程序。

但 AIM 软件最终和美国在线 AOL 一起淡出了用户视野,像 SmarterChild 和 Googly Minotaur 一类的机器人也销声匿迹了。与此同时,Google 崛起成为用户获取信息的主要来源,在此后近十年的时间里,机器人退出了历史舞台。

一起进入超级机器人的探寻之旅

随后是移动互联网的时代,如今苹果的 iOS 平台约有 150 万的应用程序,安卓平台有 160 万。主流的应用大约是提供这么几种服务的:叫车,点外卖,预定旅程,以及同事之间的交流。

软件开发者的好时代快要走到尽头了

在台式机的年代,从*到 Orbitz 和 Priceline 之类的订票网站,再到大众点评的鼻祖 Yelp,正是搜索引擎负责帮用户周转于各大网站。在手机的年代,则是由 API(应用程序接口)负责协调各种应用,实现不同软件平台之间的跳转。有了 API 发挥作用,我们才能从手机上传照片到 Facebook,或者是在 Google 地图里叫辆 Uber。

对于软件开发者来说,想让用户下载应用程序变得越来越难,成本也节节攀高。除了玩游戏之外,我们大部分的时间都花在 Facebook 和 Google 公司开发的应用上:根据 ComScore 的数据显示,十款最常用的应用中有八款来自于这两家科技巨头。因此有心者可以看出,app 创业的黄金时代将走到尽头了。

对于机器人开发商来说,移动时代还带来了巨大的机遇:开发能够连接所有信息和数据的元应用或者元层。对于大部分的用户来说,这样一个应用程序的界面看起来会跟短信界面差不多。根据美国独立民调机构皮尤研究中心(Pew Research)的调查显示,短信是智能手机最受欢迎的功能。投资者 Jonathan Libov 在去年发表的文章中谈论到各种媒介对图像及声音界面的依赖,他认为“尽管文字不是最便捷的交流方式,但一定是最令人舒服的。我认为软件中最重要的并不是使用起来方不方便,而是舒适程度,而文字恰恰是最为舒适的载体。基于文字的交流拥有便捷,有趣,灵活,亲密,生动形象的特性,还具备语音用户界面所没有的联贯感。所以我是文字的忠实拥护者。”

如果说“即时通信”曾是台式机中最受青少年追捧的终端软件,那么之后移动手机就是文本互动的天下,主要用户为办公室白领。在亚洲范围内,诸如微信和LINE之类的即时通信软件凭借自身的实力一跃成为大型门户,在用户和企业之间搭建桥梁,提供时下需求最旺的服务、游戏等等。所有这一类通讯软件的发展都是为了让用户习惯于硅谷所谓的“对话式用户界面”—-就是通过文本进行互动的用户界面,能识别用户发送的关键词和信息。

用户界面,换句话说,就是看起来很像很像 ELIZA 机器人的东西。

一起进入超级机器人的探寻之旅

伴随着一声“嗨,Slack 机器人来啦!”,用户进入了 Slack 机器人的时代。Slack 于 2014 年 2 月面世,它会在电脑和手机中安装客户端,方便用户给同事发送短信。但因为大多数企业之前没有接触过这种交流方式,因此 Slack 肩负起教学任务,用一款同名机器人 Slackbot 的脚本教用户如何使用软件。初次登录软件,Slack 机器人就会私信你:“为了方便您与团队更好的交流,我将为您设置个人信息”,接下来就会询问你的名字,照片和电话。整个过程看起来只是机器人在为用户设置档案,但实际上是为用户展示了 Slack 的使用方法。

像 Slack 一样的机器人在开发时写入了许多外接服务,因此对开发者来说要给自己写个机器人程序简直是易如反掌。看 XOXCO 公司就给自己员工写了个午餐机器人 LunchBot 玩呢。最终,Slack 机器人的功能越来越强大,这正是 Slack 的活跃用户群数量在 2015 年的第二季度翻倍的原因之一。

Slack 作为商业工具来说,其潜在用户数量远远不如 Facebook M,后者是 Messenger 通讯软件中内置的虚拟助理,日后能通过社交网络辐射超过一百万的用户。但至少,Slack 的多产力能和当年微软 Office 软件相媲美,Slack 机器人也对后来研发的机器人有重要的借鉴意义。上个月 Slack 公司宣布将用八千万美金的一笔基金投资一家公司,专门研发在 Slack 平台上运行的应用程序。Slack 公司在发布会上展示了纳入旗下的机器人项目:由午餐机器人的 Brown 团队研发的 Howdy,负责统筹会议;Birdly,用会话方式给各给文件归档;还有 Awesome,用自然语言处理法为你总结错过的讨论信息。

靠午餐机器人再创业,XOXCO 的老总 Brown 是一名忠实的“星战粉”,我们见面的那天,他穿着带有星球大战里反抗军联盟 logo 的袜子,他把 Slackbot 机器人比作星战里的宇航技工。Botkit 工具包可以搭建通用的机器人骨架,然后开发者会把知识、记忆和个性写入到程序中。Brown 说“如果把以前的机器人比作星战里 R2 系列的话,那这个机器人就是 R2-D2 系列,因为比起以前的机器人它一直在学习和进步” (R2-D2 是星球大战中一个典型的机智、勇敢、而又鲁莽的宇航技工机器人)但不管怎么说,Slackbot 机器人目前还没有打算拥有真正的人工智能。Brown 说“我们没有想尝试开发机器人的意识,只是通过语言试验机器人的特性。”

一起进入超级机器人的探寻之旅

对于那些野心勃勃的机器人开发者来说,追求真正的人工智能或是相近的智力是他们的长期目标。但路漫漫其修远兮,仍有许多技术难关需要克服。同时,很多企业家看到了其中的巨大潜力。这周刚发布的聊天软件Assist的联合创始人 Shane Mac 认为:“我们相信五年内,所有的公司都会开发自己的机器人。”Mac 和他的联合创始人 Robert Stephens 都预想着 Assist 将成为所有网络服务的前端,能按照用户喜好的任何方式接入。

只要告诉 Assist 你的目的地,它就能为你规划最划算的交通方式,当然了,它还会先帮你看看 Uber 或者 Lyft 有没有在预计的出行时段提价。Olset 是一家初创的个性化旅游公司,作为 Assist 的商业伙伴, Assist 能从它的数据库中提取信息,分析用户过去的住宿偏好,在此基础上为用户推荐住宿。如果团队账户已经链接好,你可以通过 Slack 或者 Facebook 登录 Assist,甚至可以用文字短信进行登录。

虽然从来没有人看过 Assist 进行查询工作,但 Mac 表示:“我们百分之百是机器人工作”。他们是这样考虑的:比起招募一群人类承包商来做繁杂的查询工作,一个小团队自行发开和维护全自动的服务要简单得多。这也反映了自动化科技的发展程度。

Mac和Stephens认为各行各业都会爱上机器人时代的。因为多年来,各家公司为了拉近和客户的距离,都耗费了大量的资金和时间来建设和维护公司主页,Facebook主页和原生应用。但网站总会出现年久失修、信息过时的问题,原生应用会随着操作系统的迭代而无法使用。搞不好就在新年的时候就罢工了呢!

所以,如果公司有一个类似 Slackbot 的机器人信息处理系统,负责热更新操作系统、当前菜单、目录等等的工作应该会很不错吧?Stephens 是电脑技术服务商 GeekSquad 的成立者(随后卖给全球最大家用电器和电子产品零售集团 BestBuy),他说:“对于街角口的咖啡店来说,这种机器人肯定能派上大用常我们非常乐意帮用户清理工作,并且无需下载应用就能使用服务”

Assist 的创始人和其他的机器人开发者一样,都预见了机器人程序给互联网带来的重要影响。要是我们都投奔装有机器人程序的通讯应用来处理客户需求的话,那一大批致力于商业信息和电子商务的网站就该没落了吧。Mac 说“大多数的网站现在都不更新升级了。更新工作很有难度。如果有更简便的方式让他们和客户沟通的话,他们更加不会更新网站了,到最后所有的网站都难逃一劫。”

一起进入超级机器人的探寻之旅

尽管有些应用一开始只是和机器人沾了一点边,但随着运行,机器人程序会变得越来越聪慧成熟。许多公司都希望能加快软件中机器人的成长速度,Operator 公司也在翘首期盼的行列中。社交游戏公司 Zynga 的前执行官 Robin Chan 和 Uber 联合创始人 Garrett Camp 创立了通讯软件 Operator,虽然仍处于测试阶段,但他们的宗旨就是成为“让你剁手剁到爽的购物软件”

Chan 说:“Uber 能随时随地给你叫辆车,但我们期望 Operator 能成为用户一键开启旅程的软件,这是我们一直努力想要达到的理想界面。”打开 Operator 软件,你就会看到一个大大的蓝色按钮写着“发送请求”,轻触一下,你就会看到不同选项:服饰,家居装修,电子器材,还有一堆其他的分类。(然后一个“其他所有”的分类按钮)挑一个感兴趣的类目,然后就有机器人出现询问你想要什么,一般的交易类别机器人都能完全胜任;其他的互动还需要人工服务,一般外包给别人,就是公司所称的 Operator。

其实让机器人唠唠叨叨问一堆关于你想买啥吸尘器的问题,还不如直接自己看看亚马逊购物网站的目录来的快。但重点在于 Operator 的软件会更新升级,系统将有能力处理更多的用户需求,而渐渐摆脱人工干预。Chan 说,“我认为唯一能实现的方法就是在人类和人工智能机器的周围搭建起网络连接,不断进行将客户需求进行整合升级,那么系统的自动化程度就会慢慢提升。”

Messenger 软件内置的 Facebook M 虚拟助理就采取了类似的工作方法。在基础的机器自主学习层面让机器人处理尽可能多的任务,剩下无法处理的任务交给人工处理(打电话和客户沟通,和对方理论等)让这样的机器人助理点个墨西哥卷的外卖自然不在话下,还能和亚马逊的客服进行一番切磋。但目前,M 虚拟助理还只对小部分在加州的用户开放。

一起进入超级机器人的探寻之旅

Magic 公司目前也在走这条路,终极目标是通过短讯满足用户的所有需求。Fin 公司,由前 Facebook 执行官 Sam Lessin 共同创立。公司目前还处于隐形模式在运行,但是据登录过应用的用户所称,Fin 的功能和 Facebook M 虚拟助理相似。而直到最近,像 Google 之类的公司才将这些服务对大众免费开放。此类应用软件位处商业中销售链条的顶端——譬如 Google,用户在其通讯界面就能描述他们所想。能清楚了解用户需求的企业是广告商强有力的伙伴,同时也是潜在的盈利企业。

总还有其他方法能盈利。这周Magic公司宣布要开始对高端版服务收费,每小时 100 美金。高端版服务能为用户租私人直升机,买到脱销的产品,甚至还能帮助用户完成遗愿清单的项目。

Slack 公司的产品副总裁 April Underwood 表示,到最后大型软件公司都会投资开发智能机器人。如此一来,独立的开发人员就能依赖这些公司在机器学习方面的专业知识,而不再需要自行开发引擎来解读文本。她说:“依我看到 2016 年底,会有一大批家喻户晓的公司提供成熟的机器人服务。”

也有人士认为关于机器人的未来设想有些过头了:Operator 和 Facebook M 算是目前发展的最好的机器人,且不说他们都仍处于封闭测试阶段,大部分的服务都要依赖 iOS、SMS、Slack 这样不受控制的平台,许多投资人认为这限制了机器人的发展潜能。

风投公司 Andreessen Horowitz 的合伙人 Benedict Evans 告诉我机器人在发展过程中会遇到许多挑战:人类物质和精神需求的增长远远超过我们编写软件的能力,软件还没写出来用户可能就已经有了新的需求。他说:“你就像是在写菜谱,但是你又能写多少的菜谱呢?”

软件界面也是个问题。你给用户呈现一个空白的方框,他们可能并不知道该要求些什么。见面后不久,Evans 发了一条这样的推特:“人类恨不得把人工智能安在每个新型用户界面模型上,但实际上我们并没有号称完美从不犯错的 HAL9000 型机器人,我们目前的科技水平距离 HAL9000 大概还有 50 个诺贝尔奖吧。要是没有用户界面的话,系统可能就会和 DOS 提示符一样含糊不清,我们也没有万能的 HAL9000 为我们解读一切。”

机器人开发商认为,目前 Facebook 和 Google 都在投资虚拟助理的项目,趋势所致,用户必然会学习进步。Operator 公司的 Chan 表示:“用户免不了要学习如何使用新的用户界面。而且其实在很多地方,他们已经开始慢慢在学习了。Slack 公司的 Underwood 表示:“这种通讯界面感觉非常熟悉,正常发过短信的人都会记得。你会发短信给男朋友让他在回来路上顺带打包个披萨,Facebook M 虚拟助理一样能为你做到,只要一条信息就行。”

投资人 Semil Shah 曾经这样写道:事实上即时通讯已经超越了浏览器在手机端的地位,我们大部分的活动通过即时通讯的方式进行。一旦浏览器被彻底废除,下一个兴起的将会是谁?会有新的电商渠道出现超越亚马逊吗?当出现能明白用户需求的机器人,Google 是否会受冷落?

行业龙头的大公司随便就能收购掉对他们发展有潜在威胁的竞争者,不管是像 Yelp 或 Fourquare 这样的大众点评类软件,还是健身、理财类软件,都开始尝试用自然语言的用户界面进行交流,以挑战财大气粗的龙头公司。当人们开始更倾向于用文字来接受讯息的时候,还有哪家能媒体公司能幸免于难?(在机器人时代,Facebook 刚发布的独立新闻客户端 Notify 看起来和传统媒体公司如出一辙)要是这些媒体公司都开始朝着智能软件 Slack 发展的话又会是什么样的风景?

苹果的 Siri 助手增加文字交互界面了吗?Alexa 工具栏呢?

网页端有改变吗?事实上网页永远不会消失,所有媒介都不会消失。Brown 是这样评价机器人兴起的,“网页,甚至是搜索引擎都会日渐衰落,当越来越多的软件能对我们发出的即时信号做出反应,点对点发送深度链接,直接提供我们想要的答案,那么我们也无需再求助于搜索引擎了。”

但眼前的事实是,所有发展的前提都需要下层基础和上层建筑的配套,也就是要把不扎实的基础服务和机器学习更好的结合在一起。所需要的东西有:比男朋友还可靠的自动通讯接口,不是一串故作高深的 DOS 提示符;机器人能每天进步,逐渐成长为友好、强大、全面的助理。创立了 Clara Labs 虚拟助理的 Maran Nelson 表示“打造一款适合所有人又无所不能的 AI 机器人确认很吸引人,但是过去无数失败的例子仍历历在目。依照目前的科技水平,想要大规模的开发 AI 机器人还只是美好的愿景。”

现在,用 Facebook M 助理订个外卖在人们看来还是新鲜事儿,更何况要开发超级智能的虚拟助理呢,这当中不知道还要付出多少的心血。是像硅谷很多企业家所想的那样近在咫尺吗?还是我们仍有几十个诺贝尔之遥?

让我们拭目以待吧。目前,通过大量的数据处理,机器人的进步在日新月异。硅谷也在紧锣密鼓的开发新型智能程序。也许 2016 就会是真正的人工智能助理元年。

本文原载于 TheVerge,由 ONES Piece 编译。