数据加密和人工智能真的无法共存吗?
编译:小白
自Google IO 2016之后,通讯行业逐渐流行起一个新的说法:“未来交流靠AI。”
虽然这种说法在之前提到默认隐私第一位时已经开始滋生,Google则强调:“我们的选择是默认AI第一位。”Google认为AI将在未来彻底改变人们获取讯息的方式。相应地,Google的最新应用Allo,会监听对话、通过机器视觉分析你的照片,并且对你的文本内容进行自然语言处理。这样做的目的是在不离开当前应用的情况下,为用户提供更智能的回复和可能需要的服务建议。这一切,只为节省时间,给用户带来意想不到的体验——这是传统方式做不到的。
但是,Google依然为用户准备了另一个选择。“如果你需要端对端加密的话,只要点击特定按钮就可以切换到隐身模式,我们的服务器不会获取任何信息。当然,你的用户体验也会受到极大影响。追求隐私的用户们只能通过传统方式接收枯燥的消息。”
也就是说,未来的消息通讯即将面临的危险是我们正给予Google和Facebook这些公司免费获得隐私的通行证:“只要他们不断地推出新功能,我们就会不停地使用他们的平台,并不理会他们到底会怎么处理我们的数据。”
但是事实是,我们还有另一种选择。加密之于人工智能,并不似石油之于水,不可兼容。一直试图阻止我们把加密跟AI结合的无休止争论,也毫无技术根据。为什么这么说呢?我们不妨来先回答三个相关的主要问题:
1、消息的分析处理与回复建议一定要在服务器上进行吗?
答案是否定的。这也解释了为什么如今移动内置AI那么火热。曾经只能依赖强大服务器的大量复杂机器学习任务,现在已经智能手机上也可以处理。WWDC2016大会上,苹果宣布,其图片应用中所有的面部、物体以及场景识别的算法都将在设备上完成。
当然,消息通讯又是另一回事,比起图片分析,它需要更多的实时分析。但是,用不了多久,苹果总会有能力把这个功能应用到iMessage上面。事实上,图像处理的技术现状已经能够每秒处理多个图像,这对于大部分用户来说绰绰有余。甚至,芯片制造商,例如Movidus和高通,正在尝试使芯片具备认知能力——比如视觉感知、语音识别等等——从而促进离线数据分析发展。
2、如果Google不能读取对话,它还能为我们提供服务建议吗?
当然可以。举个例子,有人在群聊里说:“我们叫意式外卖吧,”然后移动内置AI就可以揣测出你的意图和目的。你会收到一组搜索建议,如“附近的意式餐馆”。至此,你完全不必切换应用或设备,只有当你继续点击建议的时候,应用搜索才会从Google获取结果。这种搜索方式跟Google搜索大致相同,也就不需要读取你的任何聊天记录甚至任何元数据。对于其他的几乎所有应用,亦是如此。
3、端对端加密会不会因为阻止了Google的数据采集而影响AI的发展?
这个回答稍微有点复杂。
“从目前来看,会有些许影响;但是最终,不会。”
首先,这些公司的数据可以从其他来源获得,比如社交网络上发布的帖子、评论等等。然而,很明显,Google使用从服务器上采集的聊天内容来训练Allo,使之回复更加智能。Facebook也通过分析用户在Messenger上面的聊天内容来改进其聊天机器人引擎和数字助理。因此,加密之后显然会有影响。但是,未来,当更先进的隐私技术允许加密数据也能进行高级计算时,这一切很有可能会被颠覆。苹果采用的差异隐私已经开创了先例。从这一点上来说,如果公司有意这么做的话,隐私保护技术可以被更广泛地应用。相应地,CryptoNets,一家致力于加密图像中的物体识别技术的神经网络公司,很有可能成为未来的话题标签。或者你也可以期待,苹果站出来向用户承诺通过隐私保护深度学习来保护用户。
网络的诅咒
然而事情远非如此简单。从第一天开始,Google和苹果就选择了两种不同的消息获取方式。Google专注于网络途径。而苹果,选择以应用为主的方式。
时至今日,网页应用仍有局限性,不仅在于加密,还有AI。当移动应用可以为某些复杂机器学习模型提供百兆处理空间时,网页应用的能力要逊色很多。就目前而言,这种局限性使得移动内置AI几乎不可能完全在浏览器上运行。因此,Google对网页应用的执着意味着该公司只能在基于服务器的AI之路上一条道走到黑了。好处也有,机器学习开发者一般都比较喜欢网页应用带来的*,比如说,可以在计算机运行时部署新的模型和算法,而不需要更新应用。
那有没有办法跳出这个循环呢?有,WhatsApp在这方面付出了大量的努力,在不牺牲端对端加密的情况下,允许用户在浏览器中打开该应用。这要求网页应用与移动设备相匹配。虽然对于长期习惯使用Google之前提供的消息服务的用户来说,显得有点倒退,但是相比跨平台的安全丰富通讯体验带来的优势,这种稍显不方便的做法完全不是个问题。
展望未来
说到底,从AI为先到隐私为先的转变不会在一夜之间发生。对于Google一类的公司,上文所说的可以从用户聊天内容中收集的大量数据,违背了这些公司一直追求的数据第一理念。这也说明了Google为什么不遗余力地为Allo上个的AI功能设置高门槛。在其他公司还不能提供相同等级的端对端加密时,这一招为Google赢得了时间。于是一个无休止的辩论也就产生了:“你是选择AI还是隐私?”
然而,未来的某一天,我相信AI和隐私会站到一起,与另一方数据收集形成对立面。回想WhatsApp的经历,它用了6年的时间才完成以端对端加密为先的转型。但实际上让WhatsApp的转型得以在6年内完成的是Open Whisper Systems这类的组织,它们率先推广自己的理念继而慢慢被主流公司接受。因此,接下来的一个关键问题是,谁会为未来结合了AI技术的加密为先通讯发展带头铺路?苹果吗?还是由其他开源组织,比如Open Whisper Systems和OpenAI,共同实现?有趣又神秘,未来正在发生。