揭秘Facebook的AI机器：AI已关乎存亡

程序员文章站 2023-01-11 19:32:04

除了Facebook人工智能研究部门（FAIR）之外，Facebook还设有一个名为应用机器学习的部门。国外科技网站Backchannel主编史蒂芬·列维（Steven Levy）近日撰...

除了Facebook人工智能研究部门（FAIR）之外，Facebook还设有一个名为应用机器学习的部门。国外科技网站Backchannel主编史蒂芬·列维（Steven Levy）近日撰文揭秘了该部门的运作，详解人工智能是如何成为该社交网络未来战略不可或缺的一部分的。它在帮助给Facebook的产品服务带来视觉、说话、理解等方面的功能，甚至还在帮助清理假消息。

以下是文章主要内容：

揭秘Facebook的AI机器：AI已关乎存亡

Facebook应用机器学习工程主管杰奎因·坎德拉

在被要求领导Facebook的应用机器学习（Applied Machine Learning，简称AML）部门，肩负利用AI改造全球最大的社交网络的责任的时候，杰奎因·奎诺内罗·坎德拉（Joaquin Qui?onero Candela）有些犹豫不定。

并不是说该西班牙出生的科学家，该自称“机器学习（ML）研究者”的人，没有见证过AI如何能够帮助Facebook。自2012年加入该公司以来，他领导过公司广告运营的改革：利用ML技术来提高赞助广告的相关性和有效性。更重要的是，在这个过程中，他鼓励其部门的工程师使用AI，即便他们没有接收过这种培训，因此广告部门人员整体上拥有更加丰富的机器学习技能。不过，他并不确定同样的魔法在更加宽广的Facebook平台上也会奏效，毕竟上面数十亿的人际连接依赖于较为模糊的价值观，而不是依赖于可用来测量广告的硬数据。“我想要确信是否能够在上面创造价值。”他如是谈到他的晋升。

不管是Facebook，Instagram还是Messenger，都由AI驱动

虽然心存疑惑，但坎德拉还是接掌了该职位。如今，将近两年过后，他当初的犹豫不决似乎很荒谬。

有多荒谬呢？上个月，坎德拉在纽约市的一个大会上面向工程师观众发表演讲。“我将要发表一个强力的声明。”他警告称，“Facebook今天没有AI就无法生存。你可能不知道，每一次你使用Facebook、Instagram又或者Messenger，你的体验都是由AI驱动的。”

去年11月，我造访Facebook位于门洛帕克的总部，访问坎德拉和他的部分团队成员，探秘AI如何突然之间成为了Facebook赖以生存的存在。截至目前，外界对于Facebook在AI领域的动作的关注主要集中在它世界一流的Facebook人工智能研究部门（FAIR），该部门由著名的神经网络专家雅恩·乐昆（Yann LeCun）领导。与谷歌、微软、百度、亚马逊和苹果的AI部门一样，FAIR是最受精英AI项目毕业生追捧的组织之一。在近期计算机视觉、听觉甚至对话方面的技术进展背后的数字神经网络领域，FAIR是取得突破性进展最多的组织之一。不过，坎德拉的应用机器学习部门（AML）是负责将FAIR和其它部门的研究成果整合到Facebook实际的产品当中——以及负责驱使公司所有的工程师将机器学习技术整合到他们的工作当中，这一点可能更为重要。

由于Facebook没有AI就无法生存，它需要所有内部工程师共同打造该项技术。

“神经风格转变”

我的到访发生于美国总统选举两天后，Facebook CEO马克·扎克伯格（Mark Zuckerberg）称Facebook对假消息的传播帮助唐纳德·特朗普（Donald Trump）胜选的说法“很疯狂”。这番言论加剧了人们对于Facebook的不满情绪，因为该社交网络去年就曾因为动态消息中的假消息惹起争议。尽管这些争议性问题很大程度上不在坎德拉的职责范围之内，但他知道，最终Facebook对假消息危机的应对机制将依赖于他的团队将有份参与的机器学习工作。

接着，坎德拉想要给我展示某样别的东西——演示其团队的一个作品。让我意外的是，它是一个相对无聊的伎俩：以知名画家艺术作品的风格来重新绘制照片或者串流视频。事实上，它让人想起了Snapchat上可以看到的那种数字玩意，用毕加索的立体主义风格来重绘照片的想法也已经被完成过。

“这背后的技术名为神经风格转变。”他解释道，“经过训练，这种大型神经网络能够用特定的风格重新绘制照片。”他掏出手机，打开了一张照片。仅仅点击一下滑动一下，它就变成梵高《星夜》的衍生品一样。更令人印象深刻的是，它能够生成特定风格的串流视频。他还说，真正特别的是某样我看不到的东西：Facebook打造了神经网络，让它能够在手机上运行。

这也不是什么新鲜技术——苹果此前曾吹嘘有在iPhone上进行某种神经计算。但这对于Facebook来说难度要大得多，因为它无法掌控硬件本身。坎德拉说，他的团队能够执行这种任务，是因为部门工作的不断累积——每个项目的完成都让另一个项目变得更加简单，每个项目的建造，都让未来的工程师能够打造出需要更少训练的同类产品——因此像这样的项目能够快速打造出来。“从开始着手做这个到拿来出进行公开测试，我们只花了8个星期，很很疯狂。”他说。

坎德拉称，做像这样的任务的另一个秘诀是协作——Facebook文化的中流砥柱。在做该任务时，容易接洽Facebook其它的部门，尤其是非常熟悉iPhone硬件的移动团队，让他们能够跳过在Facebook的数据中心渲染图像的过程，从而直接在手机上执行该项工作。这带来的好处远不止是能够使得你的亲朋好友的影像变成《呐喊》（The Scream）风格。这是让整个Facebook变得更加强大的一步。短期来说，这可以加快在语言解读和文本理解上的响应。长期来说，它有助于实时分析你的所见所讲。“我们是在说转瞬之间的事情——这必须要做到实时。”他说，“我们是社交网络，如果我要预测人们对于某个内容的反馈，那我的系统就需要即时作出响应，对吧？”

“在手机上运行复杂的神经网络，意味着你将AI带到每个人的手中。”他说，“这不是偶然发生的事情。它是我们在公司内部广泛推广AI的一部分。”

“这是一个漫长的征程。”他补充道。

坎德拉的出身

坎德拉出生于西班牙。他在3岁时随家人移居摩洛哥，并在那里上法语学校。虽然他的科学和人文学科成绩非常优异，但在决定到马德里上大学时，他选择了他认为最难的学科：电信工程。电信工程不仅仅需要掌握像天线和放大器这样的物理知识，还需要懂得数据分析，这在他看来“很酷”。他非常仰慕一位改造自适应系统的教授。坎德拉做了个系统，利用智能过滤器来改进漫游手机的信号；如今他称这是“幼小版神经网络”。他痴迷于训练算法，不满足于只是编写代码。在2000年在丹麦度过的一个学期，他遇见曾在多伦多与机器学习领域的传奇杰夫·辛顿（Geoff Hinton）一道学习的机器学习教授卡尔·拉斯马森（Carl Rasmussen），这进一步激发了他对训练算法的热情。在毕业之际，他准备进入宝洁公司的一个领导力项目。此时拉斯马森则邀请他去读博士，最终他选择了机器学习专业。

2007年，他加入微软研究院位于英格兰剑桥的实验室。他在加盟不久后获知公司要举行比赛：微软准备推出必应，但需要在搜索广告这一重要组成部分上进行改进——准确预测用户会在什么时候点击广告。该公司决定就此举行内部比赛。胜出团队的解决方案将接受测试看看是否值得推出，团队成员也将获得免费到夏威夷旅游的奖励。19个团队参与竞争，最后坎德拉的团队并列获得冠军。他获得了免费出游的奖励，但微软却迟迟没有兑现更大的奖品（展开测试来决定他的作品是否可以推出），这让他感到受骗。

后来发生的事情充分显示了坎德拉的决心。他开启疯狂的穷追不舍模式，以让公司给他一次机会。他进行了超过50次的内部讲话，他打造了模拟器来证明其算法的优越性。他也不断游说那位握有决策权的副总裁，不管后者去到哪，包括洗手间，他都伺机接近，不停宣讲自己的系统。

2009年，坎德拉的算法随必应推出。

2012年初，坎德拉探访在Facebook供职的一位朋友，在它的门洛帕克园区呆了一个周五。他惊讶地发现，在这家公司，人们并不需要乞求上级批准测试他们的作品。他们直接那么做就行了。在接下来的周一，他去Facebook面试，周末便拿到了要约。

当初的模型并不先进

加入Facebook的广告团队后，坎德拉的任务是领导一个小组展示相关度更高的广告。坎德拉说，虽然当时的系统有使用机器学习技术，“但我们所使用的模型并不是很先进，它们很简单。”

侯赛因·梅汉纳（Hussein Mehanna）是另一位跟坎德拉同时间加盟Facebook的工程师，他同样对该公司的系统在整合AI上缺乏进展感到惊讶。“在我还没有加入Facebook之前，看到该产品的质量，我以为一切都已经成型，但很显然还没有。”梅汉纳说，“在入职几个星期后，我就跟坎德拉说，Facebook真正缺少的是一个合适的世界级机器学习平台。我们有机器，但没有合适的软件来帮助机器尽可能多地从数据学习。”（梅汉纳如今是Facebook核心机器学习主管，也曾在微软供职多年——本文另外几位受访的工程师也是微软出身。巧合？）

对于“机器学习平台”，梅汉纳是说在基于大脑运作方式的模型普及后，那个将AI带出上世纪的寒冬期进入近年的绽放时期的范例的普及。以广告为例，Facebook需要它的系统做某种没有人能够做的事情：即时且准确地预测有多少人会点击给定的广告。于是坎德拉和他的团队着手打造一个基于机器学习程序的新系统。由于该团队想要将该系统打造成平台，让该部门所有的工程师都可以访问，他们采取了一种让建模和训练能够推广和复制的建造方式。

打造机器学习系统的一大重要因素是获得优质数据——越多越好。幸运的是，这是Facebook最大的资产之一：当你有超过10亿人每天使用你的产品，你就可以给你的训练集收集大量的数据，一旦开始测试你也可以获得无数用户行为方面的例子。正因为此，广告团队能够加快到每周推出几个模型，而不再是每几周推出一个新模型。由于要将系统做成平台——让公司内部其他的人员也能够用来开发他们自己的产品——坎德拉得联手数个团队来展开工作。这是一个精细的分三步走的过程。“你要先专注于性能，再专注于效用，然后专注于打造社区。”他说道。

坎德拉的广告团队证明了机器学习技术在Facebook的变革性。“我们在预测点击、点赞、转换等方面变得极为成功。”他说。将那种模式扩展到Facebook平台的其它服务也就成了顺理成章的事情。事实上，FAIR领导者乐昆之前就在呼吁设立部门来负责将AI应用到产品当中——准确来说，是在公司内部更大范围地推广机器学习技术。“我的确曾呼吁设立这样的部门，因为你需要这样由优秀工程师人才组成的组织专注于可为很多产品部门使用的基础技术，而不是直接负责产品。”乐昆表示。

2015年10月，坎德拉成为新AML团队的主管（有一段时间，出于谨慎起见，他保留他在广告部门的职位，在两个职位之间穿梭）。他与FAIR保持紧密的联系。FAIR在纽约市、巴黎和门洛帕克均设有办事处，在门洛帕克它的研究人员实际上就在AML工程师的旁边工作。

AML和FAIR之间的协作，从一个给用户分享的照片提供语音描述的研发中的产品可见一斑。在过去的几年里，训练系统识别场景中的物品或者做出一般性的结论，如照片是在室内还是室外拍的，已经成为了标准的AI惯例。但最近，FAIR的科学家找到方法来训练神经网络描述图像中几乎所有的有趣物体，然后根据物体的位置和相对其它物体的位置来判断照片是关于什么的——实际上是通过分析姿势来判断特定照片里人们是在拥抱，还是在骑马。“我们给AML部门展示了这项技术，”乐昆说，“他们想了想，说，‘在这种情境中，那个技术会很有用。’”最终他们做出了一项可造福盲人或者视觉障碍着的功能原型，用户指向图像，就能让他们的手机通过语音给他们描述图像的内容。

“我们一直都在沟通，”坎德拉如是说到他的兄弟团队，“总的来说，要从科学技术发展到实际的项目，你需要粘合剂对吧？我们就是粘合剂。”

AI的四个应用领域

坎德拉将AI的应用分成四个领域：视觉、语言、语音和摄像效果。他表示，所有的这些东西将会带来“内容理解引擎。”通过研究如何理解平台内容的意思，Facebook想要从评论中检测出微妙的意图，从口语中提取出细微的东西，鉴别你在视频中快速出现的朋友的面孔，解读你的表情，然后将它们反映在你在虚拟现实场景中的化身。

“我们在研究AI的普遍化。”坎德拉说，“随着内容的爆炸性增长，我们需要提升理解和分析能力。”解决方案就在于打造普遍化的系统，使得一个项目的成功能够积累起来，让其它研究相关项目的团队能够受益。坎德拉称，“如果我能够打造出可将知识从一项任务转移到另一项的算法，那会很美妙，是吧？”

那种知识转移能够大大加快Facebook推出产品的速度。以Instagram为例。自上线以来，该照片分享服务就以时间倒序的形式来显示用户的照片。但2016年年初，它决定使用算法来按照相关性将照片排序。坎德拉指出，好消息是，由于AML已经在像动态消息（News Feed）这样的产品中实施过机器学习技术，“Instagram不必从头开始做。”他还说，“他们让一两个精通机器学习的工程师联系部分其它在运行某种内容排序应用的团队。然后，你可以直接将工作流程复制过来，有什么问题就问对方。”正因为此，Instagram短短几个月就能够实施这一重大变动。

AML团队一直都在寻找它的神经网络技术能够跟多个其它团队的技术相结合的使用案例，以打造适用于整个Facebook平台的独特功能。“我们利用机器学习技术来打造我们的核心功能和取悦我们的用户。”AML感知团队首席工程师汤墨·雷范德（Tommer Leyvand）说。（他也曾供职于微软。）

其中一个案例是最近的一项名为社交推荐的功能。大约一年前，AML的一位工程师和Facebook分享团队的一位产品经理在讨论人们叫朋友推荐本地的美食或者服务时活跃度很高。“问题在于，你要如何将相关内容呈现给用户呢？”AML自然语言团队产品经理丽塔·阿基诺（Rita Aquino）说道。为此，该共享团队一直在尝试匹配推荐请求相关的特定用语。“鉴于你一天有10亿条帖子，那不一定很准确，不一定可扩展。”阿基诺指出。通过训练神经网络和用用户的实时行为测试模型，该团队能够检测出非常细微的语言差别，因而能够准确检测用户是在问特定区域哪里有美食，还是问该在哪里买鞋子。那会触发请求出现在动态消息的合适联系人上。接下来的一步同样由机器学习驱动，是判断出用户在提供似乎合理的推荐，在用户的动态消息中显示商家的位置或者餐馆在地图上的位置。

阿基诺称，在她进入Facebook后的一年半里，AI已经从鲜少出现在公司的产品当中，变成产品从开发之初就要引入。“人们希望他们所使用的产品变得更加智能。”她说，“团队们看到像社交推荐这样的产品，看到我们的代码，就会说‘我们要如何做这个？’你不必成为机器学习专家就能够为你的团队带来这样的技术。”以自然语言处理为例，该团队打造了一个其它团队也能够轻松接入的系统，该系统名为Deep Text。它有助于驱动Facebook每天为逾40亿帖子使用的翻译功能背后的机器学习技术。

对于图像和视频，AML团队打造了名为Lumos的机器学习视觉平台。Lumos在马诺哈尔·帕鲁里（Manohar Paluri）当初在FAIR做实习生时打造的，他将该大型机器学习视觉平台称之为Facebook的视觉皮层——处理和理解Facebook上发布的所有图像和视频的方式。在2014年的一次黑客松中，帕鲁里和同事尼基尔·约里（Nikhil Johri）一同在一天半内打造出了原型，并给非常兴奋的扎克伯格和Facebook首席运营官谢丽尔·桑德伯格（Sheryl Sandberg）展示了他们的成果。坎德拉开始在AML工作时，帕鲁里便加盟，领导计算机视觉团队，打造Lumos来帮助Facebook所有的工程师（包括Instagram、Messenger、WhatsApp、Oculus等产品的工程师）利用该视觉皮层。

“有了Lumos，公司任何人都能够使用来自这些不同的神经网络的功能，针对他们特定的场景打造模型，看看模型是否奏效。”同时在AML和FAIR任职的帕鲁里指出，“然后，他们可以派一个人修正系统，对它进行重新训练和推送，完全不需要AML团队的人参与进来。”

帕鲁里快速地给我演示了一下。他打开他笔记本上的Lumos，然后我们开始做一项样本任务：改进神经网络识别直升飞机的能力。一个布满图片的页面（不断滚动下去，共有5000张图片）出现在屏幕上，满是直升飞机和直升飞机以外物品的图片。对于这些数据集，Facebook采用的是来自旗下资产公开发布的图片。虽然我不是工程师，更不是AI专家，但点击那些错误例子来“训练直升飞机图像分类器”对我来说也并不困难。

“智能应用开发将快上百倍”

最终，这个“分类”步骤（被称为监督式学习）可能会被自动化，因为该公司在追求机器学习的圣杯：“非监督式学习”，神经网络能够自行判断那些图像里面有什么东西。帕鲁里说，公司正在取得进展。“我们的目标是，未来一年将人工标注的数量减少100倍。”

长期而言，Facebook将会为将视觉皮层和自然语言平台融合起来，以实现坎德拉所说的普遍性内容理解引擎。“毫无疑问，我们将会把它们结合起来。”帕鲁里说。

最终，Facebook希望，它用于其进展的核心原则将会通过期刊论文等形式在公司以外流传开来，使得它的普遍化做法能够更大范围地推广机器学习技术。“你能够大大加快智能应用开发速度，而不再需要花费好些年的时间。”梅汉纳指出，“想象这对于医疗、安全、交通等行业的影响吧。我想，在那些领域打造应用未来将要快上百倍以上。”

AML在深度参与这个给Facebook的产品带来视觉、解读能力甚至说话能力的史诗般进程，扎克伯格认为这对于实现其对Facebook造福社会的愿景也至关重要。在扎克伯格有关建设社区的长篇人道主义宣言中，该CEO多达七次说到“人工智能”或者“AI”，全都是在说机器学习和其它的技术将如何保障社区的安全和消息灵通的语境中提及的。

实现那些目标不会是易事，这也是坎德拉当初在犹豫是否出任AML的职位时担心的事情。单个的机器学习无法解决所有人的问题，而你是要尝试成为上十亿用户发现信息和建立个人连接的主要来源。正因为此，Facebook在不断捣鼓决定用户在动态消息中看到的内容的算法——当你不确定什么才是最优的内容组合时，你要如何训练系统来提供最优的内容组合呢？“我想这是一个近乎无解的问题。”坎德拉说，“我们随机展示消息内容的话，意味着要浪费你的时间，是吧？而我们只显示来自一个朋友的消息内容的话，又等于是赢家通吃。你可能会一直陷入这种讨论当中，走两个极端显然都不是最优解决方案。我们尝试进行一些探索。”Facebook将会利用AI继续尝试解决这个问题。“目前机器学习和AI领域有许多优化那种探索方面的研究。”坎德拉说，听起来很有希望。

假消息问题

当Facebook发现自己被指是假消息传播的罪魁祸首时，它理所当然地号召它的AI团队来快速清理其服务上的假消息。乐昆指出，这是一项非比寻常的全员行动，当中甚至包括几乎是担当“顾问”角色的FAIR团队。FAIR已经打造了一项工具来帮助解决该问题：一个名为World2Vec的模型。World2Vec给神经网络增加了某种记忆功能，可帮助Facebook给所有的内容标上一些信息，如内容的来源和分享者。有了那些信息，Facebook就能够理解假消息的的分享模式，进而利用机器学习技术清除那些内容。“事实证明，识别假消息跟识别人们最想要看的页面并没有什么不同。”乐昆指出。

出自坎德拉团队的原有平台让Facebook能够更加快速地推出那些内容审查产品。它们实际上作用有多大还有待观察；坎德拉说，现在分享数据来说明公司在借助算法裁判减少假消息上做得有多好，还为时过早。但不管那些新措施是否奏效，该困境本身也提出了一个问题：用算法来解决问题——即便算法借助机器学习技术得到了改进——是否不可避免地会产生意想不到甚至有害的结果。肯定有人会说这种情况2016年就发生过。

坎德拉对此提出异议。“我想我们让世界变得更好了。”他说，还讲了一个故事。就在接受采访前一天，坎德拉给一个他仅见过一次的Facebook联系人打电话，那是他朋友的父亲。他看到那个人发布支持特朗普的内容，对此他觉得有些困惑。之后，坎德拉意识到自己的职责是根据数据做出决策，他缺少重要的信息。于是他发信息给那个人，请求进行通话。后者同意后，他们进行了电话通话。“这没有帮我改变现实，但却让我能够从很不一样的角度来看问题。”坎德拉说道，“要是在没有Facebook的世界，我永远都不会和他有交集。”

换句话来说，虽然AI之于Facebook非常重要，甚至关乎存亡，但它并不是唯一的答案。“我们的挑战在于，AI实际上还处于初生阶段，”坎德拉说，“我们才刚上路。”（乐邦）

上一篇：苹果中国延期以旧换新：瞄准iPhone 7等老用户

下一篇： TensorFlow实现创建分类器