欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

收购Kaggle搭建AI社区,详解谷歌云放大招背后

程序员文章站 2022-04-11 15:41:03
云计算领域正在获得飞速发展,有1万名开发者、工程师、IT高管、谷歌员工和合作伙伴参加了谷歌一年一度的云计算大会Next 17。来自迪士尼、Verizon、汇丰、高露洁和Ebay的诸多客户在谷歌组织的本...

收购Kaggle搭建AI社区,详解谷歌云放大招背后

云计算领域正在获得飞速发展,有1万名开发者、工程师、IT高管、谷歌员工和合作伙伴参加了谷歌一年一度的云计算大会Next 17。来自迪士尼、Verizon、汇丰、高露洁和Ebay的诸多客户在谷歌组织的本届大会上发表了感言,包括SAP在内的许多新客户与谷歌达成了合作伙伴关系。

为什么说谷歌十年内能获得云计算的最大市场份额

此外在本次大会上谷歌还发表了一系列关于人工智能和云基础设施的声明。分析师对此并没有太多兴趣,他们认为谷歌是一家消费者公司,并没有真正理解企业客户,或者说还没有准备好如何与企业客户打交道。亚马逊的先行一步已经形成了一个不可逾越的市场领先优势。据德意志银行估计,去年亚马逊云计算收入为122.2亿美元,微软为24.2亿美元,而谷歌仅为9亿美元。而其他在企业市场上拥有多年经验的公司,诸如IBM和甲骨文等企业,已经将自己的生存权压在了云计算领域。对于云服务市场来说,谷歌参与的时机已经很晚。它注定要成为一名无足轻重的参与者,其努力已经无济于事。

这是一个很好的论点,但我不敢苟同。我认为在云计算市场中,谷歌很有可能到2025年可能会获得最大的市场份额。这将是一场艰苦的战斗,但如果谷歌能够攻下两个山头,它势必将取得成功,这就是人工智能和开放社区。

在云计算市场上取得成功将是谷歌发展的自然演进过程,这是一种偶然:也就是说整个IT市场和商业世界将发生以数据为中心的转型。“谷歌长期以来一直是机器学习公司,它的每一款面向消费者的产品都是由机器学习技术驱动的,”谷歌机器学习首席科学家李飞飞(Fei-Fei Li)在活动间隙告诉我。她接着说:“谷歌得到了它的精髓。”它拥有一批人工智能和机器学习领域的专家。很明显,这是我们的强大基因。现在,我们看到了我们在企业领域的机遇。

李飞飞和李佳(Jia Li)是人工智能领域的领军专家(尤其在计算机视觉领域),她们于去年11月加入谷歌,领导新成立的云人工智能和机器学习团队。“十年前,”李佳说,“人们告诉我,没有人需要图像理解或图像搜索。”如今,工业的发展使得机器学习能做什么更为清晰。现在有很多新的图片搜索应用。为了确保新的人工智能应用程序的稳定性,他们需要“普及人工智能”,从而降低人工智能的门槛。他们的任务是“让最大的开发者社区、用户和企业都能使用它,这样他们就可以把它应用到各种各样的需求之中。”

收购Kaggle背后,打造数据科学社区

在她的主题演讲中,李飞飞把这项任务分成了四个要素:计算、算法、数据和人才。这是云计算的处理能力和地理范围的融合性、谷歌机器学习模式和应用接口的可用性、全世界大数据的共享性,以及将谷歌的人工智能技术和专业知识带给企业客户。最后两个要素也是谷歌收购Kaggle的原因,这家初创公司成立于七年前,其旨在“让数据科学成为一项运动”。它是一个拥有80多万数据科学家和数百个高质量开放数据库的社区。

李飞飞说:“Kaggle坐拥许多我们关心的东西。”李佳补充道:“Kaggle社区在很多机器学习问题上都有不同见解的专家。”“他们可以帮助我们打造更大的数据科学社区。”

可能比其他任何一个实体都更重要的是,Kaggle在使数据科学成为“21世纪最具吸引力的工作”方面发挥了重要作用,包括根据数据科学家在Kaggle比赛中的表现,将其排序。由于这些数据科学家相对于Kaggle是独立的,谷歌可能只是想通过收购Kaggle来确保平台相关数据能够继续存在,而不是落入竞争对手手中。

开放,成为最具影响力的平台

对社区进行更直接的控制,也将有助于谷歌把顶尖的机器学习专家引入人工智能生态系统。开发一个庞大的生态系统或者说一个专门的用户群体也属于“谷歌特征”之一,并将成为云战中的重要武器。这曾经被称为IT行业的“开放”,但是谷歌等公司已经把它带到了一个全新的高度。

在上世纪80年代和90年代,为了区分诸如IBM的“封闭”,很多公司声称自己的产品是“开放的”,符合“标准”,能够让客户轻易地从一个供应商转移到另一个供应商。Unix,以及后来的Linux,都是“开放”相关标准的倡导者。他们证明了“开放”实际上意味着建立一个忠诚的用户群体。

谷歌把这一概念带到了一个全新的高度,在它的基因中有一种学术倾向,一种“公开或灭亡”的心态。这导致其公开了一系列文件,提供了内部IT创新的细节,以及在GitHub等流行开源平台上的代码共享。就像过去的IT时代一样,“开放”意味着更多的个人利益,而非仅仅是利他主义,但它一直在以新的方式来支持谷歌在IT社区的地位,这在谷歌入主云计算社区之前就已经确定。

以下是谷歌的“开放”或社区开发的一些方法:即使是最好的程序员也需要花几个月的时间来学习谷歌的内部系统,并提高效率。但是,如果他们已经使用了谷歌的开源代码,那么他们从被雇佣的那一刻就非常高效。谷歌可以利用世界上最优秀的程序员思想(除了那些已经在为谷歌工作的程序员)来改进它的软件。由于共享、评论并添加开放代码的平台是公共开放的,谷歌可以分辨出谁是最顶尖的程序员,并雇佣他们。

基本上,“开放”是指对人的网络效应,而不是技术。这是了解其他人都知道什么的最好方式。通过与世界分享IT专业知识,面向消费者的公司谷歌已经成为IT界的一个重要影响者,尽管在某种程度上这是无意间发生的。

李飞飞:数据是第四次工业革命的实质

谷歌并不是唯一一个成为“影响者”的人,其他在网络上诞生的公司(如亚马逊、Netflix)在正常运行时间、处理能力和存储容量、需求激增和安全威胁方面也同样面临着前所未有的要求。在应对日益苛刻的消费者需求过程中,这些公司发起了一种被称为“IT消费化”的运动,这是首席执行官向他们的首席技术官们提出的一个典型、也是最简单的方式:“为什么我们的IT系统不能像我在家里使用的硬件和软件那样简单?”在2001年的互联网泡沫破灭后,那些传统公司的首席执行官和首席技术们“叹了一口气,互联网并没有造成翻天复地变化,我们不需要担心它。”Marc Andreessen说,他们一直保持着这种观点,直到2010年,他们才意识到云计算的前景。Andreessen说,或者这些人不再是同一高管,因为向云的转变也与一代人的变化相吻合。

我记得在21世纪初,人们普遍认为“这并不重要”。这是一种想象的失败,错误地把关于“新经济”概念和互联网泡沫破灭的炒作搞混了,导致人们确信IT不再是竞争优势的来源,也不再是上世纪60年代所提出的“计算工具”概念的复兴。

事实正好相反,事实证明IT业受到了很大的影响,云端并未看到任何效益。Andreessen说,直到2014年左右,流行的华尔街理论一直是“云必须是一种商品”,每个人都认为云供应商不可能赚钱。然而,亚马逊开始单独报告AWS(云服务平台)的结果,结果发现,亚马逊云服务“拥有亚马逊最好的利润率”。这是因为IT比以往任何时候都更重要,IT专业人员的工作已经扩展到包括许多新的活动和类型的工作,此外还有很多有趣和高价值的任务,这些任务直接影响到IT业务。

许多公司最近得出的结论是,IT基础设施的日常工作、管理和维护,最好都交给云计算供应商。Alphabet董事长埃里克施密特在Next 17年会上问道,为什么任何企业都想要复制谷歌在IT基础设施领域的300亿美元投资呢?“把基础设施的架构留给我们吧。”他建议道。

这很重要,因为它已经成为商业成功的一个关键基础,诸如谷歌这些的公司都是由互联网推动的,并且释放了一场新的、壮观的数字宇宙大爆炸。这种数据海啸正在席卷所有行业的所有类型公司,要面对这场变革,他们需要依靠云来处理、存储、分享、挖掘和驾驭人工智能工具。

李飞飞说,随着个人电脑的发明和网络的发布,“完成了数据故事的前半部分”。“故事的后半部分是数据分析和智能机器。”在她看来,数据是第四次工业革命的实质。不管我们贴了什么标签,我们今天看到的是一场全球性的运动,在数据中寻找新的机会、见解和解决方案。大量的数据服务,将由云供应商安全可靠的IT基础设施来提供。“在过去的6年里,”Andreessen说,“我们看到越来越多的硅谷公司开始使用云计算。”现在,我们看到新一代的创业公司利用这种技术去涉足其他行业。”

数据正吞噬世界,摧毁消费者和企业的界限

谷歌云业务主管Diane Greene在她的主题演讲中表示,谷歌提供的是“当前或未来企业所需要的技术”。换句话说,为满足以数据为中心的企业需求而开发的技术,是面向所有企业需求的完美解决方案。要知道这些企业现在以数据为中心,收集和保存所有数据,并为改进运营或新的收入流寻找新的机会。但如今的数据不仅仅是一种商业催化剂。Andreessen谈到了Yelp和Trip Advisor等公司提供的数据,从根本上改变了消费者的购买决定,而Andreessen还说,这也改变了他们的品味和偏好。

事实上,人们可能会用一个词来形容:“数据正在吞噬世界。”在世界范围内,数据不仅改变了IT业管理方式和整个IT业,还模糊了之前僵化的行业界限,并摧毁了所谓的“消费者”和“企业”的界限。当一切都转化为无数的0和1,你专注于收集和挖掘更多数据时,旧的分类就会逐渐消失。在“企业”市场,谷歌,这个“消费者”公司,成功的几率有多大?我认为,这是相当高的,因为企业市场的需求恰恰是谷歌在十年前IT之旅中的需求。

谷歌在发展过程中拥有大约1000台机器学习模型,培训了1万名在机器学习方面拥有最佳实践的谷歌员工;在人工智能领域拥有一流的经验和专业知识;出版相关书籍,并为其云客户提供了这方面的专业知识等等。

谷歌CEO:这是一个非同寻常的赌注

当然,谷歌面临着一场可怕的竞争,随着越来越多的企业将其内部IT业务转移到云端,谷歌的竞争只会越来越激烈。这可能包括一些新的竞争对手,比如Facebook在一些前谷歌员工的帮助下开发了一项IT基础设施,服务于近20亿用户,并在开放计算项目中与世界分享了它的IT专长。在未来的某个时候,Facebook是否会任命一名云计算的董事会成员(如Marc Andreessen)来领导其新的云平台业务,就像两年前谷歌将云计算专家Diane Greene任命为董事会成员那般?

在Next 17大会上,谷歌首席执行官桑达尔皮查伊(Sundar Pichai)称,从谷歌到企业的大规模知识转移“对我们来说是一个非同寻常的赌注”,并表示“将我们的基础设施用于满足全球企业的需要”是“我们使命(组织世界信息)的自然延伸”。

好吧,我几年前就告诉皮查伊,谷歌应该调整自己的使命,比如“让世界数据更有用”,并相应改变其商业模式。事实上,我做到了。

2011年8月,我曾经撰文指出,到目前为止,谷歌已经让亚马逊率先蚕食了传统的IT供应商的业务。为什么?当时在接受采访时,时任谷歌首席执行官施密特将谷歌、Facebook、苹果和亚马逊归为一类。当被问及为什么把微软排除在外,他的回答是:“因为微软没有推动消费者革命。”

微软把企业业务做得很好,而他们的大部分利润现在来自于Windows服务器和客户的结合,他们在这方面做得很好。消费者与企业的划分是一种过时的、或者说即将过时的区别。如果谷歌不拿走微软的部分(和IBM的)“企业”营收,其他人就会这么做。

在硬件、软件和服务领域,企业每年要花费1.5万亿美元。如果你把诸如员工管理等企业内部的支出也包括在内,你就能得到至少3万亿美元。其中很大一部分将在接下来的15年里转移到云端。将这3万亿美元与每年全球广告开支的4000亿美元进行对比。

为什么要把钱放在桌上? 2011年,谷歌90%以上的收入来自广告。如今,广告收入仍占谷歌总收入的85.9%。将IT专业知识、数据挖掘和机器学习知识转移给企业客户,最终将使谷歌不再依赖于增长缓慢的广告市常对谷歌来说,云就是未来。

后记:在Next 17大会的第一天,旧金山纪事报(San Francisco Chronicle)报道,山景城市议会(Mountain View City Council)批准了谷歌的“未来主义新校园”项目,这是谷歌开始建造的第一个大型房地产项目:“它的核心是一座占地55000平方英尺的、两层楼高的办公楼,形状像一个蓬松的白云。”