欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

Facebook:基于SNS的大数据公司

程序员文章站 2023-02-16 17:06:38
  大数据时代已经来临,大数据正在成为主流。据国际数据公司(IDC)预测,全球大数据技术和服务市场将从2010年的32亿美元增长到2015年的169亿美元,其复合年增率将达到40%,大约...

  大数据时代已经来临,大数据正在成为主流。据国际数据公司(IDC)预测,全球大数据技术和服务市场将从2010年的32亿美元增长到2015年的169亿美元,其复合年增率将达到40%,大约是整个信息和通信技术市场的7倍。大数据对于企业发展的影响力,已不可忽视。

  2012年是大数据爆发的一年,诸多科技巨头纷纷投身大数据领域,基于大数据的创业公司也纷纷涌现,而其中,Facebook在今年厚积薄发、抓住机遇,成为大数据领域当之无愧的领头羊之一。

  Facebook的大数据战略

  从社交巨头到大数据公司,Facebook的成长历程中一向不乏精彩,但它成功的根本原因却并非社交,而是其社交网络产生的海量数据以及基于此的大数据战略。

  2012年5月18日,Facebook在纳斯达克上市,IPO定价为38美元,融资规模达160亿美元,而按照发行价计算,Facebook的估值达到1040亿美元,成为美国有史以来上市时市值最大的企业。中信证券(行情 股吧 买卖点)研究部发布的荐股书中更是称,Facebook的IPO代表了全球互联网商业模式的第三次浪潮,它的上市引领互联网进入了大数据时代。

  而数据收集、数据分析和数据应用正是构成了Facebook大数据战略的三驾马车。

  数据收集是Facebook的长项,从成立之初,Facebook就已经在有意识地收集用户数据。Facebook去年底发布的大数据产品Timeline(时间线)——用户可以在这条时间线的页面上记录自己的生活故事,更是将Facebook收集数据的范围从实时数据扩大到了历史数据。而2012年,Facebook对图片分享应用商Instagram等公司的收购行动也为它带来了大量细分数据。

  在这个社交网络几乎全民化的时代中,社交大佬Facebook已经成为当之无愧的数据收集巨头,“海量+非结构化/复杂类型”的数据从这些社交网络中产生,间接推动了大数据产业的发展。

  但仅仅将数据收集起来并不能产生价值,挖掘这些海量数据背后的商业价值成为大数据产业链中不可或缺的一环。

  正如有学者所说:“Facebook之前数年的努力让超过10亿数字移民建立了联系和纽带,这个世界的边界仍要扩张,而下一步更重要的则是考虑如何让关系产生的海量数据更有价值。”

  在数据收集后,Facebook需要对这些杂乱的数据进行归类,结构化处理,然后对其解读并加以分析,从而获得数据对应的用户的具体信息,为大数据应用打好基础。

  “我们所做的一切,归结起来只是一件事,就是大数据处理,”Facebook基础设施技术部门副总裁Jay Parikh说,“大数据就是利用你的洞察力,发现数据背后的潜在价值,并利用它来为你的企业创造利益。这个道理非常简单,如果你不能很好的利用在业务中收集和保存的数据信息,那么你拥有的就仅仅是一堆数据而已,我们越来越感兴趣并正在做的,是研究怎样利用收集来的数据做一些更价值的事情。”

  而数据应用在Facebook的大数据战略中还没有完全定型,主要集中在广告营销、产品服务和用户管理三个层面。

  通过前期对数据的收集和分析,Facebook可以了解用户的需求,及时调整产品设计及服务,满足不同用户的需求。

  同时,这些数据对广告投放也大有裨益,Facebook可以依此制定出有针对性的广告方案,并针对用户进行有针对性的营销活动。而作为Facebook主要盈利模式之一的广告营销,在Facebook的大数据战略中一直是主要发展方向之一,大数据能帮助Facebook获得更多广告主的青睐,将数据创造出更多的价值。

  正如2012年Facebook第三季度财报显示的那样,在第三季度12.62亿美元的营收中,来自广告业务的营收占86%,为10.9亿美元,比去年同期增长36%。

  Facebook的核心数据资产

  在投资人眼中,相对于sns概念,他们更愿意把Facebook看作是大数据概念,因为Facebook的核心竞争力还是在于它的核心数据资产上,而Facebook在俄勒冈州Prineville自建的数据中心更是可以说明它对自身海量数据的重视。

  Facebook在今年8月份披露了一组数据,Facebook系统每天需要处理25亿条消息、500+ TB的数据、27亿次用户点击Like按钮的次数、3亿张用户上传照片,而每半小时通过 Hive 扫描的数据大约为105TB。并且,Facebook拥有世界上最大的单一Hadoop系统,每个单独的Hadoop磁盘集群内存储了超过100 PB的数据,甚至以现今增长速度之快,也许很快,100 PB的磁盘集群也就不再令人吃惊了。

  目前,Facebook在全球拥有超过10亿用户,44%的全球网民使用Facebook,移动用户高达6亿之多,美国巴西印度是使用的前三大国家,一共有1403亿个好友连接,照片的上传量为2190亿,有6260万音乐被播放,次数高达220亿。

  Facebook的社交网络每秒钟都在生成海量的数据,如文本、图片、音乐、视频、地理信息、web链接等,并且这些数据实时更新、海量聚集,而且不会被搜索引擎抓取,构成了Facebook最核心的数据资产。

  虽然一开始,Facebook也是并不完全知道这些收集来的数据有什么作用,他们只是“想知道是谁访问该网站,他们的动态,以及他们在网站的哪个板块活动,所以这一切对我们来说都是有趣的。” Jay Parikh这样说。但随着数据背后的价值逐渐被发现,Facebook越来越重视网站数据的收集,并借此奠定了自己的数据基础。

  而单纯地采集数据却不加以分析的话,就不能体现出数据真正的价值,也就不能称之为大数据。“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”Jay Parikh说。

  对于这些海量的数据,Facebook抓住了它们背后真正的价值,不只是单纯粗暴地使用,而是对这些数据进行分析处理并加以应用,真正实现了大数据。从原材料生产者进步为原材料加工者和使用者,对数据的利用不止上了一个台阶。

  Facebook作为社交媒体,在数据资源的采集上有着先天的优势,超过10亿的用户给Facebook带来了海量的数据资源,这在如今这个大数据正要爆发的时代,是一笔无法估量的宝贵财富,而Facebook正是抓住机遇,在2012年厚积薄发,将这笔数字财富转化成了真正的财富。