欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

浅析Facebook对大数据的分析和利用

程序员文章站 2022-06-02 10:43:45
这篇文章主要介绍了Facebook对大数据的分析和利用,讲到了Facebook是如何运用大数据从而获取更多用户和处理广告业务,需要的朋友可以参考下... 16-01-22...

facebook首先是大数据

我以前有一个观点,或叫不同意见,与互联网同行交流起来,感到非常费劲。他们总是认为,facebook首先是sns;我却认为,facebook首先是数据。我指出:“国内业界总是把脸谱当作sns津津乐道。其实这是一种比较业余的看热闹的观点。脸谱确实是sns,但他真正的核心竞争力,在数据核心业务上。”

我这种异类的看法,在项目经理、尤其是标榜sns概念的项目经理那里,很少得到共鸣。这一回,终于在投资人那里,遇到了知音。我认为资本人的观点,比项目经理的观点,更接近facebook的实际。

首先,资本人比项目经理视野更开阔,更长于把facebook放在时代大背景中看,而不是项目经理那种单纯业务观点。

资本人把facebook放到了两个大背景中:

1、在时代判断上认识到,社交网络(sns)的价值挖掘引领互联网进入大数据时代,推动“大数据”产业发展。

2、在产业链判断上认识到,以facebook为代表的社交网络率先进入大数据时代,将进一步引领其他互联网领域的大数据应用,对用户价值的挖掘将驱动“大数据”产业链的发展。

项目经理虽然注意到了facebook的sns,但对于sns在更大范围做什么用,想得并不多,因此把sns当作了目标本身。

其次,资本人比项目经理更长于透过sns的现象,看到其数据本质。

资本人把facebook这个“特殊”,放在了“一般”之中:

1、资本人认识到sns只是大数据在采集端的一个特例:大数据指的是“海量数据+复杂数据类型”,而社交网络(sns)恰恰就是每秒钟都在生成海量的非结构化数据(文本、应用、位置信息、图片、音乐、视频等),是典型的“大数据”的系统;

2、sns只是大数据的一种应用:“大数据”的核心在于数据的挖掘和应用产生的多方位价值。社交网络(sns)的价值挖掘本身就是“大数据”和商业智能应用的重要应用。

3、facebook代表着一对一的消费驱动模式转型:facebook用户数据蕴含着巨大的商业价值。用户所发表的评论、上传的图片、音乐、视频等均为典型的非结构化数据,其中蕴含的用户消费倾向,“数据”的挖掘分析可以大幅提升广告的精确投放效果,有利于facebook开发对用户更具吸引力的应用,并且可以通过用户行为预测多个行业的发展趋势,蕴含巨大的商业价值。

相形之下,项目经理对于facebook的理解,过于集中到与转型无关的功能细节上了,而较少理解facebook商业模式在转型上的含义。

对扎克伯格来说,甚至资本人都不能读透他的心。资本只是在价值层面,解读facebook是什么。而扎克伯格一再强调,facebook的创建目的并非成为一家公司,需要在意义层面,读懂facebook的使命。

不是sns之后的facebook将是什么

facebook远不是sns,sns勉强可以说是facebook的一种禀赋。对于禀赋来说,sns甚至还只是多种可能的禀赋之一。这一点连商业分析人士都看出来了。federated media的约翰·巴特利(john battelle)就看出,“facebook正在进行的某种转变与我们过去的预测不同。该公司正尝试着对自身进行重新定义,不满足于做狭义方面的社交网站,而这恰是外界对它的理解”。

1、成为人们生活的操作系统

巴特利最看好的一个新方向,就是生活操作系统。

巴特利表示,所有企业都抢着成为人们生活的操作系统,他们想成为这样一个中心地方,用户参与并将所有数据存储在那里,然后他们做任何事情都需要利用到这些中枢。扎克伯格本人说的则是:世界信息基础架构应当与社交图谱类似。

扎克伯格的视野已经越过社交,从社交受到启发,扩展到图谱类似的“世界信息基础架构”。这个说法不如巴特利“成为人们生活的操作系统”到位。实际上扎克伯格的本义可能更接近这个意思,因为他说:人们分享得越多,他们就能够通过自己信赖的人,获得更多有关产品和服务的信息。他们能够更加轻松地找到最佳产品,并提高生活品质和效率。分明在强调生活的意义。

“世界信息基础架构”同“生活操作系统”,都可能算是大数据背后的原型架构,相较而言,前者更侧重从客体把握数据的总体架构,而后者更侧重于主体把握数据的总体架构。对大数据来说,什么是生活操作系统呢?这是指用意义重构生活,数据不过是用来重构的意义的质料。用主体方面的意义一聚焦,数据就有了好坏之分:数据最终趋向于意义的,成为智慧的;最后背离意义的,成为愚蠢的。所以说,智慧地球也好,智慧城市也好,并不是数据的大堆积,而因为面向生活而显得更有意义的。

工业社会的架构,没有把聚焦点放在意义之上,而是聚焦在价值上。价值与意义的关系,是手段与目的的关系。但是有价值不一定有意义,例如,有钱是有价值,快乐是意义,但有钱不一定快乐。也就是说,掌握了实现快乐的手段,但达不到快乐这个目的。工业社会的人性的基础架构,跟价值有关的,都是充分社会化的,极为专业;但是跟意义有关的,都处于小生产状态,极为业余。这使工业社会不完美,容易成为一个为了高度发达的手段而*性地忘记目的和宗旨的社会。

大数据的使命,不从技术这个手段看,而是从人的角度看,就是建立一个手段与目的之间的专业化、社会化的聚焦系统,从而*性地让做事不要背离它的宗旨,从而让工业化条件下处于小农水平的人类意义系统,成为高度发达的社会总体架构。

sns与生活操作系统将是什么关系呢?sns只不过捕鱼用的鱼网,建立一个聚焦于意义的生活操作系统,打到生活意义这网鱼,才是意图所在。而现在模仿facebook的人,都被鱼网这个生活数据采集器吸引住了,建起一些一模一样的鱼网,模仿着facebook的抛网动作,却不知那个动作是在打鱼,结果一网不捞鱼,二网不捞鱼,最后只碰上一些小尾巴的小尾巴鱼。殊不知,捕鱼除了用鱼网,还可以叉鱼、钓鱼、电鱼等各种手段,象sns这样的数据采集器,还有许多,例如lbs、o2o、支付,甚至线下pos机。如果facebook哪天不是sns了,一定是发现有其它捕鱼方法,可以打到更多的鱼。打鱼,在这里比喻的就是意义或企业核心价值;捕鱼手段,在这里比喻的是禀赋(通常说的,你是干什么的,哪行的)。企业要基业常青,就要在保持核心价值的同时,让禀赋跟随环境的变化而变化。

2、“重塑架构”:以客户为中心的倒置经济体系

扎克伯格提出“重塑架构”的重要原则:我们希望通过帮助人们建立关系,重塑信息的传播和消费方式。我们认为,世界信息基础架构应当与社交图谱类似——它是一个自下而上的对等网络,而不是目前这种自上而下的单体结构。此外,让人们自主决定分享哪些内容,是重塑架构的基本原则。

这种重塑架构的基本原则,实际上对大数据的结构化具有指导意义。

在没有原则指导之下,大数据很可能在结构上是反的:仍然沿用传统的从生产者向消费者传导价值的结构,只是用新技术为老传统服务。这种服务虽然也是必要的,但却不是facebook对大数据的定位。

我们从扎克伯格的话中读出如下含义:

1)重塑架构意味着大数据将倒置经济结构

第一,“我们希望通过帮助人们建立关系,重塑信息的传播和消费方式”。重塑就是倒置,所谓倒置,就是颠倒价值生成的方向,原来是生产者到消费者,现在是消费者到生产者。这是从上到下,变为自下而上的第一重含义。

在sns和搜索引擎这种倒置的经济结构中,价值的生成,不是从生产者到消费者,而是反过来,从消费者到生产者。消费者首先在sns和搜索引擎暴露(主动“生产”)消费意向信息,进入交换,使之形成抽象消费价值;第二步,由大数据对消费信息进行加工增值处理,相当于对消费进行资本化处理,使消费者主权象资本一样能够得到同样的获得剩余的待遇。

第二,“它是一个自下而上的对等网络,而不是目前这种自上而下的单体结构”。

传统经济和经济学,在生产与消费关系上,有一个重要的不对称。按“自生产这个上,到消费这个下”的顺序创造价值,生产者首先在商品和交换环节,将具体价值换化为抽象价值(交换价值);第二步,将一般价值,通过资本机制,进行增值放大。但是消费者却没有这样的权利和权力,一是不能把消费者的具体价值转化为抽象价值,二是不能对这个价值进行增值,即消费没有资本化过程。

大数据一旦走出就技术谈技术的原始阶段(2012-2014年),进入大数据同经济结合的中世纪阶段(大约2015年以后),人们就会发现,自下而上不光涉及信息传输,更关系到价值生成方式转变。变成通过大数据为消费者赋权的过程。我建议大家读读《公众风潮》和《创新推动者》这两本相反方向赋权的书,理解这种赋权对经济生活的改变。

第三,“让人们自主决定分享哪些内容”。

这里提到一个重要的概念:“自主”。在工业化经济结构下,人失去自主性,最主要的一步,是自主劳动异化为劳动力,因此在信息化中,人们通过信息获得自主性的先提,是将人性的因素,复归到劳动力,形成“人性+劳动力=自主劳动”的效果。

扎克伯格由于历史局限,现在只是模模糊糊感到是在重塑消费方式,将来取代facebook的小男生小女生,将需要把这一信息分享过程,深化为消费资本化过程。这将是大数据下一阶段(2018年以后)的课题。

在那个阶段,人们将开始普遍思考海尔前些年解决的未来型问题:通过“人单合一”直接经济模式,解决由消费者生成数据,倒过来决定生产(特别是资本的战略结构的问题。现在美国管理会计师协会(ima)暗暗盯住,并派人命名为zeus(宙斯)的海尔战略损益表,可能就透着资本化时期大数据的战略秘密通道。我昨天还专门同信息化企业首倡者胡建生讨论它对bi的决定性影响。facebook到那个阶段,不再进步,小命就堪忧了。

2)重塑架构意味着价值与意义的倒置

工业社会的价值结构,是从价值到意义,人们先围绕手段进行生产,然后再用目的对手段纠偏;信息社会的价值结构,是从意义到价值,通过sns和搜索引擎定位意义所在,然后再根据意义去做有价值的事。

以往工业社会中,把握意义靠小农的方式。大数据要把意义,扩展为一个有数据结构的系统。在意义学研究中,这个结构要完成的任务,称为“意义的阐释”。这是一种读心术。大数据的体系结构,从主体意义角度看,就应该是读心术系统,是专业化地破除人类的斯芬克斯之谜的大系统。通过这样的生活操作系统,使人类得到提升,从仅仅有价值,变成不仅有价值,而且有意义。使人类因为意义而获得更高的满足。

对于企业来说,道理也一样。关于从意义到价值这一决定方向,扎克伯格指出:在这一过程中,企业获得的益处是:他们能够制造更好的产品–即以人为本的个性化产品。除了制造更好的产品,一个更加开放的世界还将鼓励企业与客户展开直接而可靠的互动。

这里说的以人为本及个性化,都是指意义所在;强调的是越过价值这个中间环节,实现生产者与消费者之间的“直接而可靠的互动”。用张瑞敏的话说,就是人单合一。

意义需要解释,解释必须通过意义的循环实现。

用扎克伯格的话说就是:它是一个自下而上的对等网络,而不是目前这种自上而下的单体结构。此外,让人们自主决定分享哪些内容。意义不是生产者(相当于作者)赋予的,而是通过消费者(相当于读者,即产品的接受者)赋予的。大数据系统通过意义在生产者与消费者之间的循环,实现价值与意义的统一,手段与目的的统一。

另一方面,大数据的结构化还有另一方面,就是打通意义的语形、语义和语用三个环节。斯芬克斯之谜层面的意义,是可意会不可言传的。通过sns这样的数据采集机制,形成的是意义的语形产业;接下来将形成语义产业,即对非结构化数据的加工产业链;最终形成语用产业,通过lbs、支付等手段,将数据挖掘与具体的一个人一个人的情境,进行锚定。这样才能破解语言层面之下的个性化意义和体验的意义。从人工智能角度讲,facebook的数据计算模式有独特优点,它是人人计算,而非谷歌(微博)那种人机计算。人人计算,相当在对话中,人们互为搜索引擎,形成生态化的计算能力。这方面还存在很大的发展潜力。

3、大数据生产力发动机内部的探索

大数据作为新时代的生产力发动机,研究它的生产力特性,对于理解未来的商业狂潮,是一个基本功课。在大数据时代,对技术毫无感觉的人,很可能成为被狂奔的生产力战车拖来拖去的尸体。

连对技术一窍不通的资本人,已经注意到facebook大数据结构中“海量数据+复杂数据类型”,非结构化数据等典型问题。事实上,这还没有涉及hadoop、nosql、数据分析与挖掘、数据仓库、商业智能以及开源云计算架构等诸多基础性问题。

大数据大致的技术过程,是先以sns、搜索引擎、pos机等采集器,将海量数据采集进数据仓库中,然后用分布式的技术框架(hadoop),对非关系型数据进行异质性处理(nosql),通过数据分析与挖掘,发展一对一的商业智能。由于大数据问题比较复杂,我现在有些个人想法,但考虑成熟之前,先不拿出来误导大家。我们还是先顺着facebook的实践和见识,自下而上归纳。

facebook在大数据这一行,也是显赫的主角之一。它在低成本整合海量数据方面,为大数据行内人士所称道。但目前facebook的大数据战略在我看来,还没有完全定型,它主要集中发展的是内部数据管理这一块。

数据分析:先结构化再挖掘

把大量数据采集下来,它就有价值吗?人们看好facebook因为它不光是把用户集合起来就了事。正如有学者判断:“facebook之前数年的努力让接近10亿数字移民建立了联系和纽带,这个世界的边界仍要扩张,而下一步更重要的则是考虑如何让关系产生的海量数据更有价值。”

现在,facebook每天会采集到500+tb的数据,如果没有数据分析,facebook在全球大数据的产业链中,充其量就是一个矿工、挖煤的。只有有了关键的一步——数据分析之后,它才真正实现了向“矿石加工”的角色转型,将采集到的数据,加以分类、提炼,发挥数据真正的价值。

要处理这些数据信息,facebook要过的第一关是归类。将用户发表的评论、上传的图片、音乐、视频这些碎片化、非结构化的数据进行瀑布式的分析,使其集结、归类成结构化的数据信息。形成身份类数据(用户注册的基本信息)、需求类数据(有“赞”按钮的显性信息、状态信息、心情信息)、关系类数据(通过用户关注的人和粉丝,判断与他与其他社交网络用户之间的关系)等多个数据模块。因此,当用户在facebook上进行的分享、听音乐、点击无处不在的“赞”按钮,将状态改为“已订婚”的时候,facebook要做的第一件事情就是将个人的杂乱数据,进行分类,结构化处理。

数据分析的第二关会更难,就是要将这些结构化的数据进行解读,深入到数据背后的潜在意义。每当用户登录facebook,cookie会一直驻留在用户的浏览器中,从此它的浏览行为、浏览页面的关键字会被记录,通过对关键字和上传信息的持续分析,facebook很容易得出用户的长期爱好和近期需求。再加上对你的朋友圈的分析,可以获得你的教育、工作、收入、地理位置等等诸多方面,这种挖掘和解读往往比个人主动填写的信息还要全面、真实。

开心网副总裁郭巍对facebook数据挖掘能力的羡慕之情溢于言表:“根据海量用户的使用习惯做数据挖掘,然后对用户进行‘画像’,是社交网络最强大的功能之一。相比其他社交网络,facebook的‘用户画像’能力非常强,这会使它能更精准地把握用户需求和广告主的需求。如果以素描来做比方,国内的sns网站可能画的是个大致的模样,但facebook可能就会非常详细,睫毛多长,眼睛是灰色的还是蓝色的,发型是什么样子,然后穿着衬衫、领带、西装等,还有胡须。”

正是基于这样细致的数据挖掘,facebook给广告主带来了超乎想象的精准投放:在主页上刚刚宣布自己“订婚”了的波士顿女士收到了婚纱摄影的推送广告,而同是待嫁的印度孟买的准新娘则会收到结婚莎丽的广告。当两个好友在facebook上正聊着未来某个时候计划去欧洲旅游时,facebook就会在他们的右侧广告区滚动出现一则旅游公司的广告,上面会介绍去欧洲旅游的机票价格和出团时间。

数据应用:广告、产品、用户三个层面

数据应用在facebook的大数据战略中还没有完全定型,主要集中在广告营销、产品服务和用户管理三个层面。

基于数据挖掘的自助式广告下单系统

在介绍facebook的自助式广告下单系统之前,我们首先要理解facebook的广告模式。

我们知道谷歌adword搜索引擎的关键词的广告模式是这样的:用户在搜索关键词,如果这个关键词和广告商竞价购买的那个词相吻合,它的广告就会出现。而facebook的模式不同,它并不是用关键词来找目标消费者,而是利用用户的基本属性、粉丝、兴趣来找出潜在的用户群。而这种广告模式之所以可行,必然要求后台有强大的数据系统作为支撑。

因此,基于这样的广告模式,facebook的广告下单系统也基本上以自助式为主。投放广告的广告主都由自定义受众开始,facebook会一步一步带领客户设定一系列的参数,主要有三种方式:第一根据人口统计特征进行筛选,即受众的基本属性,一共有11个维度,包括所在地、年龄、性别、性情对象、感情状态、语言、教育程度和学校、工作场所等。第二根据粉丝页进行筛选,即具体到哪类关系的人。第三根据兴趣进行筛选,每个用户在开设facebook时都可以设定自己的兴趣,包括宗教、喜欢的事情(旅游、电影、阅读等)、喜欢的品牌等。
浅析Facebook对大数据的分析和利用

接下来广告主需要提交广告活动的总预算和每天的预算额。系统会根据广告主设定的受众条件,运算出目标受众群的人数,然后根据广告主选择的广告方式(cpm/cpc)给出建议费用的范围。

以ladygaga为例来做简单的说明:在美国加州喜欢ladygaga的女性约有15万人,而加入英国以后,喜欢ladygaga的女性人数大幅增加到近2百多万人。如此一来,如果广告商想针对喜欢ladygaga这类表演或歌手的受众打广告时,对于受众群的人数就有了大概的了解。假设产品是能量饮品(类似红牛一类的饮品)的话,还可以进一步针对喜欢运动(#sport)和冒险(#adventure)的facebook用户,甚至将红牛等能量饮品的粉丝页设定为受众条件。
浅析Facebook对大数据的分析和利用

由于和后台的数据实时相连,广告主可以在广告下单系统上了解每天新增/减少的粉丝数目、从哪里来、粉丝的基本信息以外,还可以看到每次广告投放所能接触到的人数、点击率和转化率,以便随时更改策略。在数据库的支撑下,这种全自助的系统具有的优势也十分明显:一来给更多缺乏广告代理公司的中小企业客户提供了自己制定广告预算和受众群体的工具;二来通过细致的指标选择,给广告客户带来专业、精准的投放体验;第三提升了广告经营效率,节省了广告经营开支;第四也避免了人为的服务错失将一些客户挡在门外。
浅析Facebook对大数据的分析和利用

利用数据优化产品设计

facebook的数据挖掘和应用不仅对广告商具有很强的诱惑力,还能帮助产品设计团队优化网站的内容,掌握用户的使用模式,优化界面交互和操作。

一个小例子:

julie是facebook产品设计团队的一员,通过数据分析,掌握了facebook是如何利用网站提供的各种功能的。

以图片上传这个功能为例:julie得到了以下几组数据:87%的用户在第一屏中的相册专辑名字提示框中选择类型,57%的用户打开文件选择功能来选择他们想上传的图片,52%的用户点击上传按纽,48%的用户会等待上传进度完成。

数据很显然地说明了问题:那就是少于50%的用户能够成功上传图片。因此为了提高用户成功上传图片的比率,facebook将java/flash facebook文件选择功能改成浏览器原生文件选择功能,结果上传量提高11%。这个问题运行了一段时间之后,团队又通过数据分析发现上传图片的用户中有85%仅仅上传一张图片。团队同时观察到用户不知道使用shift来选择多个图片进行上传,所以加了一个提示,在上传开始前出现上传多张图片的提示,结果数据从85%降低到40%。