苏萌:中国将成为全球最重要的大数据市场
11月16日至17日,由《IT经理世界》主办的2012中国技术商业领袖峰会在北京举行,本次峰会的主题为C时代源动力,和讯作为独家财经媒体支持为您带来全程报道。北京大学光华管理学院新媒体营销研究中心执行主任、市场营销系副教授苏萌发表主题演讲。
苏萌表示,中国将成为全球最重要的大数据市场。我们看到很多著名的互联网公司已经开始在大数据上布局,包括阿里系的马云提出平台、金融和数据三个主要的战略方向。以及百度提出了以数据为核心的金融武器。
以下为演讲实录:
苏萌:首先谢谢《IT经理世界》的黎争社长和占仁的热情邀请,今天跟大家分享一下我们对大数据和新媒体的研究和看法。在座很多都是国内非常资深的营销学者和业界经验丰富的专业人士,请大家批评指正。
我会用5分钟时间过一下数据驱动的管理发展的简史,这条线从1940年的决策支持到70年的数据库,到88年的数据仓库,到93年的连机分析,到数据挖掘,后来到90年代的商务智能,最近几年的数据可视化,数据开放运动,最后我们走到了大数据的方向。我们用简单几张PPT看一下数据驱动发展简史。
78年诺贝尔奖得主他提出人们在决策过程中的理性是有限的,这时候我们需要用计算机支持决策系统,帮助决策者扩大他的理性范围,它的理论在75年获得了普林奖。在1970年出现了关系型数据库,是由IBM研究员发明的,关系型数据库结构化高,独立性强,之后出现了大型的信息管理系统。88年看到了数据仓库,主要是面向主题集成非常稳定,数据源来自多个不同的系统。到了93年出现了令人震惊的连机方式,现在可以通过从任何一个角度切片手里的数据。到了80年代末期开始出现了数据挖掘的兴胜。它是一种基于数据库的知识发现,很多知名的故事,包括沃尔玛推出的“啤酒和尿布”的故事是大家经常听到的小例子,其实数据挖掘后面的深层远远不止这个。
接下来是商务智能,是辅助决策的一种商务智能,和之前的联机分析比,如果联机分析是透视性的探测,我们可以通过任何一个X光从任何角度做切片分析,数决挖掘就是我们挖山开矿的开采,商务智能对未来预测,于是大量的数据分析、建模。
再往后看到了数据可视化的发展,我们需要用图形表示数据和思想。有一句话说的很好,如果不能把它图像化的话,是无法理解它的最深层的意思的。有人说最早是由很多的大师提出来的这样的想法。数据可视化包括数据整合分析挖掘以及到展示。过去几年可以看到数据开放运动从软件开源到数据开放运动的兴起,开来主要追求*、平等、责任和乐趣。
在美国目前有很多争议关于数据开放。比如什么样的数据应该开放?开放到什么程度?究竟开放原始数据还是开放加工和解读过的数据。美国奥巴马*主推的就是改变。他们的改变首先是*最机密的信息的公开化,他们成立了美国联邦*,任命了一个首席信息官。美国*推的是把美国所有的预算首先公开,便于民众,用民众的眼光来看,哪一些预算和美国哪些政策是合理的?比如在某个地方建一个公立性的医院需要多少钱,把这些向所有的民众开放。
这是我们回顾了一下数据驱动管理的简史,随着决策支持的发展,都是由数据和信息在驱动着我们管理层不停的演变。我们看到2002年10月这期哈佛商业评论主题就是如何驯服大数据。就是未来我们如何见证大数据的机遇。02年的3月美国*发布大数据研究和发展计划,他们主要讲的是将来国家和国家之间的竞争可能会演变为两个国家之间公司之间的竞争。公司之间的竞争将来它的核心将是对于数据的把控,对于数据运动能力的竞争。大数据的竞争事关国家的安全和未来。
过去无论是美国的经济发展史还是中国经济发展史,都会看到每一轮经济的浪潮都是由几个主题引领的。比如说早期的美国*克林顿*开始推的信息高速公路计划。之后看到美国下一波是由美国一系列的IT公司引领的像微软、IBM。再之后看到有一系列的互联网公司,比如说Google。最后像社交网络比如Facebook引领着美国经济的发展。下一个浪潮的预测有可能引领世界经济增长的将是大数据。我们分析一下在中国遇到什么样的机会?首先大数据已经纳入国家的“十二五”规划,成为国家战略级发展方向。也是国家自然科技基金一个重大的课题。我们刚刚国内的一些重点院校刚刚搞了一个关于大数据的研讨会。为明年的十二五规划做一些大数据级的立项。
中国将成为全球最重要的大数据市场。我们看到很多著名的互联网公司已经开始在大数据上布局,包括阿里系的马云提出平台、金融和数据三个主要的战略方向。以及百度提出了以数据为核心的金融武器。
我们分析大数据时代产业发展有三个趋势,首先应用软件将泛互联网,从SAAS到PASS,软件既服务,平台既服务。泛互联网是收集数据重要渠道,没有泛互联网化的软件公司很难获取一些数故。第二个趋势是行业将随之整合。我们通过收集大量数据贴近用户,理解用户,为用户提供适合的服务。包括360、包括百度都在想我离客户越近一步,我在产业上的话语权就越高一点,我的数据价值就越高一些。
第三个方向就是数据将成为资产。很多预言说数据将有可能取代石油成为全球最大的交易商品。
新媒体时代的大数据特征:首先是海量,然后是增值。并不是所有的数据都同样有价值,只有数据带来编增值才是有意义。第三个是全息可见,首先大数据的融合和可流转性将是大数据时代真正发挥数据价值最核心的要求。数据开放和资源共享是互联网时代的特征,如果说数据不能够在企业和社会之间流动的话,那数据将变成一个一个信息孤岛而存在无法发挥最大的价值。所以数据交叉复用和可流转性是未来的商业的前提。
数据的总量变化:我们消费者面临着一个信息过窄的问题。信息量巨大的在增加,但是我们作为消费者个体,我们分析处理、筛选、过滤信息的能力并没有得到提高。另外一个问题是消费者在成长尾化的趋势发展。
第二新媒体时代数据形态的变化:数据形式从结构化朝着半结构化、非结构化方向发展。比如说用户产生内容,比如说音频、视频、社交网络。另外数据也从单渠道开始朝着多渠道方向发展。跨屏、数据结合了互联网和移动互联网的数据,都在催生着移动互联问的发展。首先用户信息饥渴感都在与日俱增我们希望利用碎片化的时间获得有价值的信息。用户变得越来越不耐烦,推给我不相关的广告信息都是我不想要的,用户体验会迅速下降,用户兴趣数据与日俱增,用户甄别信息能力占比与日俱减。所以个性化大数据是一个发展方向。
我们在提出从2B到2C到2D的新的商业模式。在美国有一些首先像Google、微软、亚马逊、苹果公司他们已经建了一个大的数据平台,很多从广告行业建立了大的数据平台,包括EMP类型的。大数据平台建立起来之后一定是希望这个数据能够有效的在数据需求方之间进行流转。比如无论是科研机构,北大、清华,南开等等,科研机构非常需要能够让我们获取到我们能够用来做深度研究的原始数据,我们往往拿到的非原始数据。个人用户和个人终极应用开发者也需要用户。
美国*数据开放之后,开放了机场飞机晚点的数据有的开发者开发一个应用,直接接到大数据平台,通过EPI把数据调出来之后,他说帮助每一个想座飞机的人告诉你,在下雨、下雪、天气好和不好的时候不同的航空公司在这个机场晚点率是多少。比如三角洲航空公司下雨天晚点率78%,美联航晚点率65%,方便人们预估到达的时间。
最后分享一下关于大数据和新媒体面临的未来的挑战。首先我们已经有能力构建完整的消费者兴趣图谱,基于这个可以精准发现人不同的用户兴趣的不同。
第二点,打通互联网和移动互联网的数据。几个月以前在美国有一家公司它仅仅是通过一种算法,基于互联网和移动互联网的算法,能够有效的预测,给定我互联网用户的行为我预测他在移动互联网上的行为。靠这个理论和实践获得了600万美元A轮的融资。
第三个就是多维数据处理和实时计算。下面就是广告的信息化。今天CMO俱乐部很多的营销界的专家,大家都关注怎样能够更有效、更精准的找到我的目标客户群。我们有一句话说的很好,我知道我的广告投入有50%,但是不知道是哪50%,新媒体时代,大数据时代环境下,能够非常精准的每一个广告投入的点,我们能够可以基于用户行为进行一些预测。如果能够把广告变成有用的信息,那么用户就不再不喜欢广告了。
信息领域我们首先看到的是从电商到社交媒体,到移动互联网,我们看到了大量个性化的技术和商业应用的兴起。最后一块就是用户隐私法律的完善。中国用户隐私法律的完善远远不足欧洲,比美国差的很远。如何定义用户隐私?也是最近很多企业和媒体在关注的问题。如果说用户隐私是我根据这些信息,根据这个数据能够帮助我准确的标识出来现实世界中唯一的某一个个体,比如说他的姓名、电话、身份证号,这些属于信息隐私,如果根据这些数据无法标识出来具体人,这并不构成用户隐私。
最后做一个小广告,就是北大新媒体营销研究中心,我们研究中心主要做一件事,我们希望能够作为一个连接业界和学术前沿的桥梁。我们新媒体营销研究中心国内第一个推出一个数据平台,方便所有的教授、MBA学生、博士生、无论是北大,还是其他的相关院校,所有对原始数据有需求的,去除敏感信息之后的信息,在数据的变量码表,数据描述和数据应用场景都描述的非常清楚,把它清理干净“像菜一样”把原始的菜洗干净放到网上供业界、学术界所有人士能够使用。我们搭建这样的一个平台,希望更多的业界能够为我们的研究中心提供原始数据,去除敏感信息的企业和我们合作,我们会通过建立战略合作关系或者是其他的方法,包括我们会把所有的研究成果,包括研究使用的原代码都和全社会公开。我们希望研究中心能够真正的促进数据驱动营销,在中国逐步的发展。谢谢各位!
上一篇: webpack4 系列教程: 前言