数据型企业崛起 大数据时代到来
以Google、Facebook、腾讯、阿里巴巴[微博]等为代表的数据型企业正在崛起。在未来,一个企业拥有的数据量将可能被计入资产负债表
文│本刊记者 葛成恩
2012年5月18日,Facebook在纳斯达克[微博]上市,上市当日公司市值高达1000亿美元,而根据招股说明书,Facebook的资产仅66亿美元,包括计算机硬件、专利和其他实物价值。会计学将公司账面价值和市场价值之间的差额计为“无形资产”,包括品牌、人才和战略等非有形资产部分,但是,Facebook无形和有形资产的巨大差额显示了数据资产的崛起。在未来,大数据将可能进入企业的资产负债表。
互联网公司是典型的大数据公司,而拥有数据资产的多少,与公司的价值呈完全的正相关。以中国的互联网公司为例,前三大市值的公司为腾讯(580亿美元)、阿里巴巴(350亿美元)和百度[微博](320亿美元),三家公司均属于各自领域数据资产的最多拥有者——腾讯拥有最大的网络通讯数据,阿里巴巴拥有最大的网络交易数据,而百度则拥有最大的搜索数据资产。
索尼前总裁出井伸之表示,“互联网DNA的公司利用新的技术、新的模式更加地贴近消费者,他们收集大量的数据并形成预判,从长远来看,以供应链管理见长的制造型企业都将沦为平台型企业的附庸,其衰落不是管理能扭转的”。
众多的科技公司已经纷纷认识到他们正坐拥大数据这一金矿,而数据型企业正在冉冉升起。本文以亚马逊[微博]和阿里巴巴为例展开分析。
亚马逊:荐书和AWS
以亚马逊为例,亚马逊网站1995年成立时,最初的内容完全由人工亲自完成,当时公司聘请了20名书评家来写书评以推荐新书,书评家团队创立了“亚马逊的声音”这个板块,挑选有特色的新书放在亚马逊网页上,成为当时公司竞争力的重要来源,亚马逊书籍销量猛增。与此同时,随着网站流量增长,亚马逊通过用户采集的数据量越来越大,公司员工格雷格·林登向总裁杰夫·贝索斯提出了一个大胆的设想,即通过分析用户的网上数据流,通过算法向用户推荐图书,而不是单纯书评家的推荐。
1998年,林登申请了协同过滤技术专利,这种方法彻底改变了亚马逊。通过该专利技术进行提前估算,能够让亚马逊向用户推荐相关性极高的书籍,由于系统使用了网站所有数据,推荐更加理想。林登作了关于书评家所创造的销售业绩和计算机生成内容所产生的销售业绩的对比测试,结果两者之间相差甚远,通过数据推荐产品增加100倍的销售。最后,亚马逊书评组被解散了。林登表示,“书评团队被打败,我感到非常难过。但是,数据没有说谎”。如今,亚马逊1/3的销售额都来自于推荐系统,使很多大型书店和音乐唱片商店歇业。事实上,林登的工作彻底改变了电子商务。
亚马逊不仅是一个电商网站,同时是一家以技术驱动的大数据公司。2002年7月,亚马逊正式上线网络服务业务(AWS),把亚马逊的硬件和软件资源有偿提供给第三方使用,2006年,亚马逊AWS开始提供云计算服务。亚马逊AWS首席数据科学家Matt Wood表示,“大数据和云计算是天作之合,云计算平台的海量低成本的数据存储与处理资源为大数据分享提供了可能”。
当企业用户的数据迁移到亚马逊的云端后,就开启了一种全新的协作方式,研究人员乃至整个行业都能访问和分享这些过去因体量太大而无法移动的数据,例如,亚马逊AWS上已经托管了1000个基因组项目,对该项目数据的分享让遗传学研究受益匪浅。亚马逊AWS负责人雅西表示,“所有通过亚马逊云端的数据都有其价值,人们留下了关于自己的数据,其他人就可以对它们进行分析。在任何时候,AWS上都有大约一百万用户在使用亚马逊强大的数据库,开展预测活动。有些预测会建议播放一个新的电影或玩一个新的视频游戏,而其他则用于广告、信用记录,或建议跟谁约会等”。
亚马逊AWS目前覆盖190个国家和地区,Facebook最流行的10款游戏当中,由亚马逊AWS提供支持的游戏达到了8款。2011年,亚马逊AWS服务营收超过7.5亿美元。
马云[微博]预测经济危机和淘宝CPI
马云不是经济学家,但是他却预测了2008年的经济危机,并非因为马云的经济学造诣高深,而是因为大数据。
通常而言,在阿里巴巴网站上,买家在采购商品前,会比较多家供应商的产品,反映到网站统计数据中,就是查询点击的数量和购买点击的数量会保持一个相对的数值。统计历史上所有买家、卖家的询价和成交的数据,阿里巴巴可以形成询盘指数和成交指数,这两个指数是强相关的,而询盘指数是具有前兆性的,前期询盘指数活跃,就会保证后期一定的成交量。
2008年初,当马云观察到阿里巴巴的询盘指数异乎寻常地下降,就以此预测出全球对中国的采购将出现剧烈下滑。这与传统的数据统计完全不同,马云说,“海关是卖了货,出去以后再获得数据,而我们提前半年时间从询盘上就推断出世界贸易发生变化了”。这种统计和分析,如果缺少大数据技术的支持,是难以完成的。在发现这一趋势之后,马云提前呼吁、帮助成千上万的中小制造商准备过冬,从而赢得了崇高的声誉。
大数据技术引起的重要改变,就是对于数据的分析不再仅仅取决于样本,而是对全部的数据展开分析,这将克服样本分析存在的诸多固有缺陷。例如,样本分析取决于采样的绝对随机性,但是实现采样的随机性非常困难,一旦采样过程中存在偏见,分析结果将相去甚远,同时,随机采样不适合考察子类别的情况,因为一旦继续细分,错误率会大大增加。2008年,淘宝网[微博]推出CPI(消费者价格指数)。与国家统计局应用采样分析不同,淘宝CPI使用的数据是整个网站的全部交易数据,每笔交易的商品价格,都会对最终CPI结果产生影响,相比国家统计局的CPI数据,淘宝CPI对商品价格变化反应更为敏感和全面。
同时,淘宝网上大多数商品价格的变化速度,比线下销售的商品快,而且淘宝网运用大数据的算法分析,速度要大大快于国家统计局,因此,淘宝CPI的涨跌趋势比国家统计局CPI的预测大大提前了。春江水暖鸭先知,2008年12 月,淘宝CPI开始处于上升通道,而国家统计局的CPI在2009年3月份才开始上升。运用大数据,淘宝网的预测不仅更准确,而且更快。
再造传统行业
数据型企业受益于数据规模和算法的持续扩张,而传统企业在这一浪潮当中并非无所作为。麻省理工学院数字商业中心的调查显示,运用大数据作为决策基础的企业,比竞争对手的产能提高了5%,利润提高6%。
沃尔玛是世界上最大的零售商,年销售额4500亿美元,比大多数国家的GDP还高。在跨国公司当中,沃尔玛是拥有数据资源最多的公司之一。2004年,沃尔玛对过去的交易数据库进行了分析,这个数据库记录的不仅包括每个顾客的购物清单以及消费额,还包括购物篮中的物品、具体购买时间等数据。
沃尔玛注意到,每当在季节性飓风来临之前,不仅手电筒销售量增加了,而且一种叫做“POP-tarts蛋挞”的销量也增加了,因此,当季节性风暴来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,以方便顾客,增加销量。当然,这只是沃尔玛利用大数据的事例之一。实际上,沃尔玛通过记录和分析其供应链上的每一个产品记录,可以让供应商监控销售速率、数量以及存货的情况,其对大数据的利用彻底改变了零售业。
麦肯锡全球研究所报告指出,美国17个行业中,已经有15个行业大公司平均拥有的数据量超过了美国国会图书馆,其中投资证券业、银行业和传媒业位居前三位。2010年,全球企业一年新存储的数据就超过了7000PB,数据已经如洪流般注入市场经济。数据将和企业的固定资产及人力资源一样,成为重要的生产要素。
麦肯锡据此认为,“已经有越来越多令人信服的证据表明:只要实施正确的政策和激励,大数据将成为竞争的关键性基础,并成为下一波生产率提高、创新和为消费者创造价值的支柱”。
以UPS快递公司为例,从2000年开始,UPS开始在其全美60000辆货车上安装传感器、无线适配器和GPS,以使总部能在车辆晚点时追踪位置和预防引擎故障,这些设备也方便了公司优化行车路线,UPS为货车定制的最佳行车路线就是根据过去的行车数据总结得来的。UPS过程管理总监莱维斯表示,在2011年,这个项目使得UPS的驾驶员少跑了4828万公里的路程,节省了300万加仑的燃料,并且减少了3万吨的二氧化碳排放。莱维斯说,“预测给我们知识,而知识赋予我们智慧和洞见”。
哈佛大学教授达文波特表示,随着全球性竞争的不断深化,企业的地理位置优势将逐渐淡化,各国和地区性的贸易保护措施也在逐步取消,一项专利会很快被模仿、复制和推广,创新将越来越难。但是,除去这些要素之外,还有一点将构成企业竞争的基础,那就是以“低成本、高效率”的方式来开展公司业务。而要做到“低成本、高效率”的运营以及决策正确,企业必须广泛推行以事实为基础的决策方法,大量使用数据分析来优化企业的各个运营环节,通过基于数据的优化,将业务流程和决策过程当中存在的每一分潜在价值“挤”出来,从而节约成本、战胜对手。这种竞争,就是一种基于大数据的竞争。
实际上,美国的产业界和大学已经行动起来。EMC公司的培训服务部门开设了数据科学和大数据分析的培训及认证项目,该项目对员工和客户同时开放,培养出的一些学员已经在内部制作大数据方案。通用电气将投资15亿美元在旧金山湾区建立一个全球软件和分析中心,该中心拟雇佣至少400名数据科学家展开对大数据的研究,相当一部分是集中在工业产品上,例如机车、涡轮机、喷气式发动机以及大型能源发电设施。而美国的北卡罗莱纳大学已经开设大数据分析课程。