大数据驱动力 社会资本的全球配置
位于深圳盐田港北山工业区的一幢普通的办公大楼里,一家成立于2007年的公益性组织,在国际权威期刊上发表的论文总数已经超过60篇,约占全国总数的1/4。在这些论文中,有的解决了当时德国大肠杆菌疫情,有的回答了袁隆平“亩产万斤”水稻的“落穗”基因的问题……这就是深圳华大基因研究院(以下简称“华大基因”)。(中欧商业评论,2013/02)
这是华大基因的“工业+现代信息”大数据战略的初试牛刀。借助大数据技术,他们成功地绘制出水稻,非典病毒,鸡、猪和大熊猫等物种的基因图谱;通过华大基因库的数据分析,科学家们能够对人群从出生到死亡的疾病预防和治疗进行更为主动的干预,甚至有可能对宫颈癌、糖尿并乙肝等中国发病率比较高的“恶病”进行疫苗控制。
和其他率先应用大数据企业一样,华大基因商业模式创新,受益于三大驱动力推动的大数据浪潮。一是个人全球化,计算技术和通信技术实现了信息、知识和社会关系网络的全球化。二是记忆数字化,云计算等廉价、高效的存储方式让信息资源成为 “共享的社会记忆”。三是社会网络资本化,社会网络成为继“人、流程和技术”之后重要的企业资源。
个人的全球化
华大基因数据库对德国大肠杆菌和“亩产万斤”水稻的贡献,是因为其基因数据库集纳了全球的智慧,是个人全球化的一个表象。因为,个人全球化为大数据的涌现提供了社会驱动力。
从达·伽马和哥伦布航海到1800年工业革命的世界探索,称得上全球化1.0版。这是“国家”的全球化,依托的是远洋船舰等技术。工业革命以来直至2000年互联网泡沫破灭之间的工业化贸易称得上全球化2.0版,即“企业”的全球化。它的技术驱动力是铁路火车、电报电话和电子计算机硬件,实现的是工业和企业资源的全球配置。而互联网、移动互联网及物联网等新一代信息技术,正在将人类带入全球化3.0版阶段,即“个人”全球化。
按照托马斯·弗里德曼的说法,在“个人”全球化时代,人们生活在被10辆“推土机”抹平的世界里。由于个人的全球交互,信息、知识和社会关系网络实现了全球范围内的传播,实现了数据的分布式共享,数据的量级、形态和价值等发生了深刻的变革。一是体量巨大。正如EMC赞助的IDC数字宇宙研究报告《从混沌中提取价值》所言,全球数据量每两年就翻一番,2011年创建和复制的数据量为1.8ZB。二是无所不包,包括结构化、非结构化和半结构化的数据正在改变着企业业务和社会生活。三是无边界,不仅越过了国界洲际,横跨了行业和学科,而且穿越了时空。四是交互和重新组合产生新的价值,大数据正在成为新的财富源泉。
20世纪80年代,杰克·韦尔奇在通用电气推行“工作外露”(Work-Out)计划,倡导“无边界合作”,推倒了公司与供应商、用户之间的“围墙”,拆除了研发、生产、市场等部门之间的“藩篱”,实现了多元化战略下的技术和知识共享。接任者伊梅尔特大力推广“反向创新”,集纳市场智慧,挖掘全球知识资本,继续推进通用电气特色的跨国战略。如今,大数据技术让中小企业如跨国巨头一样,共享着全球的数据和智慧。
记忆的数字化
在云计算和大数据战略架构下,华大基因的核心竞争力已经不是拥有留学归来的高端技术人才,也不是科研管理的专业流程和雄厚的科研能力,而是基于已经获得的生物学数据的基础,将生物学数据变成“0101”的数字化过程。
华大基因的经验证明,数字化记忆构成了大数据的技术驱动力。随着计算技术的进步,记忆的形式和内容发生了根本性改变,记录信息的容量和成本也发生了深刻变革。
第一,数字化不仅完整地、分布式地记录着人类制造的信息,而且更广泛的信息共享,形成了真正的“共享的社会记忆”。第二,廉价的存储器。根据摩尔定律,集成电路的复杂性每18个月就会增加一倍,在性能大幅度提高的同时能耗和成本却大幅度降低。如此廉价可靠的存储方式,以及完善的数据管理工具,为人们提供了丰富的存储空间。第三,便携的提龋存储技术和搜索引擎技术的进步,使得数据变得可提娶可检索、可关联分析。第四,全球性覆盖。世界是平的,全球性的数字网络消除了地理位置和距离的限制,实现了复杂网络的无边界连接。
数字化实现了全球范围的“共享的社会记忆”,以至于IBM提出了“全球整合公司”的概念,以至于2013汉诺威消费电子、信息及通信博览会(简称CeBIT)将“分享型经济”确定为主题。而全球资源的整合和共享型商业模式的创新,为大数据技术提供了用武之地。
社会网络资本化
“人、流程和技术”被视为提高工作效率的三大法宝。殊不知,社会网络创造着社会信任价值,有社会资本的属性。在个人全球化、记忆数字化的推动下,这种基于社会网络的信任和资本不仅存在于现实世界,也存在于虚拟世界,而且虚拟世界和现实世界的界限正在模糊。围绕着环境、健康和能源等社会共同话题,围绕着精准营销、精益管理和跨界融合的企业发展课题,大数据技术对解析和重构社会网络,对发现并运用社会资本,寻求到了解决的路径和智慧。
华大基因就是一个典型例子。目前,全球20大生物制药企业,诸如辉瑞、默克等,已有19家或与华大基因战略合作,或与华大基因开始业务接触。这是因为在其庞大的基因数据资源库里,不仅有全球基因界的顶尖学者,也有关注基因产品产业化前景的企业家。与其说这是一个海量的数据库,不如说是一个庞大的社会资源网络。这样的社会资源库具有明显的复杂网络特征。
一是“小世界网络”(small-word networks)。从国家间的关联性和全球经济结构,到企业国际化和全球供应链,再到人与人在现实和虚拟两个“地球村”里往来,都呈现出一个个相互关联的群组。在这些错综复杂的群组中,有低成本共享和交换资源“强连接”,也有高效率穿越多个群组、获取异质性资源的“弱连接”。认知并发现这些“强连接”和“弱连接”之间的资本价值,构成了大数据的使命。
二是无尺度网络(scale-free networks)。企业习惯于自上而下的、少数服从多数的、依赖精英经验和判断的决策模式,因为“小数据”决策的基本假设是选择是少量的、各影响因素呈正态分布。但是,信息资源共享的时代,企业面临着更多的不确定因素和更多的选择,而这些因素又呈现出一种非正态分布模型,而是一种类似于长尾理论描述的“无尺度网络”。于是乎,“20/80法则”被颠覆,“成功经验”几成羁绊,自下而上的、依赖数据挖掘的、基于群体智慧的决策模式走向舞台的*。
社会网络的资本化构成了大数据的经济驱动力。按照中国科学院院士李国杰的说法,大数据往往以复杂关联的数据网络这样一种独特的形式存在,大数据的魅力就在对这一社会资本属性的复杂网络进行分析。而大数据所解析的复杂网络,是一种无处不在、无所不包、无边界的社会资本。因此,全球化、数字化和社会网络资本化推动了大数据,大数据反过来成为挖掘复杂网络社会资本价值的重要工具,其未来的趋势将是推动社会资本的全球流动,实现技术特别是IT在业务中的“消融”。
上一篇: 大数据能否让地震预警更加快速有效
下一篇: 大数据带来新机遇 国产数据库正迎来春天