大数据时代已经以难以想象的规模降临
程序员文章站
2022-03-04 20:53:16
20年前,电子健康档案方兴未艾,数字音乐听起来就像天方夜谭,Twitter(译者注:Twitter原意是小鸟唧唧叫)代表的还只是鸟叫,而谷歌联合创始人之一的谢尔盖·布林(Sergey B...
20年前,电子健康档案方兴未艾,数字音乐听起来就像天方夜谭,Twitter(译者注:Twitter原意是小鸟唧唧叫)代表的还只是鸟叫,而谷歌联合创始人之一的谢尔盖·布林(Sergey Brin)还是沃尔夫勒姆研究公司(译者注:Wolfram Research是当今世界科技技术软件的主要开发商之一,主要从事Mathematica及其相关软件的开发)的暑期实习生。
过去的20年,我们见证了像核爆炸般快速增长的数字信息收集与储存过程。根据IDC研究公司的统计,在2012年,有2.8ZB(译者注:Zettabyte,计量单位)——相当于1036个字节,又等于24*1018条推特的数据,被新建和复制。如今我们有数百个pb级别的数据库,却要和20年前已有的数据库比大小,这样的比较是没有任何基础的
下图是世界上几组最大最有趣数据:
图片说明
资料来自:欧洲核子研究组织(CERN),谷歌,Facebook,凯泽永久医疗集团,纳斯达克,美国国家气候数据中心,Radicati Group调查公司,推特,美国人口调查局,国会图书馆,《连线》研究中心