聚焦大数据:2020年全球数据量将超40万亿GB
根据IDC发布的数字宇宙研究报告(Digital Universe)显示,在接下来的8年中,我们所产生的数据量将超过40 ZB(泽字节),这相当于地球上每个人产生5200GB的数据。
40ZB相当于40万亿GB,估计是地球上所有海滩上的沙粒数量的57倍。为了达到这个数字,预计从现在到2020年,所有数据每两年将翻一番。
从现在到2020年的大部分数据将不是由人类产生,而是由机器,包括机器传感器以及与其他设备通信的智能设备。
IDC估计,到2020年,33%的数据将包含有价值的信息。
数字宇宙包括图像和视频、数字电影,也包括传统的企业数据,例如银行数据,机场和重大活动的安全记录数据,以及欧洲核子研究中心的大型强子对撞机的亚原子碰撞记录等。
使用商业智能对数据进行分析可以揭露社交媒体的使用模式,科学数据的相关性等。 IDC在这个研究中称:“这里运用了‘大数据’或MapReduce技术,从大量未开发的数据中提取出价值。”
由EMC赞助的数字宇宙研究于2005年首次推出,在前三年,该研究每年都会进行更新。然而,这个最新的更新距离上一版本长达18个月。上一个版本于2011年6月发布,当时预测,到2020年产生的数据量将达到35ZB,而不是40ZB。
EMC全球营销首席技术官Chuck Hollis表示最新IDC研究表明,企业的物理或虚拟服务器数量到2020年将会增加10倍。
“从另一个角度来看,即你现在拥有的每TB数据,到2020年将会增加14倍,”他表示,“我相信IT行业的人已经意识到这一点。”
该研究显示,全球范围内服务器的数量将会增加10倍,而由企业数据中心直接管理的信息量将会增加14倍,而IT专业人员的数量预计将增加1.5倍。
Hollis表示,为了管理这种数据增长,企业需要重新调整来创建自动化面向服务的架构(SOA),SOA允许企业部门从网上目录选择服务器、网络和存储容量来自动配置和付款。
需要更高的效率
数字宇宙研究与Hollis的观点一致。IT管理人员必须想办法提高其基础设施的效率,让IT管理员可以专注于更具价值的活动,例如BYOD政策、大数据分析、客户联网率和安全性。该研究显示,其中一种方法就是通过融合基础设施,整合存储、服务器和网络。
在云存储方面,数字宇宙研究报告提出了与“未来大部分数据将被存储在云计算中”不同的看法。
虽然,目前公共云和私有云计算的开销不到整体IT支出的5%,但IDC估计,到2020年,将近40%的信息将“接触”云计算(例如传输过程),而只有约15%的数据将被保存在云环境中。
在2012年到2020年之间,管理、研究和存储数据方面的投资将仅增加40%。因此,每GB的投资额将从2美元下降到20美分。
娱乐和社交媒体
数字宇宙中的大部分数据是娱乐或社交媒体数据。在2012年,68%的数据涉及用户观看数字电视、使用社交媒体或者发送手机照片和视频。然而,企业对数字宇宙中80%的信息需要承担责任。
因此,企业必须处理版权、隐私和合规问题,即使这些数据主要是由用户在使用。
IDC的研究报告估计,在所有数据中,大约三分之一的数据需要某种形式的保护,个人隐私保护需要、遵守法规,或者防止数字监听或窃取。然而,目前只有约 20%的数据具有这些保护。这种安全级别因地区而异,在新兴高科技市场具有较少的保护,例如巴西、俄罗斯、因素、马来西亚和阿拉伯等。
IDC表示,新兴市场国家将从产生少数数据逐渐发展成产生大部分数据。例如,在2005年,数字宇宙的所有数据中,48%来自美国和西欧,新兴市场只占不到20%。然而,新兴市场的数据份额现在达到36%,到2020年,将达到62%。到那时,仅仅是中国,就将产生21%的数据。
此外,该研究还发现:
网络正变得越来越重要。潜伏期必须变得越来越短,而不是更长时间。数据必须进行分析、部署安全保护和验证身份,并且都需要实时进行。在未来八年内,网络基础设施将成为关键投资。
监控信息安全的法规必须在全球范围内进行协调和同意,虽然仍然将存在差异性。
上一篇: 大数据2013年趋势的12个预测