欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

国外大公司是如何使用大数据的?

程序员文章站 2022-07-05 17:05:45
一年前,大数据刚刚成为业内使用最多的流行词。现在,每一个人都在谈论大数据将成为企业安全的一个最严重的挑战。但是,还有许多实际工作者仍在努力理解这个概念,就像几年前他们想努力搞清楚云安全的概念一样。但是...

一年前,大数据刚刚成为业内使用最多的流行词。现在,每一个人都在谈论大数据将成为企业安全的一个最严重的挑战。但是,还有许多实际工作者仍在努力理解这个概念,就像几年前他们想努力搞清楚云安全的概念一样。

但是,Zions Bancorporation公司首席信息安全官和负责安全的执行副总裁普雷斯顿·伍德(Preston Wood)对于有那么多人难以理解大数据的概念而感到费解。

几十年来,伍德一直在使用大数据增强其安全计划。最近几年,伍德和他的团队对其计划进行了重要修改,以便更好地处理*和迅速进出该公司网络的数据。通过使用Hadoop等工具,他们提高了一次能够分析的数据量。他们还搞清楚了如何接近实时地分析数据,缩短以前要一个完整的工作日才能完成的工作。下面是Zions公司如何完成大数据分析任务的故事。

大数据早已有之

虽然大数据这个词汇是新的,但是,Zions自从90年代以来一直在应用这个概念。当时,该公司开始使用其大量的信息源来搞清楚其安全态势。伍德说,我们在大数据这个词汇出现之前就已经采用大数据战略了。

Zions有许多数据源。它有8个银行业务并且在美国西部地区有500个物理站点。它还是安全信息和事件管理(SIEM)技术的早期应用者,使用这个技术更好地分析数据流。

当涉及到大数据的时候,专家们倾向于把重点放在如何使用大数据提供收入方面。在较小的程度上,专家们也许指出和评估有价值的商务智能和分析的大型仓库的安全风险。但是,Zions做的事情不同:它决定让大数据的方法成为其安全的核心部分,而不是把信息看作是它要防御的另一个潜在的安全漏洞。

应用SIEM技术

为了更好地分析数据和把数据应用于安全部门的工作中,伍德和该公司成为SIEM技术最早的应用者。这个技术能够让安全部门做以下事情:

·整合来自多个来源的数据,包括网络、安全、服务器、数据库和应用程序。这样可以合并监视的数据和避免漏掉重要事件。

·把事件分成更小的部分以便能够用于研究相似性。这种研究可能发现攻击活动。

·发现异常活动可以立即报警。

Hadoop技术是推动因素

伍德的团队正在寻找这个谜团中缺失的部分并且很快在Hadoop中找到了这个部分。

开源软件Hadoop技术是推动目前更成功的大数据安全计划的引擎。企业使用这个技术收集、共享和分析通过其网络的大量的结构化和非结构化数据。

Zions在2010年开始使用Hadoop技术。由于Zions的大量的工具和设备每周产生几TB数据,向系统中装载一天的记录需要一整天的时间。现在,这个过程可以实时完成。

据Securosis公司首席技术官和安全分析师阿德里安·莱恩(Adrian Lane)说,多年以来,Hadoop技术使大数据更容易访问和更便宜。像Hadoop这样的免费工具已成为一个重要的推动因素。

Hadoop技术的工作原理

Apache Hadoop网站把这个技术解释为允许使用简单编程模型分布式处理在计算机集群中的大型数据集的一个框架。这个技术旨在从一台服务器升级到数千台服务器,每一台服务器都提供本地计算和存储。不依赖硬件提供高可用性,这个库本身旨在检测和处理应用层的故障,在每一台计算机都可能出现故障的一个计算机集群的基础上提供高可用性的服务。

做好准备工作

同应用任何技术一样,Hadoop的应用者需要了解这个工具本身的安全漏洞以及任何类似工具能够出现的多种兼容性和设置问题。

Zions负责技术和运营风险与治理的经理亚历克斯·赫顿(Alex Hutton)说,同我们已经看到的一些安装的GRC(治理、风险和遵从法规)应用一样,这个事情可能产生巨大的爆炸和浪费金钱。

赫顿的忠告是采用这个技术之前要做好准备。利用一切必要的时间搞清楚你期待处理的数据的路线图细节,认真评估Hadoop技术如何与你的网络的其它部分相处,开发一个明确的分类学模型并且严格按照这个模型去做。

由于伍德的团队在推出这个新仓库之前做好了充分的准备,Zions的部署工作比较顺利。只要其它公司也做好准备,他们也会取得同样的成功。