欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

“胸有成竹” 解读微软大数据平台战略亮点

程序员文章站 2023-03-14 16:04:48
大数据时代,让很多初创企业冒出了水面,吸引了大批风投与业内人士的眼球。同时一些大企业的迅速转型也赚足了风头,像亚马逊已经被认为是一家大数据公司。对于微软来说,最近的话题也是不少,比如投资戴尔、移动市场...

大数据时代,让很多初创企业冒出了水面,吸引了大批风投与业内人士的眼球。同时一些大企业的迅速转型也赚足了风头,像亚马逊已经被认为是一家大数据公司。对于微软来说,最近的话题也是不少,比如投资戴尔、移动市场的战略、盖茨的公开表示等等。对于新市场的挑战微软表现如何我们不得而知,而在大数据的布局中,微软则显得信心满满。近期微软一位技术研究员表示,“这个星球上很少有企业能像我们这样拥有大规模的互联网服务和商业平台。”

是什么让这位研究员如此自信?据了解,微软每天产生的数据达数百PB,目前还没有任何一家企业能够超越这个数据。产生数据的大部分来源于微软的Bing搜索引擎、Office365和Azure云计算服务等。也是基于此,该研究员认为微软能获得更多的社交网络信息,微软的商业数据平台、操作系统、SQL数据库、BI、高性能计算和在线服务整合到一起正产生非常有趣的聚合效应。

“胸有成竹” 解读微软大数据平台战略亮点

微软的平台战略

微软打造平台战略并不意外。目前,业内将“大数据”的商业机会主要分为两类:一类是IBM、微软、惠普等公司提供“硬件+软件+数据”的整体解决方案,它以平台性为特征,提供基础服务;另一类是以Facebook、亚马逊和谷歌等公司为代表,基于自身海量的用户信息,提供精准营销和个性化广告推介等商业活动。

微软亚太研发集团首席技术官孙博凯也在近期的演讲中提到:“微软针对关系型数据、非关系型数据和数据流的管理,第一步是打造一个平台,在这个平台下,各种类型的数据都可以进来集中整合。第二步是提供一个工具,让所有的数据可以进行清理和分析。我们相信所有的洞察力都来自数据与数据之间的关联度。”

对于这个平台具体的架构,简单来说就是后端以新一代SQL Server 2012为基准平台,将大数据管起来,然后在中端以数据集市为依托,配以丰富的数据应用,最后在前端以丰富的界面形式展现数据分析的结果,完成数据的汇总——应用与分析——结果呈现的完整流程。

数据集市

在这里面微软提到的一个比较有趣的应用是数据集市。微软希望把这个Windows Azure上的数据集市打造成一个完整的生态链,将第三方解决方案提供商、服务提供商或者是模块提供商和最终的商业用户联合在一起。

这个可以说是一个共赢的方式。从数据提供商来说,传统的数据,自己的数据,在这个场景下这个数据可以帮他产生价格。对于应用服务商来说,传统的、非常困难的、非常繁琐的数据的整合,现在通过这样一个集市,他可以非常简单的把不同的数据整合起来,对最终的用户来说,本来可能需要做不同的查询,现在在一个应用上可能就可以实现。

拥抱Hadoop

Hadoop是当今最流行的开放式大数据基础处理架构。微软在把握这一趋势中占得了先机,将Hadoop与Windows Server 2012、SystemCenter 2012进行无缝的集成,这样微软的客户可以很方便的部署与管理Hadoop集群,并为SQL Server所用。

微软的Hadoop平台解决了开源版本中的一些不足,而不是把Hadoop简单迁移到微软平台上。其中包括了高可用性、安全性的改进,以及和微软管理工具体系的整合。例如,在高可用性方面的一个改进例子是:基于Windows Azure的Hadoop架构,就意味着Hadoop都架设在一个高可用的超大规模虚拟集群上。微软把Hadoop集群和微软虚拟层进行结合,可以将Hadoop的Name Node作为服务同步到其他虚拟页面,通过Windows Azure和Windows Server自带的对每个节点的备份保护,实现降低Name Node故障率,从而提升Hadoop可用性。

此外,微软还具有的优势是,通过与微软现有的商业智能(BI)平台与非常知名的协同、呈现工具(如SharePoint、Excel、PowerView、PowerPivot等)无缝结合,可以将大数据更好的可视化,让数据中的“金矿”更为耀眼可见。

总结来说,微软在大数据这场竞赛中,表现的可圈可点。不管是从战略上,还是从技术上都进行了比较好的布局。我们看到的是一个全方位的对数据的管理、处理的平台,并具有高性能、扩展性、高安全性等特性。这也难怪在一项最近的CIO人群调查中,微软能获得众多CIO的支持。