微软展开“大数据”蓝图,推进Hadoop至Azure和Windows Server
微软已经展开了他们的“大数据”蓝图,其中担当主要角色的就是Apache Hadoop。
Hadoop是一个分布式系统基础架构,由Apache基金会开发。它是一个能够对大量数据进行分布式处理的软件框架。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。
在12日西雅图召开的微软PASS(Professional Association for SQL Server,SQL Server专家协会) Summit会议上,微软公司副总裁Ted Kumert描绘了这一蓝图。Ted Kumert表示,该蓝图“旨在帮助用户管理及分析任何大小、任何位置(包括固定地址或在私有及公共云上)的所有数据”。
Ted Kunment同时透露,下一版本的SQL Server (代号Denali)已正式命名为SQL Server 2012。在Kunment提供路线图中的一项计划就是,将SQL Server 2012并入Hadoop分布式计算平台,以及将Hadoop引入Windows Server和Azure(微软的云服务)。
也就是说,运行SQL Server的微软客户将通过Hadoop的引入获得真正的大数据处理能力。微软此前发布了早期代码,让客户可以将这个Java架构接入到SQL Server 2008 R2、SQL Server Parallel Data Warehouse以及新的SQL Server 2012数据库。SQL Server 2012将在明年上半年推出。
微软的开放源代码社交资深总监Gianugo在博客中写道:
我们一直致力提供一个简单的下载、安装及配置Hadoop相关技术的体验,包括HDFS、Hive以及Pig,以帮助企业接受Hadoop。
对于开发人员,我们则将在微软开发者工具中集成该技术,同时我们将为大数据投资JavaScript,打造它的第一流语言位置。最终将实现使用JavaScript来编写高性能的Map/Reduce作业。没错,Javascript Map/Reduce。
今天八月的Data Warehousing Institute会议上,微软曾推出了一个基于Sqoop(SQL-to-Hadoop,一个在Hadoop和关系型数据库间进行数据导入导出工具)的SQL Server Hadoop连接器的预览版本。目前该连接器也正式发布了。
下一篇: php读取xml节点值,该如何处理