欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  资讯频道

Pentaho开源部分大数据产品,移植Kettle项目到Apache 2.0许可

程序员文章站 2022-05-29 16:47:36
...
据国外媒体报道,Pentaho开发商近日开源了部分数据集成软件,并将整个Kettle数据集成平台移植到Apache 2.0许可证下,以便从目前蓬勃发展的Hadoop和NoSQL业务中得到更多的份额,从而奠定其在大数据市场的地位。

Pentaho开源部分大数据产品,移植Kettle项目到Apache 2.0许可

Pentaho是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于Java平台的BI套件,包括一个Web Server平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI提供了社区套件和企业套件两个版本,社区版完全免费。

Kettle是Pentaho的一个重要组成部分,是一个ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。

据Pentaho 称,此次Kettle项目中被开源的软件的大数据功能包括“可以对以下Hadoop和NoSQL数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。

Pentaho称,此次基于Apache许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。

Pentaho大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home

Via Zdnet