Pentaho开源部分大数据产品,移植Kettle项目到Apache 2.0许可
程序员文章站
2022-05-29 16:47:36
...
据国外媒体报道,Pentaho开发商近日开源了部分数据集成软件,并将整个Kettle数据集成平台移植到Apache 2.0许可证下,以便从目前蓬勃发展的Hadoop和NoSQL业务中得到更多的份额,从而奠定其在大数据市场的地位。
Pentaho是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于Java平台的BI套件,包括一个Web Server平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI提供了社区套件和企业套件两个版本,社区版完全免费。
Kettle是Pentaho的一个重要组成部分,是一个ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。
据Pentaho 称,此次Kettle项目中被开源的软件的大数据功能包括“可以对以下Hadoop和NoSQL数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。
Pentaho称,此次基于Apache许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。
Pentaho大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home
Via Zdnet
Pentaho是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于Java平台的BI套件,包括一个Web Server平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI提供了社区套件和企业套件两个版本,社区版完全免费。
Kettle是Pentaho的一个重要组成部分,是一个ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。
据Pentaho 称,此次Kettle项目中被开源的软件的大数据功能包括“可以对以下Hadoop和NoSQL数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。
Pentaho称,此次基于Apache许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。
Pentaho大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home
Via Zdnet