Hadoop为什么要用java
程序员文章站
2022-04-08 09:55:16
...
Hadoop的创始人即Lucene的创始人Doug Cutting,Doug Cutting于2000年开发Lucene,而此时距Java语言的正式推出(1995年)才5年时间,可以想象当时的java语言是多么新而酷!
根据Doug Cutting的自述,他当时开发软件的主要目的是赚钱养家,而此时java的诸多新特性,自然获得了年轻工程师的青睐。
根据Doug Cutting的自述,他当时开发软件的主要目的是赚钱养家,而此时java的诸多新特性,自然获得了年轻工程师的青睐。
Doug Cutting, 同时也是著名的基于Java的检索引擎库Apache Lucene的创始人。Hadoop本来是用于著名的开源搜索引擎Apache Nutch,而Nutch本身是基于Lucene的,而且也是Lucene的一个子项目。因此Hadoop基于Java就很理所当然了,所以,Hadoop是由Java编写的。
Hadoop采用Java编写,因而Hadoop天生支持Java语言编写作业,但在实际应用中,有时候,因要用到非Java的第三方库或者其他原因,要采用C/C++或者其他语言编写MapReduce作业,这时候可能要用到Hadoop提供的一些工具。
如果你要用C/C++编写MpaReduce作业,可使用的工具有Hadoop Streaming或者Hadoop Pipes。
如果你要用Python编写MapReduce作业,可以使用Hadoop Streaming或者Pydoop。
如果你要使用其他语言,如shell,php,ruby等,可使用Hadoop Streaming。
JVM / JDK开发人员请求帮助
我们强烈建议任何生产JVM / JDK的人测试编译并运行Hadoop。
它使一个梦幻般的表现和压力测试。随着Hadoop正在成为关键的后端数据中心应用程序,良好的Hadoop支持很重要。
以上就是Hadoop为什么要用java的详细内容,更多请关注其它相关文章!