欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

欢迎来到Hadoop

程序员文章站 2022-07-03 21:04:37
What Is Apache Hadoop? Hadoop是一个可靠的、可扩展的、分布式计算的开源软件。 Hadoop是一个分布式处理大数据的框架。它被设计成从一台到上千台不等的服务器,每个服务器都提供本地计算和存储的能力。它并非依赖于硬件来提供高可用服务。 Hadoop这个工程包含如下模块: Ha ......
What Is Apache Hadoop?

Hadoop是一个可靠的、可扩展的、分布式计算的开源软件。

Hadoop是一个分布式处理大数据的框架。它被设计成从一台到上千台不等的服务器,每个服务器都提供本地计算和存储的能力。它并非依赖于硬件来提供高可用服务。

Hadoop这个工程包含如下模块:

Hadoop Common:公共模块 Hadoop Distributed File System (HDFS™):分布式文件系统 Hadoop YARN:一个任务调度和集群资源管理的框架 Hadoop MapReduce:一个机遇YARN的系统,用于并行处理大数据

其它相关的工程还包括:

HBase:一个弹性的、分布式的数据库,支持结构化的数据存储 Hive:一个数据仓库的基础设施,提供数据汇总和查询 Spark:一个快速、通用的计算引擎。Spark提供简单并且有表现力的程序模块以支持大范围的应用,包括ETL、机器学习、流处理和图计算 Zookeeper:为分布式应用提供一个高性能的协调服务