欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Hadoop入门学习路线

程序员文章站 2023-11-28 08:01:33
走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛。 Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。 核心:分布式存储系统HDFS(Hadoop Distributed File S ......

走上大数据的自学之路....,hadoop是走上大数据开发学习之路的第一个门槛。

hadoop,是apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。

核心:分布式存储系统hdfs(hadoop distributed file system) 和 mapreduce

hdfs为海量数据提供存储,mapreduce为海量数据提供分布式计算

 

hadoop的学习路线

Hadoop入门学习路线

 1、hadoop环境的搭建(单机、伪分布式、集群、ha高可用集群)

 2、hadoop分布式系统hdfs

 3、mapreduce(经典mapreduce1 和 基于yarn系统的mapreduce2的区别)

 4、hadoop i/o (了解mapreduce程序参数)(avor 数据序列化系统)

 5、yarn系统(mapreduce 2中核心系统)

 6、做一个简单的hadoop案例(开发mapreduce程序)

 7、hbase、zookeeper

 8、hive

 9、flume

 10、sqoop

 11、mahout

 12、spark、sparksql

 13、kafka、storm

 

个人参考这篇博客:https://blog.csdn.net/jiangzhexi/article/details/56037170