Hadoop入门学习路线
程序员文章站
2023-11-28 08:01:33
走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛。 Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。 核心:分布式存储系统HDFS(Hadoop Distributed File S ......
走上大数据的自学之路....,hadoop是走上大数据开发学习之路的第一个门槛。
hadoop,是apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。
核心:分布式存储系统hdfs(hadoop distributed file system) 和 mapreduce
hdfs为海量数据提供存储,mapreduce为海量数据提供分布式计算
hadoop的学习路线
1、hadoop环境的搭建(单机、伪分布式、集群、ha高可用集群)
2、hadoop分布式系统hdfs
3、mapreduce(经典mapreduce1 和 基于yarn系统的mapreduce2的区别)
4、hadoop i/o (了解mapreduce程序参数)(avor 数据序列化系统)
5、yarn系统(mapreduce 2中核心系统)
6、做一个简单的hadoop案例(开发mapreduce程序)
7、hbase、zookeeper
8、hive
9、flume
10、sqoop
11、mahout
12、spark、sparksql
13、kafka、storm
个人参考这篇博客:https://blog.csdn.net/jiangzhexi/article/details/56037170
上一篇: php设计模式之委托模式
下一篇: C#实现实体类与字符串互相转换的方法