学习大数据要从哪些知识点开始入手
比如学hadoop,从哪儿开始学首先要根据你的基本情况而定,如果你就一小白,没有任何开发基础,也没有学过任何开发语言,那就必须先从基础java开始学起(大数据支持很多开发语言,但企业用的最多的还是java),接下来学习数据结构、关系型数据库、linux系统操作,夯实基础之后,再进入大数据的学习,例如:hadoop离线分析、storm实时计算、spark内存计算的学习,
学习体系可以按照如下:
第一阶段
core java (加**的需重点熟练掌握,其他掌握)
java基础**
数据类型
运算符、循环
算法
顺序结构程序设计
程序结构
数组及多维数组
面向对象**
构造方法、控制符、封装
继承**
多态**
抽象类、接口**
常用类
集合collection、list**
hashset、treeset、collection
集合类map**
异常
file
文件/流**
数据流和对象流**
线程(理解即可)
网络通信(理解即可)
第二阶段
数据结构
关系型数据库
linux系统操作
linux操作系统概述
安装linux操作系统
图形界面操作基础
linux字符界面基础
字符界面操作进阶
用户、组群和权限管理
文件系统管理
软件包管理与系统备份
linux网络配置
(主要掌握linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养学生的动手能力。使学生了解linux操作系统在行业中的重要地位和广泛的使用范围。在学习linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握linux操作系统的网络配置、dns、dhcp、http、ftp、smtp和pop3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更*一些)
重点掌握:
常见算法
数据库表设计
sql语句
linux常见命令
第三阶段
hadoop阶段
离线分析阶段
实时计算阶段
重点掌握:
hadoop基础
hdfs
mapreduce
分布式集群
hive
hbase
sqoop
pig
storm实时数据处理平台
spark平台
若之前没有项目经验或java基础,掌握了第一阶段进入企业,不足以立即上手做项目,企业需再花时间与成本培养;
第二阶段掌握扎实以后,进入企业就可以跟着做项目了,跟着一大帮人做项目倒也不用太担心自己能不能应付的来,当然薪资不能有太高的要求;
前两个阶段都服务于第三阶段的学习,除了熟练掌握这些知识以外,重点需要找些相应的项目去做,不管项目大小做过与没有相差很多的哦!掌握扎实后可直接面对企业就业,薪资待遇较高!
上一篇: 命令which, whereis, who, w的用法
下一篇: MyBatis学习笔记(一)入门