欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

学习大数据要从哪些知识点开始着手?

程序员文章站 2022-11-01 10:58:21
学习大数据目前主要三个平台hadoop,storm,spark 比如学hadoop,从哪儿开始学首先要根据你的基本情况而定,如果你就一小白,没有任何开发基础,也没有学过任何开发语言,那就必须先从基础java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构、关系型数 ......

学习大数据目前主要三个平台hadoop,storm,spark

比如学hadoop,从哪儿开始学首先要根据你的基本情况而定,如果你就一小白,没有任何开发基础,也没有学过任何开发语言,那就必须先从基础java开始学起(大数据支持很多开发语言,但企业用的最多的还是java),接下来学习数据结构、关系型数据库、linux系统操作夯实基础之后,再进入大数据的学习,例如:hadoop离线分析、storm实时计算、spark内存计算的学习,学习体系可以按照如下:

第一阶段

core java (加**的需重点熟练掌握,其他掌握)

java基础**

数据类型

运算符、循环

算法

顺序结构程序设计

程序结构

数组及多维数组

面向对象**

构造方法、控制符、封装

继承**

多态**

抽象类、接口**

常用类

集合collectionlist**

hashset、treeset、collection

集合类map**

异常

file

文件/**

数据流和对象流**

线程(理解即可)

网络通信(理解即可)

第二阶段

数据结构

关系型数据库

linux系统操作

linux操作系统概述

安装linux操作系统

图形界面操作基础

linux字符界面基础

字符界面操作进阶

用户、组群和权限管理

文件系统管理

软件包管理与系统备份

linux网络配置

(主要掌握linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养学生的动手能力。使学生了解linux操作系统在行业中的重要地位和广泛的使用范围。在学习linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握linux操作系统的网络配置、dns、dhcp、http、ftp、smtp和pop3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更*一些)

重点掌握:

常见算法

数据库表设计

sql语句

linux常见命令

第三阶段

hadoop阶段

离线分析阶段

实时计算阶段

重点掌握:

hadoop基础

hdfs

mapreduce

分布式集群

hive

hbase

sqoop

pig

storm实时数据处理平台

spark平台

若之前没有项目经验或java基础,掌握了第一阶段进入企业,不足以立即上手做项目,企业需再花时间与成本培养;

第二阶段掌握扎实以后,进入企业就可以跟着做项目了,跟着一大帮人做项目倒也不用太担心自己能不能应付的来,当然薪资不能有太高的要求;

前两个阶段都服务于第三阶段的学习,除了熟练掌握这些知识以外,重点需要找些相应的项目去做,不管项目大小做过与没有相差很多的哦!掌握扎实后可直接面对企业就业,薪资待遇较高!大数据学习资料分享群119599574 不管你是小白还是大牛,小编我都挺欢迎,不定期分享干货,包括我自己整理的一份最新的适合2018年学习的大数据开发和零基础入门教程,欢迎初学和进阶中的小伙伴。