大数据第一讲
第一讲:大数据基础入门
第一节:为什么要学习大数据
1、目的:很好工作
2、对比:java开发和大数据开发
第二节:什么是大数据?
举例:
1、商品推荐: 问题:(1)大量的订单如何存储? (2)大量的订单如何计算?
2、天气预报: 问题:(1)大量的天气数据如何存储?(2)大量的天气数据如何计算?
什么是大数据,本质?
(1)数据的存储:分布式文件系统(分布式存储)
(2)数据的计算:分布式计算
第三节:java和大数据是什么关系?
1、hadoop:基于java语言开发
2、spark: 基于scala语言,scala基于java语言
第四节:学习大数据需要的基础和路线
1、学习大数据需要的基础:java基础(javase)---> 类、继承、i/o、反射、泛型*****
linux基础(linux的操作) ---> 创建文件、目录、vi编辑器***
2、学习路线:
(1)java基础和linux基础
(2)hadoop的学习:体系结构、原理、编程
(*)第一阶段:hdfs、mapreduce、hbase(nosql数据库)
(*)第二阶段:数据分析引擎 ---> hive、pig
数据采集引擎 ---> sqoop、flume
(*)第三阶段:hue:web管理工具
zookeeper:实现hadoop的ha
oozie: 工作流引擎
(3)spark的学习
(*)第一个阶段:scala编程语言
(*)第二个阶段:spark core-----> 基于内存,数据的计算
(*)第三个阶段:spark sql -----> 类似oracle中的sql语句
(*)第四个阶段:spark streaming ---> 进行实时计算(流式计算):比如:自来水厂
(4)apache storm:类似spark streaming ---> 进行实时计算(流式计算):比如:自来水厂
(*)nosql:redis基于内存的数据库
上一篇: d3.js制作蜂巢图表带动画效果
下一篇: 如何使用 Set 来提高JS代码的性能
推荐阅读
-
业界大佬们对于2013年大数据的预测
-
数据结构之链表中倒数第k个结点(C++/Java语言实现)
-
SQL Server误区30日谈 第28天 有关大容量事务日志恢复模式的误区
-
SQL Server误区30日谈 第10天 数据库镜像在故障发生后 马上就能发现
-
SQL Server误区30日谈 第21天 数据损坏可以通过重启SQL Server来修复
-
SQL Server误区30日谈 第9天 数据库文件收缩不会影响性能
-
SQL Server误区30日谈 第16天 数据的损坏和修复
-
世界十大禁养名猫:第9体型娇小却能干翻羚羊
-
金华十大小吃 浦江麦饼排名第一,第4名超熟悉,从小吃到大
-
吉林十大小吃 风味十足 人参鸡排名第4!这些你都吃过了吗