开源力量公开课第49期:Spark——大数据时代的电光火石
程序员文章站
2022-04-17 11:27:24
...
开源力量公开课第49期课程题目:Spark——大数据时代的电光火石
形式: 线上公开课(免费)
直播地址:http://www.osforce.cn/openclass/65/show?id=iteye
开课时间:2014-04-01 20:00
课程背景:
Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台。它立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。
课程大纲:
白硕,从事该领域开发八年,经验丰富,具有丰富的通讯技术实践经验。
更多公开课:http://www.osforce.cn/?id=iteye
形式: 线上公开课(免费)
直播地址:http://www.osforce.cn/openclass/65/show?id=iteye
开课时间:2014-04-01 20:00
课程背景:
Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台。它立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。
课程大纲:
- spark简介:http://www.csdn.net/article/2013-07-08/2816149
- scala语法介绍:函数式编程、闭包、几个关键的函数:map 和flatmap
- spark的关键组件:master、worker、sparkContext(client)
- 4种rdd:输入rdd、转化rdd、缓存rdd、行动rdd(只有最后一种才会进行计算)
- 一个wordcount例子:解释刚才讲过的rdd,图例解释DAG的概念
- stage的概念:stage存在的意义、stage和依赖的关系、什么是数据的pipeline
- 两种Task:Task的提交与执行
- 计算结果
白硕,从事该领域开发八年,经验丰富,具有丰富的通讯技术实践经验。
更多公开课:http://www.osforce.cn/?id=iteye