云计算spark-HistoryServer解析

程序员文章站 2022-07-05 22:54:34

spark会提供一个web ui，使用者可以通过此ui对查看作业的相关信息，例如：stages 和 tasks的调度、RDD使用内存情况、环境变量以及 executors的运行信息。但是当作...

spark会提供一个web ui，使用者可以通过此ui对查看作业的相关信息，例如：stages 和 tasks的调度、RDD使用内存情况、环境变量以及 executors的运行信息。但是当作业执行完就没办法在查看相关的信息。但我们我可以通过Spark’s history server查看这些以及执行完毕的作业信息。

1、如何开启？

1.1、修改 spark-defaults.conf ，增加如下配置

#开启eventLog
spark.eventLog.enabled true
#设置eventLog目录
spark.eventLog.dir hdfs://hadoop001:9000/spark-logs

1.2、修改 spark-env.sh，增加如下配置

#设置需要被展示的eventLog目录
SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory= hdfs://hadoop001:9000/spark-logs"

1.3 开启Spark's history server

./sbin/start-history-server.sh

备注：当 Applications 退出的时候，没有调用sc.stop的时候，就算Applications执行成功，也不会显示到 completed applications 的标签，所以写代码的时候一定要调用sc.stop!!!

2、比较重要的几个参数

spark.eventLog.compress? //是否对日志进行压缩，默认 false
spark.io.compression.codec? //指定压缩类型
spark.history.fs.update.interval //心跳间隔，默认 10S
spark.history.fs.cleaner.enabled //是否自动清理History Server的历史日志，默认 false
spark.history.fs.cleaner.interval //多久检查一次History Server的历史日志，默认 1d
spark.history.fs.cleaner.maxAge //清楚多久前的日志，默认 7d

上一篇： SQL中的左连接，右连接和内连接实例教程

下一篇： Mac下mysql初次登陆所需要的操作步骤

云计算spark-HistoryServer解析

深入解析vue计算属性及使用

深入解析iOS应用开发中九宫格视图布局的相关计算方法

英特尔IDF2013：云计算和大数据战略助力城镇化

用傲游浏览器的云计算玩转在线收藏实现全平台数据(图)

2013年IT趋势：大数据、移动性、社交网络、云计算

Pivotal成立 EMC系铁三角欲统领云计算大数据

虚拟化和云计算的区别分析

赤峰市雪亮工程：基于开放的云计算大数据技术，让视频更智能

谁将成云谷云豹？*重金挖掘云计算创意团队

云计算时代应该如何选择服务器主机

云计算spark-HistoryServer解析

深入解析vue计算属性及使用

深入解析iOS应用开发中九宫格视图布局的相关计算方法

英特尔IDF2013：云计算和大数据战略助力城镇化

用傲游浏览器的云计算玩转在线收藏 实现全平台数据(图)

2013年IT趋势：大数据、移动性、社交网络、云计算

Pivotal成立 EMC系铁三角欲统领云计算大数据

虚拟化和云计算的区别分析

赤峰市雪亮工程：基于开放的云计算大数据技术，让视频更智能

谁将成云谷云豹？*重金挖掘云计算创意团队

云计算时代应该如何选择服务器主机

用傲游浏览器的云计算玩转在线收藏实现全平台数据(图)