spark集群安装-Standalone

程序员文章站 2022-03-20 17:47:38

...

spark集群一共有三种工作方式，分别是：

Standalone Deploy Mode: simplest way to deploy Spark on a private cluster

Apache Mesos

Hadoop YARN

当然第一种安装最简单，当然要先来简单的。

1. 准备工作

三台centos：spark01/spark02/spark03

安装jdk 配置好JAVA_HOME

下载spark安装包：

https://mirror.tuna.tsinghua.edu.cn/apache/spark/spark-2.1.0/spark-2.1.0-bin-hadoop2.7.tgz

2. 解压

tar -xvf spark-2.1.0-bin-hadoop2.7.tgz

3. 启动

首先启动master（spark01）：

sbin/start-master.sh

然后启动slave（spark02和spark03）

sbin/start-slave.sh spark://spark01:7077

4.测试

提交一个测试任务到集群使用自带的计算pi的示例，有两种方式：

# 这种方式会提交任务到集群但是使用的客户端模式也就是任务的输出会在控制台显示

bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://hadoop01:7077 --executor-memory 1G --total-executor-cores 2 examples/jars/spark-examples_2.11-2.1.0.jar 1000

# 这种方式任务会提交到集群输出要通过web ui查看，控制台看不到结果

bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://spark01:7077 --deploy-mode cluster --supervise --executor-memory 1G --total-executor-cores 2 examples/jars/spark-examples_2.11-2.1.0.jar 1000

上一篇： cassandra单机部署

下一篇： Apache Geode 管理客户端缓存

spark集群安装-Standalone

Linux集群原理与安装配置介绍

在centos 7中安装配置k8s集群的步骤详解

Linux下Kafka分布式集群安装教程

Rabbit安装（单机及集群，阿里云）

一张图讲解最少机器搭建FastDFS高可用分布式集群安装说明

Spark新手入门——2.Hadoop集群(伪分布模式)安装

H01_Linux系统中搭建Hadoop和Spark集群

spark2.4 分布式安装

Springboot 2.0.x 集成基于Centos7的Redis集群安装及配置

JAVAEE——宜立方商城06：Redis安装、数据类型和持久化方案、Redis集群分析与搭建、实现缓存和同步