如何从IDEA提交任务到Spark,并查看任务执行结果

程序员文章站 2022-04-01 22:56:48

...

1.创建程序
打开IDEA——选择Maven项目——在下面找到scala22
2.IDEA程序如下
package com.demo

import org.apache.spark.SparkContext
import org.apache.spark.SparkConf
import org.apache.log4j.{Level,Logger}

object HelloWorld {
def main(args:Array[String]): Unit = {
//屏蔽日志
// Logger.getLogger(“org.apache.spark”).setLevel(Level.WARN)
// Logger.getLogger(“org.eclipse.jetty.server”).setLevel(Level.OFF)

//test.txt文件里包含了hello world行，读者可自己修改测试
val inputfile="file:///home/wangyang/helloSpark.txt"

val conf = new SparkConf().setAppName("HelloWorld").setMaster("spark://192.168.124.59:7077")

val sc = new SparkContext(conf)

val textfile = sc.textFile(inputfile)

//查询包含hello world的行
val lines = textfile.filter(line => line.contains("helloworld"))

lines.foreach(println)

}

bulid.sbt依赖（视情况自己修改）

name := “FirstSpark”

version := “0.1”

scalaVersion := “2.11.0”

libraryDependencies += “org.apache.spark” %% “spark-core” % “2.4.0”

3.打成jar包
如何从IDEA提交任务到Spark,并查看任务执行结果

4.使用rz命令将jar包以及要读的文件其上传到服务器上