欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

使用Flink Maven项目进行词频统计

程序员文章站 2022-07-14 13:39:50
...

批处理
def main(args: Array[String]): Unit = {
//创建执行环境
val env = ExecutionEnvironment.getExecutionEnvironment

//从文件中读取数据
val unit = env.readTextFile("C:\\Intel\\day046\\input\\word.txt")
//进行数据处理
val ww = unit.flatMap(_.split(",")).map((_,1)).groupBy(0).sum(1)

//进行数据结果打印输出
ww.print()

}

流处理
def main(args: Array[String]): Unit = {
//创建执行环境
val env = StreamExecutionEnvironment.getExecutionEnvironment

//从端口读取数据
val unit = env.socketTextStream("hdp222",555)

//进行数据处理
val ww = unit.flatMap(_.split(",")).map((_,1)).keyBy(0).sum(1)

//打印输出
ww.print()
env.execute()

}

相关标签: 随机 redis