大数据Hadoop之MR自定义排序区内排序案例实操

程序员文章站 2022-04-28 16:31:10

...

前言： 当前排序案例基于下面这个全排序案例的输出数据。

全排序案例：https://blog.csdn.net/qq_43437122/article/details/106290300

1．需求

要求每个省份手机号输出的文件中按照总流量内部排序。

2．需求分析

基于前一个需求，增加自定义分区类，分区按照省份手机号设置
大数据Hadoop之MR自定义排序区内排序案例实操

3. 案例实操：

（1）增加自定义分区类

package com.mapreduce.fcwritablecomparable;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

public class FCPartitioner extends Partitioner<FCBeanWritableComparable, Text>{

	@Override
	public int getPartition(FCBeanWritableComparable k, Text v, int numReducers) {
		
		// 1. 定义一个变量来表示分区号
		int partition = 4;
		
		// 2. 获取手机号
		String phone = v.toString();
		
		// 3. 设置分区
		if(phone.substring(0, 3).equals("136")) {
			partition = 0;
		} else if(phone.substring(0, 3).equals("137")) {
			partition = 1;
		} else if(phone.substring(0, 3).equals("139")) {
			partition = 2;
		} else if(phone.substring(0, 3).equals("135")) {
			partition = 3;
		}
		
		return partition;
	}
	
}

（2）在驱动类中添加分区类

// 8. 设置分区方式
job.setPartitionerClass(FCPartitioner.class);
		
// 9. 设置Reduce Task的个数
job.setNumReduceTasks(5);

4. 运行结果（只展示两个，有五个文件）

大数据Hadoop之MR自定义排序区内排序案例实操

相关标签： Hadoop 大数据 MR hadoop mapreduce

上一篇： jQuery插件ImageDrawer.js实现动态绘制图片动画（附源码下载）_jquery

下一篇： css text-shadow属性怎么用

大数据Hadoop之MR自定义排序区内排序案例实操

1．需求

2．需求分析

3. 案例实操：

4. 运行结果（只展示两个，有五个文件）

大数据Hadoop之MR自定义排序全排序案例实操

大数据Hadoop之MR自定义排序区内排序案例实操

大数据Hadoop之MR Combiner案例实操

大数据Hadoop之MR GroupingComparator辅助排序案例实操

大数据Hadoop之MR自定义排序 区内排序案例实操

1．需求

2．需求分析

3. 案例实操：

4. 运行结果（只展示两个，有五个文件）

大数据Hadoop之MR自定义排序 全排序案例实操

大数据Hadoop之MR自定义排序 区内排序案例实操

大数据Hadoop之MR Combiner案例实操

大数据Hadoop之MR GroupingComparator辅助排序案例实操

大数据Hadoop之MR自定义排序区内排序案例实操

大数据Hadoop之MR自定义排序全排序案例实操

大数据Hadoop之MR自定义排序区内排序案例实操