hadoop mapreduce数据排序

程序员文章站 2022-04-25 17:26:15

...

hadoop mapreduce数据排序有如下3个输入文件： file0 [plain] 2 32 654 32 15 756 65223 file1 [plain] 5956 22 650 92 file2 [plain] 26 54 6 由于reduce获得的key是按字典顺序排序的，利用默认的规则即可。 [java] // map将输入中的value化成IntWritable

有如下3个输入文件：

file0

[plain]

654

756

65223

file1

[plain]

5956

650

file2

[plain]

由于reduce获得的key是按字典顺序排序的，利用默认的规则即可。

[java]

// map将输入中的value化成IntWritable类型，作为输出的key

public static class Map extends

Mapper

private static IntWritable data = new IntWritable();

// 实现map函数

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

String line = value.toString();

data.set(Integer.parseInt(line));

context.write(data, new IntWritable(1));

}

// reduce将输入中的key复制到输出数据的key上，

// 然后根据输入的value-list中元素的个数决定key的输出次数

// 用全局linenum来代表key的位次

public static class Reduce extends

Reducer {

private static IntWritable linenum = new IntWritable(1);

// 实现reduce函数

public void reduce(IntWritable key, Iterable values,

Context context) throws IOException, InterruptedException {

for (IntWritable val : values) {

context.write(linenum, key);

linenum = new IntWritable(linenum.get() + 1);

}

输出如下：

[plain]

1 2

2 6

3 15

4 22

5 26

6 32

7 32

8 54

9 92

10 650

11 654

12 756

13 5956

14 65223

相关标签： hadoop mapreduce 数据排序 hadoop

上一篇： JSP中的字符替换函数 str_replace() 实现！ _MySQL

下一篇：如何匹配出字符在文章里匹配次数最高的地方啊

hadoop mapreduce数据排序

在ASP.NET 2.0中操作数据之二十四：分页和排序报表数据

在ASP.NET 2.0中操作数据之二十六：排序自定义分页数据

在ASP.NET 2.0中操作数据之二十七：创建自定义排序用户界面

Java/Web调用Hadoop进行MapReduce示例代码

在ASP.NET 2.0中操作数据之四十三：DataList和Repeater数据排序（二）

在ASP.NET 2.0中操作数据之四十二：DataList和Repeater数据排序（一）

MSSQL数据库排序规则如何更改

在ASP.NET 2.0中操作数据之四十四：DataList和Repeater数据排序（三）

Django中对数据查询结果进行排序的方法

JS中数据结构与算法---排序算法(Sort Algorithm)实例详解