MapReduce的输入文件是两个

程序员文章站 2022-06-20 22:56:26

[学习笔记] 1.对于MapReduce程序，如何输入文件是两个文件? 这一小节，我们将继续第一章大数据入门的HelloWorld例子做进一步的研究。这里，我们研究如何输入文件是两个文件。package com;import java.io.IOException;import java.util. ......

[学习笔记]

1.对于mapreduce程序，如何输入文件是两个文件?
这一小节，我们将继续第一章大数据入门的helloworld例子做进一步的研究。这里，我们研究如何输入文件是两个文件。
package com;
import java.io.ioexception;
import java.util.stringtokenizer;
import org.apache.hadoop.conf.configuration;
import org.apache.hadoop.fs.path;
import org.apache.hadoop.io.intwritable;
import org.apache.hadoop.io.text;
import org.apache.hadoop.mapreduce.job;
import org.apache.hadoop.mapreduce.mapper;
import org.apache.hadoop.mapreduce.reducer;
import org.apache.hadoop.mapreduce.lib.input.fileinputformat;
import org.apache.hadoop.mapreduce.lib.output.fileoutputformat;
import org.apache.hadoop.util.genericoptionsparser;
public class wordcountmark_to_win {
    public static class tokenizermapper extends mapper<object, text, text, intwritable> {
        private final static intwritable one = new intwritable(1);
        private text word = new text();
        public void map(object key, text value, context context) throws ioexception, interruptedexception {
            system.out.println("key is 马克-to-win @ 马克java社区：防盗版实名手机尾号：73203"+key.tostring()+" value is "+value.tostring());
            stringtokenizer itr = new stringtokenizer(value.tostring());
            while (itr.hasmoretokens()) {
                word.set(itr.nexttoken());
                context.write(word, one);
            }
        }
    }

文章转载自原文：

上一篇： hadoop在eclipse当中如何添加源码？

下一篇：诸葛亮的七星灯真的能续命吗这个七星灯到底是什么

MapReduce的输入文件是两个

如何快捷找出电脑内的重复文件(两个工具)

MapReduce的输入文件是两个

PHP 删除文件与文件夹操作 unlink()与rmdir()这两个函数的使用

Shell脚本对比两个文本文件找出不同行的2个方法分享

在第一个input框内输入内容.textarea自动得到第一个文件框的值的javascript代码

两个Map的对比，三种方法，将对比结果写入文件。

安装IIS6.0程序是出现无法复制文件zclientm.exe的解决方法介绍

php 计算两个文件的相对路径

Linux中比较文件不同之处的两个方法

后缀名是zip的文件用什么打开,如何打开zip文件？