欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Hadoop运行模式之本地运行模式

程序员文章站 2022-07-14 14:31:39
...

Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式。

Hadoop官方网站:http://hadoop.apache.org/

本地运行模式

 官方Grep案例

1. 创建在hadoop-2.7.2文件下面创建一个input文件夹

[[email protected] hadoop-2.7.2]$ mkdir input

2. 将Hadoop的xml配置文件复制到input

[[email protected] hadoop-2.7.2]$ cp etc/hadoop/*.xml input

3. 执行share目录下的MapReduce程序

[[email protected] hadoop-2.7.2]$ bin/hadoop jar

share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'

4. 查看输出结果

[[email protected] hadoop-2.7.2]$ cat output/*

官方WordCount案例

1. 创建在hadoop-2.7.2文件下面创建一个wcinput文件夹

[[email protected] hadoop-2.7.2]$ mkdir wcinput

2. 在wcinput文件下创建一个wc.input文件

[[email protected] hadoop-2.7.2]$ cd wcinput

[[email protected] wcinput]$ touch wc.input

3. 编辑wc.input文件

[[email protected] wcinput]$ vi wc.input

在文件中输入如下内容

hadoop yarn
hadoop mapreduce
tt
tt

保存退出::wq

4. 回到Hadoop目录/opt/module/hadoop-2.7.2

5. 执行程序

[[email protected] hadoop-2.7.2]$ hadoop jar

 share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput

6. 查看结果

[[email protected] hadoop-2.7.2]$ cat wcoutput/part-r-00000

tt 2

hadoop  2

mapreduce       1

yarn    1