Hadoop伪分布式搭建

程序员文章站 2022-12-11 08:30:42

搭建伪分布式环境，只需要一台Linux服务器，一般开发测试使用在单机上模拟分布式环境 HDFS：主节点 NameNode 从节点 DataNode SecondaryNameNode yarn：主节点 ResourceManager 从节点 NodeManager tools和training是 ......

搭建伪分布式环境，只需要一台linux服务器，一般开发测试使用

在单机上模拟分布式环境

hdfs：主节点 namenode

从节点 datanode secondarynamenode

yarn：主节点 resourcemanager

从节点 nodemanager

tools和training是自定义目录

工具：securecrt6.5.0

将hadoop包上传到linux服务器上，如~/tools目录下
解压该压缩包到~/training目录下
在~/.bash_profile里设置环境变量，增加红色框内容。 vi ~/.bash_profile，按 【i】 进入编辑模式，按【esc】退出编辑模式，输入冒号：wq回车保存
执行source ~/.bash_profile 使环境变量生效
配置jdk路径，找到hadoop的配置文件hadoop-env.sh，vi /root/training/hadoop-2.7.3/etc/hadoop/hadoop-env.sh回车，加入红色部分，java_home就是jdk的路径
接着配置hdfs-site.xml，加入红色框内容

<property>
<name>dfs.replication</name>
<value>1</value>
</property>
配置core-site.xml，加入如下内容

<property>
<name>fs.defaultfs</name>
<value>hdfs://本机ip:9000</value>
</property>


<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-2.7.3/tmp</value>
</property>
配置mapred-site.xml，添加如下

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
配置yarn-site.xml，添加如下

<property>
<name>yarn.resouremanager.hostname</name>
<value>ip地址</value>
</property>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
启动start-all.sh，表示启动所有服务，但发现要输入四次密码
停止所有服务，执行stop-all.sh，也要输入四次密码，从启动到停止服务，一共输入8次密码。如果启动多台服务器，那岂不是很多密码
伪分布式环境到此就搭建配置完成。基于输入多次密码，可以配置免密登录，下一节将会讲解