欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

利用zookeeper来实现namanode的高可用(HA)(第二篇)

程序员文章站 2022-06-13 19:59:05
...

利用zookeeper来实现namanode的高可用(HA)(第二篇,接上篇)

 

 

机器设备:为了叙述方面 采用nodeX的形式来表示主机名

192.168.159.31(node1)                Namenode

 

192.168.159.32(node2) zookeeper      Datanode     JN(JournalNode)

  

192.168.159.33(node3) zookeeper      Datanode     JN

 

192.168.159.34(node4) zookeeper      Datanode     JN

 

192.168.159.35(node5)                Namenode

 

第一步:

1:zookeeper环境已经搭好,并启动

2:hadoop在.bash_profile已经配置好

3:hadoop-env.sh JAVA_HOME已经配置好

 

第二步:

 

node1可以免密登录到node2,node3,node4,node5;

node5可以免密登录到node1

 

具体怎么做我不做解释,很简单的

 

第三步:

 

在node1上配置hadoop然后 scp到其他主机上即可 

 

vim hdfs-site.xml  (汉字不要复制)

 

<property>

<name>dfs.nameservices</name>  #集群名字 唯一标识

<value>mycluster</value>

</property>

 

<property>

<name>dfs.ha.namenodes.mycluster</name>  #namenode 两个

<value>nn1,nn2</value>

</property>

 

<property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name> #第一个namenode在哪

<value>node1:8020</value>

</property>

<property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>  #第二个namenode在哪

<value>node5:8020</value>

</property>

 

<property>

<name>dfs.namenode.http-address.mycluster.nn1</name>  #页面访问 第一个namenode

<value>node1:50070</value>

</property>

<property>

<name>dfs.namenode.http-address.mycluster.nn2</name>  #页面访问 第二个namenode

<value>node5:50070</value>

</property>

 

<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://node2;node3;node4/mycluster</value>  #JN在哪几台主机上

</property>

 

<property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

 

<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

 

<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/root/.ssh/id_rsa</value>

</property>

<property>

name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>

 

 

第四步:

 

vim core-site.xml

 

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop</value>

</property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<property>

<name>dfs.journalnode.edits.dir</name>

<value>/opt/JN</value>

</property>

<property>

<name>ha.zookeeper.quorum</name>

<value>node2:2181,node3:2181,node4:2181</value>  #zookeeper部署在哪几台主机

</property>

 

 

 

 

第五步:

 

把node1上配置好的hadoop scp到node2...node5上

 

第六步:

 

在node2,node3,node4上执行: (这是第一次运行环境的时候需要,为hdfs namenode -format做准备)

 

hadoop-daemon.sh start journalnode

 

第七步:

 

在任意一个namenode节点上运行.比如在node1上

 

hdfs namenode -format

 

成功之后执行

 

hadoop-daemon.sh start namenode 启动节点

 

在node5上执行

 

hdfs namenode -bootstrapStandby

 

然后在node5上启动namenode

 

hadoop-daemon.sh start namenode 启动节点

 

第七步的作用是:首先在一个节点上格式化namenode,然后把元数据fsimage复制到另一个namenode节点上

 

最后:

 

在node1上执行: stop-dfs.sh

 

全面启动:stop-dfs.sh 

 

 

验证:

 

1:利用jps检验是否成功:

 

node1,node5

 

7512 DFSZKFailoverController

7745 Jps

7626 NameNode

 

node2,node3,node4

 

3165 Jps

2931 QuorumPeerMain (zookeeper进程)

3068 JournalNode   (JN进程)

2983 DataNode

 

2:页面验证

 

192.168.159.31:50070

192.168.159.35:50070

 

这两个中一个是active,另一个是standby

 

然后把active的进程kill掉,就可以看到原先是standby的变为了active了

 

 

 

这样就表示成功啦.