hadoop在CentOS下的安装配置

程序员文章站 2023-03-31 09:53:51

今天自学完了大数据方面生态系统的一些核心技术，在这里整理一下学过的知识算是复习，也方便初学者参考 ......

版本：centos-6.8-x86_64-minimal，hadoop2.6.4，jdk1.7.0
首先把jdk、hadoop压缩包下载发送到centos下并解压

下载发送不多赘述，解压命令tar -zxvf 压缩包

mv 原文件名新文件名

（注意空格）

先配置jdk

进入jdk目录 pwd 查看当前目录复制备用/apps/jdk1.7.0_25
配置环境变量

vi ~/.bash_profile

java_home=/apps/jdk1.7.0_25
path=$path:$home/bin:$java_home/bin

source ~/.bash_profile

关闭防火墙，做好ssh免密登录
- 关闭防火墙
  - service iptables stop
  - chkconfig iptables off
  - ssh-keygen -t rsa
- ssh免密登录
  - master： cat /root/.ssh/id_rsa.pub >>/root/.ssh/authorized_keys
  - master：scp /root/.ssh/authorized_keys @slave1:/root/.ssh/authorized_keys
  - slave1：cat /root/.ssh/id_rsa.pub >>/root/.ssh/authorized_keys
  - slave1：scp /root/.ssh/authorized_keys @slave2:/root/.ssh/authorized_keys
  - slave2：cat /root/.ssh/id_rsa.pub >>/root/.ssh/authorized_keys
  - slave2：scp /root/.ssh/authorized_keys @master:/root/.ssh/authorized_keys
  - master：scp /root/.ssh/authorized_keys @slave1:/root/.ssh/authorized_keys
  - slave2：scp /root/.ssh/authorized_keys @slave2:/root/.ssh/authorized_keys
再配置hadoop

环境变量vi ~/.bash_profile
hadoop_home=/apps/hadoop-2.6.4
path=$path:$home/bin:$java_home/bin:$hadoop_home/bin:$hadoop_home/sbin

source ~/.bash_profile
配置运行环境
- core-site.xml
  - <property>
    <name>fs.defaultfs</name>
    <value>hdfs://master:9000</value>
    </property>
- hdfs-site.xml
  - <property>
    <name>dfs.replication</name>
    <value>3</value>
    </property>
    
    <property>
    <name>dfs.namenode.name.dir</name>
    <value>/app/hadoop/dfs/name</value>
    </property>
    
    <property>
    <name>dfs.datanode.data.dir</name>
    <value>/app/hadoop/dfs/data</value>
    </property>
    
    <property>
    <name>dfs.secondary.http.address</name>
    <value>slave2:50090</value>
    </property>
    
    <property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>/app/hadoop/dfs/namesecondary</value>
    </property>
- hadoop-env.sh
  - export java_home=/apps/jdk1.7.0_25
- yarn-site.xml
  - <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    
    <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
    </property>
    
    mapreduce-site.xml
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
  - slaves
    - 将原有内容替换为从节点主机名
将配置完成的jdk、hadoop发送到另外两台主机上
- master：scp -r apps/ @slave1:/apps/
- master：scp -r apps/ @slave2:/apps/
- master：scp ~/.bash_profile @slave1:~/.bash_profile
- master：scp ~/.bash_profile @slave2:~/.bash_profile
- slave1： source ~/.bash_profile
- slave2： source ~/.bash_profile

　　hadoop集群配置完成

格式化namenode

　　hadoop namenode -format

启动所有节点

　　start-all.sh

上一篇： Python练手例子（15）

下一篇：乾隆所自夸十全武功中为什么最后一个是凑数的原因是什么

hadoop在CentOS下的安装配置

JSP在Linux下的安装

CentOS下安装mysql时忘记设置root密码致无法登录的解决方法

CentOS 7.2下MySQL的安装与相关配置

Centos 6.5 下安装mysql 5.6.21的方法

CentOS 7.0下使用yum安装mysql的方法详解

tomcat 3.1在RedHat下的安装

Linux(CentOS)下PHP扩展PDO编译安装的方法

mysql 5.7 zip 文件在 windows下的安装教程详解

CentOS 7系统下配置自定义JDK的教程

Centos7下使用yum安装mysql数据库的详细教程(增强版)