[一起学Hive]之四-Hive的安装配置 博客分类: hive hivehive安装配置
其实Hive的安装配置应该放在第二章来介绍,晚了些,希望对Hive初学者有用。
三、Hive的安装配置
3.1 环境需求
- Hadoop Client
- Mysql
3.2 下载并解压Hive0.13.1安装包
下载地址:http://archive.apache.org/dist/hive/hive-0.13.1/apache-hive-0.13.1-bin.tar.gz
cp apache-hive-0.13.1-bin.tar.gz /usr/local
cd /usr/local
tar –xzvf apache-hive-0.13.1-bin.tar.gz
配置环境变量(如果不是root用户,配置自己的~/.bash_profile即可):
vi /etc/profile
export HIVE_HOME=/usr/local/apache-hive-0.13.1-bin
export PATH=$HIVE_HOME/bin: $PATH
source /etc/profile
3.3 在Mysql中建立Hive元数据库和表
root进入Mysql;
CREATE DATABASE hive;
//下面给所有的ip都赋了访问权限,安全起见,
//一般这里只需要对安装Hive Client端的机器IP赋权即可
GRANT ALL ON hive.* TO hive@’%’ IDENTIFIED BY ‘hive1234′;
flush privileges;
3.4 配置hive-site.xml
cd $HIVE_HOME/conf/
新建hive-site.xml, 里面是以下内容:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>hive.metastore.warehouse.dir</name> <value>/hivedata/warehouse/</value> <description>Hive在HDFS上的根目录</description> </property> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://172.16.212.102:3306/hive?createDatabaseIfNotExist=true</value> <description>Hive元数据库的连接串,红色为数据库名</description> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> <description>Hive元数据库JDBC驱动</description> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> <description>Hive元数据库用户名</description> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hive1234</value> <description>Hive元数据库密码</description> </property> <property> <name>datanucleus.autoCreateTables</name> <value>true</value> <description>不存在时,自动创建Hive元数据表</description> </property> <property> <name>datanucleus.autoCreateColumns</name> <value>true</value> <description>不存在时,自动创建Hive元数据列</description> </property> <property> <name>datanucleus.fixedDatastore</name> <value>false</value> </property> <property> <name>datanucleus.autoStartMechanism</name> <value>SchemaTable</value> </property> </configuration>
这些是必须的参数,配好就行了,特别注意最后几个参数,其他可根据实际需求来配置。
3.5 进入Hive-Cli
由于3.3中已经配置了环境变量,因此直接执行hive命令,即可进入Hive-Cli.
如:
[lxw1234@dev ~]$ hive
Logging initialized using configuration in file:/usr/local/apache-hive-0.13.1-bin/conf/hive-log4j.properties
hive>show databases;
OK
default
Time taken: 0.42 seconds, Fetched: 1 row(s)
hive>
第一次执行,Hive需要在元数据库中建立相关的表,因此会稍微感觉慢一些。
3.6 Hive的日志
Hive的日志一般存放在操作系统本地的/tmp/${user.name}/hive.log中,该文件路径由
$HIVE_HOME/conf/hive-log4j.properties中指定,可自己修改该路径。
Hive相关文章(持续更新):
上一篇: kafka配置文件详解
下一篇: 识别验证码并登录案例
推荐阅读
-
[一起学Hive]之五-Hive的视图和分区 博客分类: hive hivehive视图hive分区
-
[一起学Hive]之八-使用Hive命令行 博客分类: hive hivehive命令行
-
[一起学Hive]之六-Hive的动态分区 博客分类: hive hivehive动态分区
-
[一起学Hive]之十-Hive中Join的原理和机制 博客分类: hive HiveHive MapJoinHive Common Join
-
[一起学Hive]之九-Hive的查询语句SELECT 博客分类: hive hive一起学HiveHive SELECT
-
[一起学Hive]之十三-Hive整合HBase,操作HBase表 博客分类: hive hivehive整合hbase
-
[一起学Hive]之四-Hive的安装配置 博客分类: hive hivehive安装配置
-
[一起学Hive]之三—Hive中的数据库(Database)和表(Table) 博客分类: hive hivehive数据库和表
-
[一起学Hive]之七-向Hive表中加载数据 博客分类: hive hivehive加载数据