欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Hive安装与配置MySQL元数据库

程序员文章站 2024-03-22 12:08:22
...

一.MySQL的安装

1.1 更新获取最新软件源,并安装MySQL。

sudo apt-get update
sudo apt-get install mysql-server

1.2 启动和关闭MySQL服务器。

service mysql start
service mysql stop

1.3 确认MySQL 是否启动成功,MySQL 处于LISTEN状态则表示启动成功。

 sudo netstat -tap | grep mysql

1.4 安装过程中若提示设置密码则设置登录密码,若没有提示设置密码,则需要修改默认密码。若 mysql -u root 和mysql -u root -p 都无法登录则需要修改密码。如下修改密码步骤。

1.5 查看mysql 相关信息。

sudo cat /etc/mysql/debian.cnf

1.6 设置无需验证密码登录,打开my.cnf文件,添加skip-grant-tables,需要关闭mysql 服务。

service mysql stop
vim /etc/mysql/my.cnf

在文件末尾添加如下内容,按i进入输入模式。

[mysqld]
skip-grant-tables

1.7 保存内容,由于文件是只读文件,需要通过如下方式保存。
按Esc,然后Shift+ : ,输入如下命令,保存文件。

 w !sudo tee %

1.8 启动服务,无密码登录mysql。

service mysql start
mysql -u root -p

1.9 选择一个数据库,我选择mysql。

show databases;
use mysql;

1.20 执行如下命令,查询plugin 字段和更新plugin字段为默认值。

select plugin from user where user='root';
update user set plugin = 'mysql_native_password';
select plugin from user where user='root';

1.21 执行更新密码操作。

update user set authentication_string =password('root') where user ='root' and host='localhost';

1.22 刷新权限。

flush privileges;

1.23 退出mysql ,关闭服务,修改my.cnf文件,删除skip-grant-tables。

exit
service mysql stop

1.24 重启mysql ,密码更新成功。

1.25 设置利用sqoop 导入MySQL中文乱码问题,是由于character_set_server默认为latin1。

Hive安装与配置MySQL元数据库
1.26 配置文件,修改编码,添加character_set_server=utf8。

vim sudo /etc/mysql/mysql.conf.d/mysqld.cnf

Hive安装与配置MySQL元数据库
1.27 重启服务,查看设置。

service mysql restart
mysql -u root -p
show variables like "char%";

Hive安装与配置MySQL元数据库

二.Hive 的安装与配置

2.1 准备Hive 3.1.2。
https://pan.baidu.com/s/1h3UNBcXOeI3IYVYIOEhY_Q
提取码: yj3x

2.2 进入Hive3.1.2所在目录,解压文件到/usr/local目录。

sudo tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /usr/local
cd /usr/local/
sudo mv apache-hive-3.1.2-bin hive
sudo chown -R hadoop:hadoop hive #hadoop为当前登录的用户名

2.3 修改环境变量

vim ~/.bashrc

添加如下内容。

export HIVE_HOME=/usr/local/hive
export PATH=$PATH:$HIVE_HOME/bin
export HADOOP_HOME=/usr/local/hadoop

使配置生效。

source ~/.bashrc

2.4 修改配置文件hive-site.xml。

cd /usr/local/hive/conf
mv hive-default.xml.template hive-default.xml
vim hive-site.xml

添加如下配置,保存退出。

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hive</value>
    <description>username to use against metastore database</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>hive</value>
    <description>password to use against metastore database</description>
  </property>
</configuration>

2.5 下载mysql jdbc 包,解压并配置,如下相关命令。

tar -zxvf mysql-connector-java-5.1.40.tar.gz 
cp mysql-connector-java-5.1.40/mysql-connector-java-5.1.40-bin.jar /usr/local/hive/lib 

2.6 登录数据库,并进行相关设置操作创建数据库hive。

 service mysql start #启动mysql服务
 mysql -u root -p  #登陆shell界面
 create database hive;

2.7 配置mysql 允许hive 接入。

grant all on *.* to aaa@qq.com identified by 'hive';   #将所有数据库的所有表的所有权限赋给hive用户,后面的hive是配置hive-site.xml中配置的连接密码
flush privileges; 

2.8 启动hive ,已经配置了PATH,可以直接输入启动名利,否则需要加上路径。

start-dfs.sh #启动Hadoop的HDFS
hive  #启动hive

2.9 相关错误解决。

Hive安装与配置MySQL元数据库

  • 出现 java.lang.NoSuchMethodError:com.google.common.base.Preconditions.checkArgument
    是因为hive内依赖的guava.jar和hadoop内的版本不一致造成的。
  • 解决方法
    1.查看hadoop安装目录下share/hadoop/common/lib内guava.jar版本
    2.查看hive安装目录下lib内guava.jar的版本 如果两者不一致,删除版本低的,并拷贝高版本的 问题解决。

Hive安装与配置MySQL元数据库

  • 出现 org.datanucleus.store.rdbms.exceptions.MissingTableException: Required table missing : “VERSION” in Catalog “” Schema “”. DataNucleus requires this table to perform its persistence operations.
  • 解决办法:
cd /usr/local/hive
./bin/schematool -dbType mysql -initSchema

2.10 Hive 简单编程
导入的数据集是HDFS 文件目录的数据,不是本地数据。

create table docs(line string);
load data inpath 'input' overwrite into table docs;
create table word_count as 
select word, count(1) as count from
(select explode(split(line,' '))as word from docs) w
group by word
order by word;

查看结果,也可以通过网页方式查看结果。

select * from word_count;

2.11 源文档
http://dblab.xmu.edu.cn/blog/2440-2/#more-2440