首页 > 云计算&大数据 > Hive数据仓库 > Hive安装与启动、环境变量配置

Hive安装与启动、环境变量配置

3781

一、准备工作

搭建hadoop伪分布式环境；见 hadoop伪分布式搭建

下载hive安装包；下载路径 http://archive.apache.org/dist/hive/

二、设置环境变量

将安装包解压到/opt目录下

$ tar xvzf apache-hive-0.13.0-bin.tar.gz

设置环境变量

在/etc/profile中添加

export HIVE_HOME=/opt/hive-0.13.1
export PATH=$PATH:$HIVE_HOME/bin

运行指令：source /etc/profile使配置文件生效

三、配置hive

只需配置hive-env.sh

    $ cd $HIVE_HOME/conf
    $ cp hive-env.sh.template hive-env.sh

编辑hive-env.sh

输入HADOOP_HOME=/opt/hadoop-2.7.3，保存退出。

四、在hdfs中创建hive使用的文件夹

需要创建在hdfs中创建/tmp和/user/hive/warehouse文件夹给hive单独使用，并给这些文件夹写权限。

$ hadoop fs -mkdir /tmp 
$ hadoop fs -mkdir -p /user/hive/warehouse 
$ hadoop fs -chmod g+w /tmp 
$ hadoop fs -chmod g+w /user/hive/warehouse

五、启动hive

    $ hive
    $ show databases;

六、安装mysql来存储hive的元数据

hive的元数据需要数据库来存储，第四步结束是使用自带的derby数据库来存储元数据。这种情况有个限制，即同时只能有一个hive客户端使用数据库，否则会报错。使用MySQL数据库可解决这个限制。下面介绍安装MySQL数据库及配置方法。

安装mysql5.6.x以上的包

安装完后修改root密码

set password=password('123456')
# 查询用户信息
mysql>select User,Host,Password from user;
# 更新用户信息        
mysql> update user set Host='%' where User = 'root' and Host='localhost' ;
# 删除其他用户信息（不删除有影响）
mysql> delete from user where user='root' and host='127.0.0.1';
# 刷新信息
mysql> flush privileges;

2. 拷贝MySQL驱动jar包到Hive安装目录下的lib文件夹中

    $ cp mysql-connector-java-5.1.27-bin.jar /opt/hive-0.13.1/lib/

3.修改hive配置文件

编辑hive-site.xml文件，并添加以下信息，检查一下hive-site.xml有没有配好jdbc：

<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
        <description>JDBC connect string for a JDBC metastore</description>
        </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
        <description>Driver class name for a JDBC metastore</description>
        </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
        <description>username to use against metastore database</description>
        </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>root</value>
        <description>password to use against metastore database</description>
    </property>
</configuration>

配置完成，启动hive即可

hive启动常见报错>>

小结：

hive是基于hadoop的数据仓工具，能提供类SQL的查询语句，其本质是将HQL语句转换为MapReduce程序。本文记录hive环境搭建过程，为后续学习HQL语句做基础。

原文链接: https://www.yukx.com/bigdata/article/details/1457.html 优科学习网Hive安装与启动、环境变量配置

上一篇: Hive简介

下一篇: Hive常见异常及解决方法