Hadoop2.6.1 配置Hive2.x

Hive是一个将SQL解析成MapReduce程序的数据仓库工具。
它保存元数据有三种方式,一种是derby,一种是本地数据库,还是有一中是远程数据库。
在是在的生产环境中,我们一般使用远程数据库的方式连接,即独立创建一个数据库来保存元数据。

第一部分 安装数据库

在CentOs下,比如node5,使用yum命令安装即可。

yum -y install mysql*

安装完数据库,需要启动数据库。

service mysqld start

然后输入 mysql 命令,进入mysql的console界面,做三件事情。

  • 配置mysql的远程连接。
  • 修改root永不的密码
  • 创建一个数据库,名为hivedb,供hive使用。
    由于网站安全原因,不让写sql语句,请访问共享连接

第二部分 安装Hive2.x

hive的官网下载最先版本的hive。
注意hive分为两个版本,一个是hive1.x版本支持hadoop 1.x和hadoop2.x。一个hive2.x支持hadoop2.x版本。

  • 上传到一台装有hadoop环境的机器上。
  • 解压hive安装包
tar -zxvf apache-hive-2.1.1-bin.tar.gz -C /export/servers/
cd /export/servers/
ln -s apache-hive-2.1.1-bin hive
  • 修改配置文件
cd /export/servers/hive
touch hive-site.xml
vi hive-sit.xml
添加一下内容:
<configuration>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://node5:3306/hivedb?createDatabaseIfNotExist=true</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>root</value>
        </property>
        <property>    
                <name>hive.metastore.schema.verification</name>    
                <value>false</value>   
        </property>
</configuration>
cd /export/servers/hive/lib
rz mysql-connector-java-5.1.27.jar
  • 配置环境变量,并使之生效
vi /etc/profile
添加一下内容:
export HIVE_HOME=/export/servers/hive
export PATH=${HIVE_HOME}/bin:$PATH

source /etc/profile
  • 初始化hive的元数据表结构
    在任意目录执行以下命令。
schematool -dbType mysql -initSchema

最后,在任意目录启动hive即可。

标签: hadoop, hive

相关文章推荐

添加新评论,含*的栏目为必填