配置hive环境以及mysql配置后必须作

一、先在主节点上安装阿里云配置(看别的文档)html

二、把须要的两个jar包加入进来(放到hadoop用户目录下面便可即/home/hadoop/java

mysql-connector-java-5.1.47.tar.gzmysql

apache-hive-2.3.4-bin.tar.gzsql

三、解压压缩包(在hadoop用户主节点下运行)数据库

下载地址apache

而后下载hive文件socket

http://mirror.bit.edu.cn/apache/hive/hive-2.3.4/oop

或者这个ui

 http://archive.apache.org/dist/hive/hive-2.3.4/ 

MySQL Java 链接器添加到 $HIVE_HOME/lib 目录下(后续建立)。我安装时使用的是 mysql-connector-java- 5.1.47.jar。阿里云

在mysql-connector-java-5.1.47.tar.gz解压后的下面

https://dev.mysql.com/downloads/connector/j/

http://ftp.ntu.edu.tw/MySQL/Downloads/Connector-J/

运行程序

tar -xvf apache-hive-2.3.4-bin.tar.gz -C hadoop_home/

tar -xvf mysql-connector-java-5.1.47.tar.gz

四、配置环境变量

vi ~/.profile

export HIVE_HOME=/home/hadoop/hadoop_home/apache-hive-2.3.4-bin

export PATH=$PATH:$HIVE_HOME/bin

source ~/.profile

五、在apache-hive-2.3.4-bin/conf

cp hive-env.sh.template hive-env.sh

cp hive-default.xml.template hive-site.xml

cp hive-log4j2.properties.template hive-log4j2.properties

cp hive-exec-log4j2.properties.template hive-exec-log4j2.properties

六、修改hive-env.sh

由于 Hive 使用了 Hadoop, 须要在 hive-env.sh 文件中指定 Hadoop 安装路径:

export JAVA_HOME=/home/hadoop/hadoop_home/jdk1.8.0_181    ##Java路径

export HADOOP_HOME=/home/hadoop/hadoop_home   ##Hadoop安装路径

export HIVE_HOME=/home/hadoop/hadoop_home/apache-hive-2.3.4-bin    ##Hive安装路径

export HIVE_CONF_DIR=/home/hadoop/hadoop_home/apache-hive-2.3.4-bin/conf    ##Hive配置文件路径

七、而后apt-get install mysql-server

如果没有设置密码

根据提示安装就能够了,不过安装完成后没有密码,须要重置密码

4.重置mysql密码

$ mysql -u root

1

登陆时有可能报这样的错:

ERROR 2002 (HY000): Can‘t connect to local MySQL server through socket ‘/var/lib/mysql/mysql.sock‘ (2)

1

缘由是/var/lib/mysql的访问权限问题。下面的命令把/var/lib/mysql的拥有者改成当前用户:

$ sudo chown -R root:root /var/lib/mysql

1

5.重启mysql服务

$ service mysqld restart   或者/etc/init.d/mysql restart

1

6.接下来登陆重置

$ mysql -u root  //直接回车进入mysql控制台

mysql > use mysql;

mysql > update user set password=password('123456') where user='root';

mysql > exit;

进入如下界面

cd   /etc/mysql/mysql.conf.d

而后

vi vi mysqld.cnf

 

把最下面的bind-address  =127.0.0.1

注释掉就好(后面sqoop用到)

 

8设置远程链接

设置远程链接

mysql> CREATE DATABASE hive;建立数据库

mysql> USE hive;进入数据库

mysql> CREATE USER 'hive'@'localhost' IDENTIFIED BY 'hive';建立hive用户,而且密码为hive,容许本地登陆

mysql> GRANT ALL ON hive.* TO 'hive'@'localhost' IDENTIFIED BY 'hive';把hive数据库的内容到hive用户下,即配置权限

mysql> GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'hive';

mysql> FLUSH PRIVILEGES;

mysql> quit;

在root用户下执行

service mysqld restart   或者/etc/init.d/mysql restart

重启服务

 

9建立HDFS目录

在 Hive 中建立表以前须要建立如下 HDFS 目录并给它们赋相应的权限。

 先启动集群  :start-all.sh

hdfs dfs -mkdir -p /user/hive/warehouse

hdfs dfs -mkdir -p /user/hive/tmp

hdfs dfs -mkdir -p /user/hive/log

hdfs dfs -chmod g+w /user/hive/warehouse

hdfs dfs -chmod g+w /user/hive/tmp

hadoop fs -chmod -R 777 /user/hive/tmp

hdfs dfs -chmod g+w /user/hive/log

10建立数据库和用户

假定你已经安装好 MySQL。下面建立一个 hive 数据库用来存储 Hive 元数据,且数据库访问的用户名和密码都为 hive。

mysql> CREATE DATABASE hive;

mysql> USE hive;

mysql> CREATE USER 'hive'@'localhost' IDENTIFIED BY 'hive';

mysql> GRANT ALL ON hive.* TO 'hive'@'localhost' IDENTIFIED BY 'hive';

mysql> GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'hive';

mysql> FLUSH PRIVILEGES;

mysql> quit;

11修改hive-site.xml 

而后在配置文件hive-site.xml中,把全部的${system:java.io.tmpdir} 都替换为/usr/local/hive/tmp (有可能须要转义字符)

把全部的${system:user.name}替换为${user.name}

直接修改成下面这样也能够,注意用户名和密码,对应上一步中mysql建立的用户名和密码

依次查找下面的修改。

 <property>

    <name>hive.exec.scratchdir</name>

    <value>/user/hive/tmp</value>

</property>

<property>

    <name>hive.metastore.warehouse.dir</name>

    <value>/user/hive/warehouse</value>

</property>

<property>

    <name>hive.querylog.location</name>

    <value>/user/hive/log</value>

</property>

<property>

    <name>javax.jdo.option.ConnectionURL</name>

    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionDriverName</name>

    <value>com.mysql.jdbc.Driver</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionUserName</name>

    <value>hive</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionPassword</name>

    <value>hive</value>

</property>

12.建立/usr/local/hive/tmp文件夹

切换到root用户执行

mkdir -p /usr/local/hive/tmp

chown -R hadoop:hadoop /usr/local/hive/tmp

chown -R hadoop:hadoop /user/local/hive/tmp 设置权限(root权限下面)

4.运行Hive

在命令行运行 hive 命令时必须保证如下两点:

HDFS 已经启动。可使用 start-dfs.sh 脚原本启动 HDFS。

运行 schematool 命令来执行初始化操做。

schematool -dbType mysql -initSchema

注意必定要英文下的杠

若是仍是失败,1、试一下远成链接可否成功,不成功从新配置远程而后重启数据库2、检查配置或者命令的格式问题3、检查数据库hive下是否会莫名导入不少乱七八糟的包,删除而后重建

而后执行

hive

 

 

在最后补充

1)在 hive-site.xml 文件中添加以下配置信息,就能够实现显示当前数据库,以及查询 表的头信息配置。

<property>
<name>hive.cli.print.header</name>
<value>true</value>
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>


2)从新启动 hive,对比配置先后差别

相关文章
相关标签/搜索