大数据学习之十六——hive的安装以及表的基本操做

时间 2019-11-12

标签数据学习十六 hive 安装以及基本栏目 Hadoop 繁體版

原文原文链接

1.概念了解mysql

hive是基于hadoop的一个数据仓库工具，能够将结构化的数据文件映射为一个数据库表，并提供简单的sql查询功能，能够将sql语句转换为MapReduce任务进行运行。其优势是学习成本低，能够经过类SQL语句快速实现简单的MapReduce统计，没必要开发专门的MapReduce应用，十分适合数据仓库的统计分析。jquery

2.hive的安装sql

（1）修改配置文件数据库

/etc/profile工具

并使用scource /etc/profile使配置生效oop

在HIVE_HOME目录下，在conf/hive-env.sh中修改配置学习

修改hive-site.xml（原本是不存在的，能够复制hive-default.xml，而后重命名为hive-site.xml）3d

将<configuration></configuration>中的内容所有删除，换成以下内容：xml

注意目录和IP地址的改变！blog

在HIVE_HOME下，建立文件local和logs。

在HIVE_HOME/conf中的配置文件，将hive-exec-log4j.properties.template重命名为：hive-exec-log4j.properties，将hive-log4j.properties.template重命名为：hive-log4j.properties

并在两个文件中修改内容：

（2）添加mysql驱动包放在HIVE_HOME/lib目录下

（3）修改hadoop的库文件
在$HADOOP_HOME/share/hadoop/yarn/lib下备份jline-0.9.94.jar
执行命令
$mv jline-0.9.94.jar jline-0.9.94.jar.bak
Copy高版本的jline
$cp $HIVE_HOME/lib/jline-2.12.jar $HADOOP_HOME /share/hadoop/yarn/lib

（4）验证是否安装成功：$hive

3.表的基本操做

（1）建立一个表名为student01的内部表

• create table 建立一个指定名字的表。若是相同名字的表已经存在，则抛出异常；用户能够用 if not exists 选项来忽略这个异常

• external 关键字能够让用户建立一个外部表，在建表的同时指定一个指向实际数据的路径（location）,若是文件数据是纯文本，能够使用 stored as textfile ,若是数据须要压缩，使用 stored as sequence 。

（2）建立一个表名为student2的外部表

（3）展现表的元素

（4）向表中添加元素

（5）表名的更改

（6）表的删除