大数据学习之十六——hive的安装以及表的基本操做

1.概念了解mysql

hive是基于hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一个数据库表,并提供简单的sql查询功能,能够将sql语句转换为MapReduce任务进行运行。其优势是学习成本低,能够经过类SQL语句快速实现简单的MapReduce统计,没必要开发专门的MapReduce应用,十分适合数据仓库的统计分析。jquery

2.hive的安装sql

(1)修改配置文件数据库

/etc/profile工具

并使用scource /etc/profile使配置生效oop

在HIVE_HOME目录下,在conf/hive-env.sh中修改配置学习

修改hive-site.xml(原本是不存在的,能够复制hive-default.xml,而后重命名为hive-site.xml)3d

将<configuration></configuration>中的内容所有删除,换成以下内容:xml

注意目录和IP地址的改变!blog

在HIVE_HOME下,建立文件local和logs。

在HIVE_HOME/conf中的配置文件,将hive-exec-log4j.properties.template重命名为:hive-exec-log4j.properties,将hive-log4j.properties.template重命名为:hive-log4j.properties

并在两个文件中修改内容:

(2)添加mysql驱动包放在HIVE_HOME/lib目录下

(3)修改hadoop的库文件
在$HADOOP_HOME/share/hadoop/yarn/lib下备份jline-0.9.94.jar
执行命令
$mv jline-0.9.94.jar jline-0.9.94.jar.bak
Copy高版本的jline
$cp $HIVE_HOME/lib/jline-2.12.jar $HADOOP_HOME /share/hadoop/yarn/lib

(4)验证是否安装成功:$hive

 

3.表的基本操做

(1)建立一个表名为student01的内部表

• create  table 建立一个指定名字的表。若是相同名字的表已经存在,则抛出异常;用户能够用 if  not   exists 选项来忽略这个异常

• external 关键字能够让用户建立一个外部表,在建表的同时指定一个指向实际数据的路径(location),若是文件数据是纯文本,能够使用 stored  as  textfile ,若是数据须要压缩,使用 stored  as  sequence 。

(2)建立一个表名为student2的外部表

(3)展现表的元素

(4)向表中添加元素

(5)表名的更改

(6)表的删除

相关文章
相关标签/搜索