Hive学习系列一--安装部署

Hive的认识java

    Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,能够将SQL语句转换为MapReduce任务进行运行,经过本身的SQL 去查询分析须要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言查询,汇总,分析数据。而mapreduce开发人员能够把自己写的mapper 和reducer 做为插件来支持Hive 作更复杂的数据分析。
     它与关系型数据库的SQL 略有不一样,但支持了绝大多数的语句如DDL、DML 以及常见的聚合函数、链接查询、条件查询。HIVE不适合用于联机(online)事务处理,也不提供实时查询功能。它最适合应用在基于大量不可变数据的批处理做业。

    HIVE的特色:可伸缩(在Hadoop的集群上动态的添加设备),可扩展,容错,输入格式的松散耦合数据库

Hive的安装步骤apache

    前奏:hadoop版本2.6.0,hive版本1.2.1(开始安装版本为1.1.1,后发现不少问题,修改成1.2.1),jdk版本1.7app

一、下载apache-hive-1.1.1-bin.tar.gz复制到/opt目录下解压tar zxvf apache-hive-1.1.1-bin.tar.gz分布式

二、进入conf目录下,复制template文件函数

    a) hive-default.xml.template --> hive-default.xmloop

    b) hive-env.sh.template --> hive-env.shspa

    c) hive-log4j.properties.template --> hive-log4j.properties插件

    d) hive-exec-log4j.properties.template --> hive-exec-log4j.propertiesxml

三、修改hive-env.sh文件,打开下面的注释

    a) # export HADOOP_HEAPSIZE=1024

    b) #HADOOP_HOME=/hadoop/hadoop-1.0.4

    c) #export HIVE_CONF_DIR=/hive/hive-0.9.0/conf

四、先启动hadoop,而后进入hive-1.1.1/bin目录下执行./hive

    a) 报错为:Terminal initialization failed; falling back to unsupported,

        具体错误为:

            ERROR] Terminal initialization failed; falling back to unsupported

            java.lang.IncompatibleClassChangeError: Found class jline.Terminal, but              interface was expected

            解决方法:删除位于$HADOOP_HOME/share/hadoop/yarn/lib/jline-0.9.94.jar 的 jline-0.9.94.jar 文件,从新启动hadooop,hive便可

相关文章
相关标签/搜索