Apache kylin的基础环境

1、Apache kylin的基础环境

因为Apache kylin上的OLAP(wiki:OLAP)是构建在hadoop生态环境上的,因此hadoop环境的稳定性和健壮性对kylin的稳定运行相当重要。通常而言,Apache kylin实例最好部署在hadoop集群的客户端机器上;而经过hadoop客户端机器,kylin最好能直接访问hadoop、hdfs、hive、hbase等命令行脚本;另外,kylin进程实例的全部者,须要具有如下权限:apache

  • 读/写 hadoop分布式文件系统。
  • 提交MR任务到hadoop集群。
  • 建立/删除hive表。
  • 建立hbase表。

以下图:bash

如下是Apache kylin依赖环境的组件及版本推荐:服务器

  • Hadoop: 2.6 - 2.7
  • Hive: 0.13 - 1.2.1
  • HBase: 0.98 - 0.99, 1.x
  • JDK: 1.7+

2、Apache kylin的安装部署

安装:运维

  1. 下载最近版本的kylin:Apache Kylin,解压。
  2. 在 ~/.bash_profile 中添加指向解压后的kylin文件夹的KYLIN_HOME环境变量。
  3. 确保当前用户能在命令行接口中访问hadoop, hive , hbase 命令,若是你不肯定,可利用$KYLIN_HOME/bin/check-env.sh 验证。

部署:分布式

通常以集群模式部署kylin,kylin实例进程是无状态的,kylin实例运行的状态信息保存在hbase和hdfs中(后面有单独篇章讲元数据)kylin实例有三种运行模式,决定了该实例的职责,以下:oop

  1. job,该实例做为cube build engine运行。
  2. query, 该实例做为query engine运行。
  3. all,该实例既可做为query engine运行,也能够做为cube build engine 运行。

注意:kylin集群只能有一个实例以 job 或者 all 模式运行 ,其他全部实例只能做为 queryengine运行。一个典型的部署方式以下:ui

 

      以集群模式部署kylin时,每一个kylin服务器实例的${HOME_KYLIN}/conf/kylin.properties文件中的如下两个参数需注意:命令行

  1. kylin.rest.servers,提供查询服务的kylin实例列表,如:kylin.rest.servers=hostname1:7070,hostname2:7070
  2. kylin.server.mode,kylin实例的运行模式,注意,只能有一个实例以 job或者 all 模式运行 ,其他全部实例只能以 query 模式运行。

3、Apache kylin的基础运维

  1. 启动实例
$KYLIN_HOME/bin/kylin.sh start

2.关闭实例rest

$KYLIN_HOME/bin/kylin.sh stop
相关文章
相关标签/搜索