Kafka监控系统Kafka Eagle剖析

时间 2019-11-06

标签 kafka 监控系统 eagle 剖析栏目 Kafka 繁體版

原文原文链接

1.概述

最近有同窗留言反馈了使用Kafka监控工具Kafka Eagle的一些问题，这里笔者特地整理了这些问题。而且但愿经过这篇博客来解答这些同窗的在使用Kafka Eagle的时候遇到的一些困惑，同时也给出一些定位分析Kafka Eagle异常的时的解决办法。mysql

2.内容

2.1 背景

在使用Kafka Eagle监控系统以前，笔者简单的介绍一下这款工具的用途。Kafka Eagle监控系统是一款用来监控Kafka集群的工具，目前更新的版本是v1.2.3，支持管理多个Kafka集群、管理Kafka主题（包含查看、删除、建立等）、消费者组合消费者实例监控、消息阻塞告警、Kafka集群健康状态查看等。目前Kafka Eagle v1.2.3整个系统所包含的功能，这里笔者给绘制成了一个图，结果以下图所示：git

2.2 安装

接下来，咱们开始安装Kafka Eagle系统，安装以前，咱们须要准备好Kafka Eagle安装包。这里有2种方式：github

下载编译好的安装包
下载源代码，而后自行编译安装

下面分别介绍这2种方式。web

2.2.1 直接下载安装包

能够直接访问Kafka Eagle安装包下载地址：http://download.smartloli.org/,而后点击下载按钮，等待下载完成便可。下载界面以下图所示：sql

2.2.2 下载源代码，自行编译安装

Kafka Eagle系统的源代码托管在Github上，你们能够访问https://github.com/smartloli/kafka-eagle来获取源代码。Kafka Eagle源代码是由Maven工程来管理的，因此，在编译Kafka Eagle源代码以前，须要在本地开发环境中准备好你的Maven环境。apache

Maven安装比较简单，这里给你们介绍安装Maven的步骤：浏览器

# 步骤1：下载Maven安装包
wget http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.5.4/binaries/apache-maven-3.5.4-bin.tar.gz

# 步骤2：解压Maven安装包
tar -zxvf apache-maven-3.5.4-bin.tar.gz

# 步骤3：重命名并移动到指定位置
mv apache-maven-3.5.4 /usr/local/maven

# 步骤4：配置Maven环境编辑
vi ~/.bash_profile

export M2_HOME=/usr/local/maven
export PATH=$PATH:$M2_HOME/bin

# 步骤5：执行source命令让环境变量当即生效
source ~/.bash_profile

# 步骤6：验证Maven是否安装成功
mvn -v

# 若是能打印Maven版本信息，则安装成功

而后，进入到Kafka Eagle源代码根目录，在根目录中有一个build.sh的脚本，执行该脚本进行源代码编译。编译成功后，控制台会打印相关信息，以下图所示：bash

2.2.3 配置Kafka Eagle

准备好Kafka Eagle安装包后，接下来咱们就能够进行安装了。其实，Kafka Eagle的安装是很简单的，当初设计这个系统就是遵循简单、易用的原则来的。可是，不少同窗在安装的过程中却遇到了不少各式各样的问题。其实，在官方使用手册的安装一节中，介绍的也很详细。官方使用手册地址：http://ke.smartloli.org/ 文档托管在Gitbook，这里须要注意的是，可能有些同窗反馈说访问不了，若是网络有波动，偶尔可能须要使用代理来访问。服务器

接下来，咱们就开始配置Kafka Eagle系统，步骤以下：网络

1. 配置JAVA_HOME和KE_HOME

因为源代码核心实现采用的是Java语言，因此须要配置JDK环境，建议采用JDK8以上。配置内容以下：

vi ~/.bash_profile
export JAVA_HOME=/usr/local/jdk8
export KE_HOME=/data/soft/new/kafka-eagle

export PATH=$PATH:$JAVA_HOME/bin:$KE_HOME/bin

而后，执行source ~/.bash_profile命令让命令当即生效。若是不配置环境变量，可能在启动Kafka Eagle脚本ke.sh时抛出以下异常，异常信息以下：

[2018-07-26 18:41:51] Error: The KE_HOME environment variable is not defined correctly.
[2018-07-26 18:41:51] Error: This environment variable is needed to run this program.

[2018-07-26 18:41:51] Error: The JAVA_HOME environment variable is not defined correctly.
[2018-07-26 18:41:51] Error: This environment variable is needed to run this program.

2. 配置system-config.properties文件

该文件在$KE_HOME/conf/目录，配置内容以下：

######################################
# 配置多个Kafka集群所对应的Zookeeper
######################################
kafka.eagle.zk.cluster.alias=cluster1,cluster2
cluster1.zk.list=dn1:2181,dn2:2181,dn3:2181
cluster2.zk.list=tdn1:2181,tdn2:2181,tdn3:2181

######################################
# 设置Zookeeper线程数
######################################
kafka.zk.limit.size=25

######################################
# 设置Kafka Eagle浏览器访问端口
######################################
kafka.eagle.webui.port=8048

######################################
# 若是你的offsets存储在Kafka中，这里就配置
# 属性值为kafka，若是是在Zookeeper中，能够
# 注释该属性。通常状况下，Offsets的也和你消
# 费者API有关系，若是你使用的Kafka版本为0.10.x
# 之后的版本，可是，你的消费API使用的是0.8.2.x
# 时的API，此时消费者依然是在Zookeeper中
######################################
cluster1.kafka.eagle.offset.storage=kafka
######################################
# 若是你的集群一个是新版本（0.10.x以上），
# 一个是老版本（0.8或0.9），能够这样设置，
# 若是都是新版本，那么能够将值都设置成kafka
######################################
cluster2.kafka.eagle.offset.storage=zookeeper

######################################
# 是否启动监控图表，默认是不启动的
######################################
kafka.eagle.metrics.charts=false

######################################
# 在使用Kafka SQL查询主题时，若是遇到错误，
# 能够尝试开启这个属性，默认状况下，不开启
######################################
kafka.eagle.sql.fix.error=false

######################################
# 邮件服务器设置，用来告警
######################################
kafka.eagle.mail.enable=false
kafka.eagle.mail.sa=
kafka.eagle.mail.username=
kafka.eagle.mail.password=
kafka.eagle.mail.server.host=
kafka.eagle.mail.server.port=

######################################
# 设置告警用户，多个用户以英文逗号分隔
######################################
kafka.eagle.alert.users=smartloli.org@gmail.com


######################################
# 超级管理员删除主题的Token
######################################
kafka.eagle.topic.token=keadmin

######################################
# 若是启动Kafka SASL协议，开启该属性
######################################
kafka.eagle.sasl.enable=false
kafka.eagle.sasl.protocol=SASL_PLAINTEXT
kafka.eagle.sasl.mechanism=PLAIN

######################################
# Kafka Eagle默认存储在Sqlite中，若是要使用
# MySQL能够替换驱动、用户名、密码、链接地址
######################################
#kafka.eagle.driver=com.mysql.jdbc.Driver
#kafka.eagle.url=jdbc:mysql://127.0.0.1:3306/ke?useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull
#kafka.eagle.username=root
#kafka.eagle.password=123456

kafka.eagle.driver=org.sqlite.JDBC
kafka.eagle.url=jdbc:sqlite:/Users/dengjie/workspace/kafka-egale/db/ke.db
kafka.eagle.username=root
kafka.eagle.password=root

3. 启动Kafka Eagle

配置完成后，能够执行Kafka Eagle脚本ke.sh。若是首次执行，须要给该脚本赋予执行权限，命令以下：

chmod +x $KE_HOME/bin/ke.sh

在ke.sh脚本中，支持如下命令：

命令	说明
ke.sh start	启动Kafka Eagle系统
ke.sh stop	中止Kafka Eagle系统
ke.sh restart	重启Kafka Eagle系统
ke.sh status	查看Kafka Eagle系统运行状态
ke.sh stats	统计Kafka Eagle系统占用Linux资源状况
ke.sh find [ClassName]	查看Kafka Eagle系统中的类是否存在

3.预览

在反馈出现频率最多的问题，就是Consumer模块没有数据展现、趋势监控图没有数据、Kafka SQL查询Topic没有数据。下面围绕这3个问题来给你们演示，以及解释什么状况下出现这种状况。

3.1 Consumer模块展现

启动一个消费者程序，而后进入到Consumer模块，截图以下：

这里须要注意的时，Kafka在0.10.x以后的版本和以前的版本底层设计有了变化，在以前的版本消费者信息是存储在Zookeeper中的，在0.10.x版本以后，默认存储到了Kafka内部主题中，只保留了元数据信息存储在Zookeeper中，例如：Kafka Broker地址、Topic名称、分区等信息。

是否是我使用的是Kafka 0.10.x以后的版本（如0.10.0、1.0.x、1.x等），而后配置属性kafka.eagle.offset.storage=kafka，启动消费者，就能够看到消费者信息呢？不必定的，还有一个关键因素决定Kafka Eagle系统是否能够展现你消费者程序信息，那就是消费者API的使用。

若是你使用的Kafka 0.10.x以后的版本，而后消费者API也是使用的最新的写法，那么天然你的消费者信息会被记录到Kafka内部主题中，那么此时你设置kafka.eagle.offset.storage=kafka这个属性，Kafka Eagle系统能够完美展现你的消费者使用状况。

可是，若是你虽然使用的是Kafka 0.10.x以后的版本，可是你使用的消费者API仍是0.8.2.x或是0.9.x时的写法，此时的消费者信息是会被记录到Zookeeper中进行存储，那么此时你须要设置kafka.eagle.offset.storage=zookeeper或者注释掉该属性，在访问Kafka Eagle系统就能够查看到你的消费者详情了。

3.2. 监控趋势图

Kafka系统默认是没有开启JMX端口的，因此Kafka Eagle的监控趋势图默认采用不启用的方式，即kafka.eagle.metrics.charts=false。若是须要查看监控趋势图，须要开启Kafka系统的JMX端口，设置该端口在$KAFKA_HOME/bin/kafka-server-start.sh脚本中，设置内容以下：

vi kafka-server-start.sh

if [ "x$KAFKA_HEAP_OPTS" = "x" ]; then
    export KAFKA_HEAP_OPTS="-server -Xms2G -Xmx2G -XX:PermSize=128m -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:ParallelGCThreads=8 -XX:ConcGCThreads=5 -XX:InitiatingHeapOccupancyPercent=70"
    export JMX_PORT="9999"
    #export KAFKA_HEAP_OPTS="-Xmx1G -Xms1G"
fi

须要注意的时，这里的端口不必定非要设置成9999，端口只有可用，都可。Kafka Eagle系统会自动获取这个JMX端口，采集结果以下：

3.3 Kafka SQL查询Topic

还有一部分同窗在Kafka Eagle系统的SQL查询Topic时，会出现查询不到数据的状况。这里查询不到数据可能状况有多种，首先须要排除Kafka集群因素，确保Kafka集群运行正常，Topic可以正常访问，而且Topic中是有数据的。

在排除一些主观因素后，回到Kafka Eagle系统应用层面，若是出现这种问题，能够尝试开启属性kafka.eagle.sql.fix.error=true，这个属性默认是不开启的。正常状况下使用Kafka SQL查询Topic，返回结果以下图所示：

4.总结

另外，若是在使用Kafka Eagle系统中遇到其余问题，能够查看$KE_HOME/logs/ke_console.out日志来分析具体的异常信息，通常都会提示具体的错误，你们能够根据错误提示来进行解决。

5.结束语

这篇博客就和你们分享到这里，若是你们在研究学习的过程中有什么问题，能够加群进行讨论或发送邮件给我，我会尽我所能为您解答，与君共勉！

另外，博主出书了《Hadoop大数据挖掘从入门到进阶实战》，喜欢的朋友或同窗，能够在公告栏那里点击购买连接购买博主的书进行学习，在此感谢你们的支持。