Kafka是分布式发布-订阅消息系统,最初由LinkedIn公司开发,以后成为以后成为Apache基金会的一部分,由Scala和Java编写。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。apache
它与传统系统相比,有如下不一样:vim
- 它被设计为一个分布式系统,易于向外扩展;
- 它同时为发布和订阅提供高吞吐量;
- 它支持多订阅者,当失败时能自动平衡消费者;
- 它将消息持久化到磁盘,所以可用于批量消费,例如ETL,以及实时应用程序。
从官网下载Kafka安装包,解压安装,或直接使用命令下载。centos
wget http://mirror.bit.edu.cn/apache/kafka/1.0.0/kafka_2.11-1.0.0.tgz
解压安装bash
tar -zvxf kafka_2.11-1.0.0.tgz -C /usr/local/ d /usr/local/kafka_2.11-1.0.0/
修改配置文件服务器
vim config/server.properties
修改其中并发
broker.id=1 log.dirs=data/kafka-logs
使用安装包中的脚本启动单节点Zookeeper实例:分布式
bin/zookeeper-server-start.sh -daemon config/zookeeper.properties
使用kafka-server-start.sh启动kafka服务:centos7
bin/kafka-server-start.sh config/server.properties
使用kafka-topics.sh 建立但分区单副本的topic testspa
bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
bin/kafka-topics.sh --list --zookeeper localhost:2181
使用kafka-console-producer.sh 发送消息设计
bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
使用kafka-console-consumer.sh 接收消息并在终端打印
bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning
bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic test
bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test
第一行给出了全部分区的摘要,每一个附加行给出了关于一个分区的信息。 因为咱们只有一个分区,因此只有一行。
“Leader”: 是负责给定分区的全部读取和写入的节点。 每一个节点将成为分区随机选择部分的领导者。
“Replicas”: 是复制此分区日志的节点列表,不管它们是不是领导者,或者即便他们当前处于活动状态。
“Isr”: 是一组“同步”副本。这是复制品列表的子集,当前活着并被引导到领导者。
Kafka支持两种模式的集群搭建:
利用单节点部署多个broker。不一样的broker不一样的id,监听端口以及日志目录,如:
cp config/server.properties config/server-1.properties cp config/server.properties config/server-2.properties
vim config/server-1.properties #修改内容 broker.id=2 listeners=PLAINTEXT://your.host.name:9093 log.dirs=/data/kafka-logs-1 vim config/server-2.properties #修改内容 broker.id=3 listeners=PLAINTEXT://your.host.name:9094 log.dirs=/data/kafka-logs-2
in/kafka-server-start.sh config/server-1.properties bin/kafka-server-start.sh config/server-2.properties
分别在多个节点按上述方式安装Kafka,配置启动多个Zookeeper 实例。如:192.168.18.130、192.168.18.13一、192.168.18.132三台机器
分别配置多个机器上的Kafka服务 设置不一样的broke id,zookeeper.connect设置以下:
zookeeper.connect=192.168.18.130:2181,192.168.18.131:2181,192.168.18.132:2181