kafka(三):win10搭建kafka环境
说明
- 本博客每周五更新一次。
- 本片博文主要介绍win10安装kafka过程,官方脚本说明和数据生成、接受测试,实践性强。
运行环境
- jdk 1.8
- kafka 2.4.1
- scala 2.12
搭建步骤
下载安装包
- 下载kafka 地址 官方版内置zk
- kafka2.4.1 scala 2.12下载地址
配置
安装配置
建立文件夹bootstrap
- 在kafka根目录下新建data(存放快照)和kafka-logs(日志的存储文件夹)

修改配置:进入到config目录,windows
- 修改service.properties里面log.dirs路径未log.dirs=D:\test\kafka_2.12-2.4.1\kafka-logs(注意:文件夹分割符必定要是”\”)
- 修改zookeeper.properties里面dataDir路径为dataDir=D:\test\kafka_2.12-2.4.1\data
server.properties说明
- log.dirs:指定Broker须要使用的若干个文件目录路径,没有默认值,必须指定。在生产环境中必定要为log.dirs配置多个路径,若是条件容许,须要保证目录被挂载到不一样的物理磁盘上。优点在于,提高读写性能,多块物理磁盘同时读写数据具备更高的吞吐量;可以实现故障转移(Failover),Kafka 1.1版本引入Failover功能,坏掉磁盘上的数据会自动地转移到其它正常的磁盘上,并且Broker还能正常工做,基于Failover机制,Kafka能够舍弃RAID方案。
- zookeeper.connect:CS格式参数,能够指定值为zk1:2181,zk2:2181,zk3:2181,不一样Kafka集群能够指定:zk1:2181,zk2:2181,zk3:2181/kafka1,chroot只须要写一次。
- listeners:设置内网访问Kafka服务的监听器。
- advertised.listeners:设置外网访问Kafka服务的监听器。
- auto.create.topics.enable:是否容许自动建立Topic。
- unclean.leader.election.enable:是否容许Unclean Leader 选举。
- auto.leader.rebalance.enable:是否容许按期进行Leader选举,生产环境中建议设置成false。
- log.retention.{hours|minutes|ms}:控制一条消息数据被保存多长时间。优先级:ms设置最高、minutes次之、hours最低。
- log.retention.bytes:指定Broker为消息保存的总磁盘容量大小。message.max.bytes:控制Broker可以接收的最大消息大小。
启动
启动zookeeper
- kafka根目录执行.\bin\windows\zookeeper-server-start.bat .\config\zookeeper.properties ,启动后,不要关闭页面。


启动kafka
- kafka根目录执行.\bin\windows\kafka-server-start.bat .\config\server.properties,启动后不要关闭。


kafka脚本
脚本说明
- connect-standalone.sh用于启动单节点的Standalone模式的Kafka Connect组件。
- connect-distributed.sh用于启动多节点的Distributed模式的Kafka Connect组件。
- kafka-acls.sh脚本用于设置Kafka权限,好比设置哪些用户能够访问Kafka的哪些TOPIC的权限。
- kafka-delegation-tokens.sh用于管理Delegation Token。基于Delegation Token的认证是一种轻量级的认证机制,是对SASL认证机制的补充。
- kafka-topics.sh用于管理全部TOPIC。
- kafka-console-producer.sh用于生产消息。
- kafka-console-consumer.sh用于消费消息。
- kafka-producer-perf-test.sh用于生产者性能测试。
- kafka-consumer-perf-test.sh用于消费者性能测试。
- kafka-delete-records.sh用于删除Kafka的分区消息,因为Kafka有本身的自动消息删除策略,使用率不高。
- kafka-dump-log.sh用于查看Kafka消息文件的内容,包括消息的各类元数据信息、消息体数据。
- kafka-log-dirs.sh用于查询各个Broker上的各个日志路径的磁盘占用状况。
- kafka-mirror-maker.sh用于在Kafka集群间实现数据镜像。
- kafka-preferred-replica-election.sh用于执行Preferred Leader选举,能够为指定的主题执行更换Leader的操做。
- kafka-reassign-partitions.sh用于执行分区副本迁移以及副本文件路径迁移。
- kafka-run-class.sh用于执行任何带main方法的Kafka类。
- kafka-server-start.sh用于启动Broker进程。
- kafka-server-stop.sh用于中止Broker进程。
- kafka-streams-application-reset.sh用于给Kafka Streams应用程序重设位移,以便从新消费数据。
- kafka-verifiable-producer.sh用于测试验证生产者的功能。
- kafka-verifiable-consumer.sh用于测试验证消费者功能。
- trogdor.sh是Kafka的测试框架,用于执行各类基准测试和负载测试。
- kafka-broker-api-versions.sh脚本主要用于验证不一样Kafka版本之间服务器和客户端的适配性。
脚本使用
- 查看全部topic:.\bin\windows\kafka-topics.bat --zookeeper zookeeper_host:port --list
- 建立名为test的topic设置3个副本1个分区:.\bin\windows\kafka-topics.bat --zookeeper zookeeper_host:port --create --replication-factor 3 --partitions 1 --topic test
- 删除名为test的topic:.\bin\windows\kafka-topics.bat --zookeeper zookeeper_host:port --delete --topic test
- 查看topic信息:.\bin\windows\kafka-topics.bat --zookeeper zookeeper_host:port --describe --topic test
- 修改topic分区数:kafka-topics.sh --bootstrap-server zookeeper_host:port --alter --topic test --partitions 新分区数
- topic限速
- --entity-name参数用于指定Broker ID。若是TOPIC的副本分别在多个Broker上,须要依次为相应Broker执行。
- 当某个topic副本在执行副本同步机制时,为了避免消耗过多的带宽,能够设置Leader副本和Follower副本使用的带宽,不得占用超过100MBps(104857600)。先设置Broker端参数leader.replication.throttled.rate 和 follower.replication.throttled.rate,命令以下:kafka-configs.sh --zookeeper zookeeper_host:port --alter --add-config 'leader.replication.throttled.rate=104857600,follower.replication.throttled.rate=104857600' --entity-type brokers --entity-name 0
- 为TOPIC的全部副本都设置限速,能够统一使用通配符*来表示,命令以下:kafka-configs.sh --zookeeper zookeeper_host:port --alter --add-config 'leader.replication.throttled.replicas=*,follower.replication.throttled.replicas=*' --entity-type topics --entity-name test
kafka功能测试
端口说明
- 2181 zk通讯端口,操做topic使用
- 9092 数据端口,数据生产者和消费者使用
建立topic主题
- 建立名字为test的topic主题,kafka根目录执行.\bin\windows\kafka-topics.bat --zookeeper localhost:2181 --create --replication-factor 1 --partitions 1 --topic test,完成后保留窗口。

建立生产者
- 建立窗口执行.\bin\windows\kafka-console-producer.bat --broker-list localhost:9092 --topic test,输入消息,每次回车都是一条消息。

建立消费者
- kafka根目录下执行.\bin\windows\kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic test --from-beginning,窗口将输出刚在生产者输入的消息。

- 可在生产者窗口输入内容,消费者窗口将持续输出结果。
kafka版本兼容性
- 在Kafka 0.10.2.0版本前,Kafka是单向兼容的,高版本的Broker可以处理低版本Client发送的请求,低版本的Broker不能处理高版本的Client请求。Kafka 0.10.2.0版本开始,Kafka正式支持双向兼容,低版本的Broker也能处理高版本Client的请求。
总结
- 学无止境,同一个东西,每次学习都能有新收获,技术不是会用就行,要懂得原理,探究是什么,为何,如何更好,只有不断精进才能收获跟多的知识,学习不是为了某种结果,而是保持某种状态。
欢迎关注本站公众号,获取更多信息