Kafka随笔

时间 2019-12-08

标签 kafka 随笔栏目 Kafka 繁體版

原文原文链接

1.选举Leader 性能

　　Leader 是 Partition 级别的，当一个 Broker 挂掉后，全部 Leader 在该 Broker 上的 Partition 都会被从新选举，选出一个新 Leader。spa

　　Kafka 先使用 ZooKeeper 在 Broker 中选出一个 Controller，用于上述 Partition分配和 Leader 选举。操作系统

　　Controller 会在 ZooKeeper 的 /brokers/ids 节点上注册 Watch 监听，一旦有 Broker 宕机，Controller就收到通知。 blog

　　Partition 分配： 排序

将全部 Broker（假设共 n 个 Broker）和待分配的 Partition 排序。
将第 i 个 Partition 分配到第（i mod n）个 Broker 上（这个就是 Leader）。
将第 i 个 Partition 的第 j 个 Replica 分配到第（(i + j) mode n）个 Broker 上。

　　Leader 选举：索引

　　　　Controller 从 ZooKeeper 的 /brokers / topics / [topic名称] / partitions / [partition名称] / state 中，读取对应 Partition 的 ISR（in-sync replica 已同步的副本）列表，选一个出来作 Leader。同步

　　　　ISR 列表中的机器是会变化的，根据配置 replica.lag.time.max.ms，多久没同步，就会从 ISR 列表中去除。 it

　　　　0.10版本以前，还有个参数是根据落后多少条消息就踢出 ISR，在 0.10 版本后就去掉了，由于这个值很难取，在高峰的时候很容易出现节点不断的进出 ISR 列表的状况。io

　　　　选出 Leader 后，更新 ZooKeeper，而后Controller发送 LeaderAndISRRequest 给受影响的 Broker，通知全部相关Broker：新leader已产生。集群

　　　　选举完成以后，全部对某个 Partition 的请求，实际操做的都是 Leader，而后其余 Follower 再 Pull 消息同步。

2.Partition的分发策略：

Partition 在写入的时候能够指定须要写入的 Partition，若是有指定，则写入对应的 Partition。
若是没有指定 Partition，可是设置了数据的 Key，则会根据 Key 的值 Hash 出一个 Partition。
若是既没指定 Partition，又没有设置 Key，则会轮询各个Partition。

3.Partition文件：

　　Partition 在操做系统中就是一个个的文件夹，每一个 Partition 的文件夹下面会有多组 Segment 文件。

　　每组 Segment 文件又包含 .index 文件、.log 文件、.timeindex 文件（早期版本中没有）三个文件。

　　Log 文件就是实际存储 Message 的地方，而 Index 和 Timeindex 文件为索引文件，用于检索消息。

　　文件的命名是以该 Segment 最小 Offset 来命名的，以下图中间那个segment的命名是 368796.index，存储了Offset 为 368796~1105813 的消息。

　　创建在 Offset 为有序的基础上，Kafka利用 Segment分段文件记录+Segment文件内索引+有序Offset+稀疏索引+二分查找+顺序查找等多种手段来高效的查找数据。

　　在0.10版本前，消费者将消费到的 Offset 维护在 Zookeeper 中，Consumer 每间隔一段时间上报一次，容易致使重复消费，且性能很差；

　　0.10版本后，消费者消费到的 Offset 已经直接维护在 Kafka 集群的 __consumer_offsets 这个Topic 中。