Kafka
中的ISR
、AR
表明什么?ISR
:与leader
保持同步的follower
集合ide
AR
:分区的全部副本性能
Kafka
中的HW
、LEO
分别表明什么?LEO
:每一个副本的最后条消息的offset
线程
HW
:一个分区中全部副本最小的offset
设计
offset
中是怎么体现消息顺序性的?每一个分区内,每条消息都有一个offset
,故只能保证分区内有序3d
offset
中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?拦截器 -> 序列化器 -> 分区器日志
Kafka
生产者客户端的总体结构是什么样子的?使用了几个线程来处理?分别是什么?Topic
的分区,那么就会有消费者消费不到数据这句话是否正确?正确code
offset
仍是offset+1
?offset+1
blog
先提交offset
,后消费,有可能形成数据的重复kafka
kafka-topics.sh
建立了一个Topic
以后,Kafka背后会执行什么逻辑?会在ZK
中的/brokers/topics
节点下建立一个新的Topic
节点同步
触发Controller
的监听程序
Kafka Controller
负责Topic
的建立工做,并更新metadata cache
Topic
的分区数可不能够增长?若是能够怎么增长?若是不能够,那又是为何?能够增长
bin/kafka-topics.sh --zookeeper localhost:2181/kafka --alter --topic topic-config --partitions 3
Topic
的分区数可不能够减小?若是能够怎么减小?若是不能够,那又是为何?不能够减小,被删除的分区数据难以处理
Kafka
有内部的Topic
吗?若是有是什么?有什么所用?__consumer_offsets
,保存消费者offset
Kafka
分区分配的概念?一个Topic
多个分区,一个消费者组多个消费者,故须要将分区分配个消费者(roundrobin
、range
)
Kafka
的日志目录结构?每一个分区对应一个文件夹,文件夹的命名为topic-0
,topic-1
,内部为.log
和.index
文件
offset
,Kafka Controller
怎么查找到对应的消息?Kafka Controller
的做用?负责管理集群Broker
的上下线,全部Topic
的分区副本分配和leader
选举等工做
Kafka
中有那些地方须要选举?这些地方的选举策略又有哪些?partition leader(ISR)
`controller
(先到先得)
不能及时与leader
同步,暂时踢出ISR
,等其追上leader
以后再从新加入
Kafka
的那些设计让它有如此高的性能?分区
顺序写磁盘
零拷贝