发布订阅的对象是主题(Topic)架构
向主题发布消息的客户端应用程序称为生产者(Producer),生产者能够持续不断地向多个主题发送消息性能
订阅这些主题消息的客户端应用程序称为消费者(Consumer),消费者可以同时订阅多个主题的消息学习
生产者和消费者统称为客户端线程
Kafka的服务端由被称为Broker的服务进程构成,一个Kafka集群由多个Broker组成日志
Broker负责接收和处理客户端发送过来的请求,以及对消息进行持久化对象
多个Broker进程可以运行在同一台机器上,但更常见的作法是将不一样的Broker分散运行在不一样的机器上blog
实现高可用的另外一个手段是备份机制(Replication)进程
备份:把相同的数据拷贝到多台机器上,这些相同的数据拷贝在Kafka中被称为副本(Replica)同步
副本的数量是能够配置的,Kafka定义了两类副本:领导者副本(Leader Replica)和追随者副本(Follower Replica)it
Kafka中的分区机制是将每一个主题划分红多个分区(Partition),每一个分区是一组有序的消息日志
生产者生产的每条消息只会被发送到一个分区中,Kafka的分区编号是从0开始的
副本是在分区这个层级定义的,每一个分区下能够配置N个副本,只能有1个领导者副本和N-1个追随者副本
生产者向分区(分区的领导者副本)写入消息,每条消息在分区中的位置由位移(Offset)来表征,而分区位移老是从0开始
三层消息架构
点对点模型(Peer to Peer,P2P):同一条消息只能被下游的一个消费者消费,其余消费者不能染指
Kafka经过消费者组(Consumer Group)来实现P2P模型
引入消费者组的目的:提升消费者端的吞吐量(TPS)
消费者实例(Consumer Instance):便可以是运行消费者应用的进程,也能够是一个线程
重平衡(Rebalance)
消息(Record):消息是Kafka处理的主要对象
主题(Topic):主题是承载消息的逻辑容器,实际使用中多用来区分具体的业务
分区(Partition):一个有序不变的消息序列,每一个主题下有多个分区
消息位移(Offset):也叫分区位移,表示一条消息在分区中的位置,是一个单调递增且不变的值
副本(Replica)
生产者(Producer):向主题发布消息的应用程序
消费者(Consumer):从主题订阅消息的应用程序
消费者位移(Consumer Offset):表征消费者的消费进度,每一个消费者都有本身的消费者位移
消费者组(Consumer Group):多个消费者实例共同组成一个组,同时消费多个分区以实现高吞吐
重平衡(Rebalance)