技术专家:为何咱们最终选择Apache Pulsar替代Kafka?


 

导读:在传统消息系统中,存在一些问题。一方面,消息的存储和服务通常是紧耦合的,节点的扩容和运维不便,特别是在须要多备份来保证高可用性的场景。另外一方面,消息的消费模式被固定,在企业内部须要维护多套系统来保证不一样的消息消费场景。另外消息系统中,多租户,多机房互备等企业级的特性和功能也不太丰富。apache

Apache Pulsar采用了分层的架构,解决了存储计算的耦合,同时提供了很好的扩展性和可维护性。Pulsar也经过订阅层的抽象,提供了统一的消息消费模型。特别是在Pulsar的设计之初,就注重对多租户,多机房互备等方面的需求,提供了众多完备的企业级的特性。架构

Apache Pulsar从2015年初在Yahoo全球近十个机房内部大规模部署,稳定服务了Yahoo内部邮箱,金融,Flickr,广告,NoSQL等众多的应用场景,一共建立了80多个租户,230多万个topic。 智联招聘在18年用Pulsar替换了线上原有的RabbitMQ,做为内部的消息总线,服务内部的20多个应用,天天会产生6亿多条消息和3TB的数据。在减轻硬件,运维和部署成本的同时,为系统提供了更好的服务质量和扩展性。负载均衡

Apache Pulsar,是一个使用Apache Bookkeeper提供持久化的pub/sub消息平台,它能够提供以下特性:运维

持久化:采用 BookKeeper 做为存储层,灵活性强。分布式

Ordering:每一个消息有全局惟一的 ID,消息重发简单。函数

Delivery Guarantees:At least once, at most once 和 effectively once。翻译

高吞吐:单个分区高达 1.8 M 消息/秒。设计

低延迟:99% 的生产延迟小于 5 ms。代理

统一消息模型:同时支持两种消费模型,流和队列。日志

多租户:单个群集可支持多租户和用例。

跨地域复制:原生可用。

高可用、高扩展性、易运维

架构概述


 

Pulsar使用分层结构,将存储机制与broker隔离开来。此体系结构为Pulsar提供如下好处:

一、独立扩展broker,负责处理Producer发来的消息并分发给消费者。经过一个全局的ZK集群来处理多种协做式任务,例如说基于地理位置的复制。并将消息存储到BookKeeper中,同时单个集群内也须要有一套ZK集群,来存储一些元数据。

二、独立扩展存储(Bookies)

三、更容易容器化Zookeeper, Broker and Bookies

四、ZooKeeper提供集群的配置和状态存储


 

亮点以下:

一、负载均衡器:Pulsar内置负载均衡器,可在内部将负载分配给全部broker

二、服务发现:Pulsar具备内置的服务发现功能,能够识别在何处以及如何链接到broker。

三、全局复制器:能够在为同一个命名空间配置的N个borker之间复制数据。

四、全局ZK:全局ZK用于实现跨地域复制

跨地域复制

跨地域复制是Pulsar提供的解决方案。全局集群能够在名称空间级别进行配置,以便在任意数量的集群(n-wayMesh解决方案)中进行复制。从下面的示例中,数据中心C没有消费者,但数据中心A或B中仍会根据订阅模型消费消息。


 

多租户

多租户特性经过对数据存储的隔离,帮助为企业创建Pulsar集群。这一内置功能将大大下降组织的基础设施建设和运营成本。

零Rebalancing时间

Pulsar的分层架构和代理的无状态性质有助于实现零Rebalancing时间。若是一个新的broker被添加到集群中,它将当即可用;无需在集群中rebalancing数据。

从Bookies的角度来看:当一个新的Bookie添加到集群中时,因为其底层的分布式日志架构(读/写隔离),该节点马上能够写入数据。基于段复制配置的数据rebalance在后台进行,不会对集群产生任何影响。

统一的队列和流模型

Pulsar使用同一个模型支持流和队列语义。这个特性能够经过订阅模型实现。消费者使用订阅模型中的任何一个订阅主题:

一、Exclusive - 支持流语义

二、Failover - 支持流语义

三、Shared - 支持队列语义


 

函数

函数是可以在Pulsar内部或外部存在的本地监听器。从用途自己来看,函数可用于基于内容的路由,这将帮助企业应用程序路由预期的消息。

Proxy

当broker部署在云或Kubernetes中时,须要使用proxy将broker暴露于外部世界。Proxy自己能够提供身份验证和受权。Proxy内置将受权令牌传递给broker以进行命名空间权限验证的功能。

结论

Apache Pulsar使用基于分层体系结构的pub/sub模型,它具备跨地域复制、多租户、零Rebalancing时间等功能。

原文地址:https://medium.com/@pckeyan/apache-pulsar-gentle-introduction-465ca6da0e18

做者:Karthikeyan Palanivelu,由方圆翻译


 

不知你们读完此文,是否被Pulsar所吸引?它确实弥补了一些竞品的短板,例如地域复制、多用户、扩展性、读写隔离等等。若是你们想了解更多关于Apache Pulsar的知识,那么就参加本月21-23日,由msup和高可用共同举办的GIAC全球互联网架构大会吧!

Apache Pulsar和Apache BookKeeper的PMC成员和Committer翟佳将出席GIAC深圳站,做为中间件专场讲师分享《下一代分布式消息系统Apache Pulsar》的话题。参加2019年GIAC深圳站,能够了解业界动态,和业界专家近距离接触。


 

本届大会,组委会还特别邀请到了105位来自Google、微软、Oracle、eBay、百度、阿里、腾讯、商汤、图森、字节跳动、新浪、美团点评等一线互联网大厂嘉宾做为讲师出席,分享他们的实践经验、遇到的问题及解决方案。如今席位所剩很少,快来识别图中二维码报名吧!

相关文章
相关标签/搜索