分布式消息系统研究报告之Kafka

时间 2019-12-21

标签分布式消息系统研究报告 kafka 栏目系统架构繁體版

原文原文链接

最近在看消息系统方面的东西。做为一个实践主义者，在看消息系统的各类实现时，不妨先粗略思考一下如何设计一个消息系统。我总觉出来有这么几个点(比较粗陋，之后继续补充)：算法

队列的存储和管理缓存

用什么方式存储消息决定了这个消息系统的最终表现。网络
push仍是pullui

producer没啥好说的，确定是push，这里主要说consumer，pull的好处是能够根据consumer消费能力来处理消息，而push的好处则是实时性atom
服务横向扩展.net

是否存在单点？如何进行横向扩展的？failover如何作？翻译
保证一次消费设计

消息不丢失；不会重复消费。日志
topic模式code

是否支持单条message多个comsumer同时消费？用什么机制保证其工做？
监控

有没有监控手段？

好了，如今先来看Kafka。Kafka是LinkedIn的一个消息系统。主要用来处理日志并进行实时分析。 Kafka有一篇翻译好的文章http://www.oschina.net/translate/kafka-design。

Kafka要解决的是大吞吐量下的消息队列问题。

一些与结构无关的notes:

实际中这么作意味着，数据被传输到OS内核的页面缓存中了，OS随后会将这些数据刷新到磁盘的。这段话的思路能够考虑一下。