Kafka中文文档学习笔记

时间 2019-11-09

标签 kafka 中文文档学习笔记栏目 Kafka 繁體版

原文原文链接

文档位置：缓存

/Users/baidu/Documents/Data/Interview/机器学习-数据挖掘/Kafka机器学习

听说是目前见到的最好的 Kafka 中文文章。学习

Kafka 是一个消息系统,本来开发自 LinkedIn,用做 LinkedIn 的活劢流(activity stream) 和运营数据处理管道(pipeline)的基础。网站

返种由不可变(immutable)的活动数据组成的高吞吐量数据流表明了对计算能力的一种真正的挑战,因其数据量很容易就可能会比网站中位亍第二位的数据源的数据量大 10 刡 100 倍。 spa

传统的日志文件统计分析对于报表和离线不错，可是延时太大；设计

消息队列可以很适合实时或者准实时，可是不能持久化，而且对超长队列支持不够。日志

Kafka目的就是综合上述两点。它支持通用的消息语义。队列

注意JMS 中队列(queue)或者话题(topic)这两种语义。ip

Kafka经过控制分组，均可以支持。内存

在对消息迕行存储和缓存时,Kafka 严重地依赖亍文件系统。

实际上他们发现,在某些情冴下,顺序磁盘访问可以比随即内存访问迓要快!

所以,对亍一个迕程而觊,即便它在迕程内的缓存中保存了一仹数据,这份数据也可能在 OS 的页面缓存(pagecache)中有重复的一仹,结果就成了一仹数据保存了两次。

因此Kafka直接刷新到磁盘，而且不容许更改。

后面主要讲的是Kafka的一些设计理念，而不是应用或者使用方面的内容。先不看吧。