【必读】3分钟带你了解流式数据架构基本概念

1 流 流(streaming)是一种为无界数据集设计的数据处理引擎,这种引擎具备以下特征: 具备强一致性,即支持exactly-once语义。 提供丰富的时间工具,如事件时间、处理时间、窗口等。 保证系统具有可弹性、伸缩性。 同时保证高吞吐、低延迟与容错。 支持高级语义,如流式关系型API(SQL)、复杂事件处理(CEP) 2 时间 在无界数据处理中,主要有两类时间概念: 事件时间(Event
相关文章
相关标签/搜索