如何区分批处理和流处理?

数据能够抽象成两种类型:无边界数据 和 有边界数据 无边界数据,是一种不断增加能够说是无限的数据集,这类数据没法判断什么时候终止,如:电商交易数据 有边界数据,是一种有限的数据集,如:常见的保存好的数据web 从无边界数据按时间窗口提取部分数据,就是有边界数据,因此,有边界数据能够看作是无边界的子集架构 在处理大数据时,一般还关心时域问题:事件时间 和 处理时间 事件时间,数据实际产生的时间 处理
相关文章
相关标签/搜索