【大数据日记】【转】The world beyond batch: Streaming 101（第二节）

时间 2021-01-12

标签大数据繁體版

原文原文链接

数据处理模式现在我们可以开始讲一些有界和无界数据处理的重要模式了：批量和流式，这里我把微批归类为流式，因为二者的区别不是很重要。有界数据处理有界数据很简单，大家都很熟悉。在下图中，左边是一个数据集，使用一些数据处理引擎对它进行处理（典型的是批量处理，尽管一个设计良好的流式引擎也可以胜任），例如 MapReduce，右边则是处理后的结果：图2：使用一个典型的批量引擎处理有界数据。左边的有限的

>>阅读原文<<