【大数据日记】【转】The world beyond batch: Streaming 101(第二节)

数据处理模式 现在我们可以开始讲一些有界和无界数据处理的重要模式了:批量和流式,这里我把微批归类为流式,因为二者的区别不是很重要。 有界数据 处理有界数据很简单,大家都很熟悉。在下图中,左边是一个数据集,使用一些数据处理引擎对它进行处理(典型的是批量处理,尽管一个设计良好的流式引擎也可以胜任),例如 MapReduce,右边则是处理后的结果: 图2:使用一个典型的批量引擎处理有界数据。左边的有限的
相关文章
相关标签/搜索