论SparkStreaming的数据可靠性和一致性

转自: http://www.csdn.net/article/2015-06-21/2825011   摘要:眼下大数据领域最热门的词汇之一便是流计算了,而其中最耀眼的无疑是来自Spark社区的SparkStreaming项目。 对于流计算而言,最核心的特点毫无疑问就是它对低时的需求,但这也带来了相关的数据可靠性问题。 2Driver HA 由于流计算系统是长期运行、且不断有数据流入,因此其Sp
相关文章
相关标签/搜索