大数据分布式数据处理系统,主要分为哪两种?

大数据的处理模式分为流处理和批处理两种。流处理是直接处理,批处理采用先存储再处理。   流处理将数据视为流,源源不断的数据形成数据流。当新的数据到来即立即处理并返回所需的结果。大数据的实时处理是一个极具挑战性的工作,数据具有大规模、持续到达的特点。因此,如果要求实时的处理大数据,必然要求采用分布式的方式,在这种情况下,除了应该考虑分布式系统的一致性问题,还将涉及到分布式系统网络时延的影响,这都增加
相关文章
相关标签/搜索