大数据分布式数据处理系统,主要分为哪两种?

大数据的处理模式分为流处理和批处理两种。流处理是直接处理,批处理采用先存储再处理。   流处理将数据视为流,源源不断的数据造成数据流。当新的数据到来即当即处理并返回所需的结果。大数据的实时处理是一个极具挑战性的工做,数据具备大规模、持续到达的特色。所以,若是要求实时的处理大数据,必然要求采用分布式的方式,在这种状况下,除了应该考虑分布式系统的一致性问题,还将涉及到分布式系统网络时延的影响,这都增长
相关文章
相关标签/搜索