实时流处理学习(一)

MapReduce 适合离线批处理 实时流处理产生背景: 时效性高 数据量大 实时计算与流计算对比: 实时计算:延迟性低 流式计算:不断产生的数据流上计算 ==综合==>实时流式计算   离线计算与实时计算的对比: 1) 数据来源 离线:HDFS 历史数据,数据量比较大 实时:消息队列(Kafka),实时新增/修改记录过来的某一笔数据 2) 处理过程 离线:MapReduce 实时:Spark(D
相关文章
相关标签/搜索