基于spark的流式数据处理—流计算

概念 流计算:实时获取来自不同数据源的海量数据,经过实时分析处理,获得有价值的信息。 流计算秉承一个基本理念,即数据的价值随着时间的流逝而降低,如用户点击流。因此,当事件出现时就应该立即进行处理,而不是缓存起来进行批量处理。为了及时处理流数据,就需要一个低延迟、可扩展、高可靠的处理引擎。 对于一个流计算系统来说,它应达到如下需求: 高性能:处理大数据的基本要求,如每秒处理几十万条数据; 海量式:支
相关文章
相关标签/搜索