SparkStreaming入门(DStream ,Receiver,input DStream)

流计算简介 数据整体上分为静态数据和流数据。对静态数据和流数据的处理,对应着两种大相径庭的计算模式:批量计算和实时计算。批量计算以“静态数据”为对象,能够在很充裕的时间内对海量数据进行批处理,计算获得有价值的信息。Hadoop就是很典型的批处理模型,有HDFS和HBase存放大量的静态数据,由MapReduce负责对海量数据执行批量计算。流数据必须采用实时计算,实时计算最重要的一个需求是可以实时获
相关文章
相关标签/搜索