带有状态的SparkStreaming单词计数程序

在另一篇《SparkStreaming的入门级程序:WordCount》文章中,只是统计每个批次的数据,是不带状态的单词计数程序,使用的是reduceByKey()方法,它只能统计当前批次的单词个数,而不会累加上一个批次的单词个数;而带有状态的单词计数程序会累加上个批次的单词个数,它使用的则是updateStateByKey()方法。apache 在pom.xml文件中引入一下依赖:socket
相关文章
相关标签/搜索