Spark之Streaming实时监听Hdfs文件目录

应用场景:咱们使用Streaming实时监听指定的Hdfs目录,当该目录有新的文件增长会读取它,并完成单词计数的操做。 这里和上一篇的差异就是:上一篇用的是socketTextStream而这里用的是:textFileStream。 其余没有不一样。 代码展现:java import java.util.Arrays; import org.apache.spark.SparkConf; impo
相关文章
相关标签/搜索