第11课:完全解析wordcount运行原理

本期内容: 1. 从数据流动视角解密WordCount,即用Spark做单词计数统计,数据究竟是怎么流动的。 2. 从RDD依赖关系的视角解密WordCount。Spark中的一切操做皆RDD,后面的RDD对前面的RDD有依赖关系。 3. DAG与Lineage的思考。依赖关系会造成DAG。 1. 从数据流动视角解密WordCount (1)在IntelliJ IDEA中编写下面代码: packa
相关文章
相关标签/搜索