SparkCore | Rdd依赖关系| 数据读取保存| 广播变量和累加器

阅读目录 Spark中三大数据结构:RDD;  广播变量: 分布式只读共享变量; 累加器:分布式只写共享变量; 线程和进程之间  1.RDD中的函数传递 自己定义一些RDD的操作,那么此时需要主要的是,初始化工作是在Driver端进行的,而实际运行程序是在Executor端进行的,这就涉及到了跨进程通信,是需要序列化的。 传递一个方法 class Search(query: String){ //
相关文章
相关标签/搜索