spark中mapPartitions双重循环或两次遍历(duplicate)

在spark当中一般须要对mapPartitions内部进行计算,这样能够在不进行网络传输的状况下,对数据进行局部计算网络 而mapPartitions中的迭代器为Iteratorcurl scala中的Iterator只能进行一次迭代,使用事后就消失了,因此在mapPartitions中既不能两次遍历url 如:一次mapPartitions求最大最小值spa val it = Iterator
相关文章
相关标签/搜索