(重要)spark RDD核心知识

spark 核心是RDD:弹性分布式数据集 基本RDD 转换运算 创建intRDD 创建stringRDD map 运算 filter 数字运算 filter 字符串运算 distinct 运算 去除重复元素 randomSplit 运算 随机按照比例分为多个RDD 如下比例:0.4:0.6 groupBy 运算 根据匿名函数规则,分为多个Array 多个RDD 转换运算 创建3个范例RDD un
相关文章
相关标签/搜索