Spark 按key聚合求平均值与占比

1.求key的平均值 k,v结构的数据中,求每一个key对应的平均值,在spark中怎么应该怎么求? 例若有以下的数据:python ("a",10) ("b",4) ("a",10) ("b",20) 想求a,b对应的平均值。 直接上代码web sc.parallelize(List(("a",10),("b",4),("a",10),("b",20))).mapValues(x => (x,
相关文章
相关标签/搜索