SparkSQL DF.agg 执行过程解析

在上一篇文章前, 我一直没看懂为何下面的代码就能获得max或者avg或者min的值: malePPL.agg(Map("height" -> "max", "sex" -> "count")).show 数据是 身高 性别 这样的一个组合大概有几百万个值 刚开始是使用reducebykey去作计算, 后来发现网上有agg里面直接进行排序获取值的作法, 特意看了一下为何传进去一个Map(column
相关文章
相关标签/搜索