pyspark RDD 自定义排序(python)

问题: 现有数据 data = ((‘crystal’,90,22),(‘crystal1’,100,28),(‘crystal3’,100,22)) 如今对data 进行排序 排序规则: 1 按元组中的第二个字段排序 2 第二个字段相等的话,按第三个字段排序python 实现思路: 定义一个列表元素类,每个元素均可以实例化成这个类的对象 定义类的比较规则,比较规则即为需求规则, 而后将RDD远程
相关文章
相关标签/搜索