Java对象排序、中文排序、SortedSet排序使用和源码讲解

时间 2019-11-09

标签 java 对象排序中文 sortedset 使用源码讲解栏目 Java 繁體版

原文原文链接

原文出处： xieyu_zyjava

在C、C++中有不少排序算法，可是一般排序算法不得不让程序员在写代码的过程当中陷入对底层不少指针和位置的理解，java不但愿这样，因此排序大多能够由java帮你作掉，例如，你要对一个数组排序，就经过：Collections.sort(list)那么这个list就被排序了，排序最终调用的是Arrays.sort方法来完成的，因此数组天然是用Arrays.sort了，而SortedSet里面内部也有排序功能也是相似的方式的来实现的，只是内部调用了相关的方法来完成而已；SortedSet只是一个接口，实现类有不少，本文以TreeSet实现类做为例子。程序员

而排序必然就存在对比大小，那么传递的信息，java是经过什么来对比大小的呢？compareTo这个来对比的，而内部对比过程当中，须要将数据转换为Comparable来对比，因此你的对象就须要implementsComparable，并实现内部的方法compareTo，只要你的compareTo实现是你所想要的，那么排序必然是正确的，那么是否还有其余的方法，有的，排序的时候，容许你传入一个对比类，由于这样也能够减小一些空指针出现的可能性，传入的类须要实现：Comparator接口，实现其方法：compare类，虽然接口中还定义了equals方法基本不用管它，由于Object就已经实现了，而且内部排序中并无用到equals方法来作排序。算法

下面开始使用实例分别来作中文排序、对象排序，并分别使用对象实现Comparable接口，以及单独定义排序对象实现Comparator接口来完成排序：编程

实例1（经过实现Comparator接口完成中文排序）：数组

import java.text.Collator;

import java.util.Arrays;

import java.util.Collections;

import java.util.Comparator;

import java.util.List;

public class ChineseSortCompare {

@SuppressWarnings ( "rawtypes" )

private final static Comparator CHINA_COMPARE = Collator.getInstance(java.util.Locale.CHINA);

public static void main(String []args) {

sortArray();

sortList();

System.out.println( "李四" .compareTo( "张三" )); //前者大于后者，则为正数，不然为负数，相等为0

}

@SuppressWarnings ( "unchecked" )

private static void sortList() {

List<String>list = Arrays.asList( "张三" , "李四" , "王五" );

Collections.sort(list , CHINA_COMPARE);

for (String str : list) {

System.out.println(str);

}

@SuppressWarnings ( "unchecked" )

private static void sortArray() {

String[] arr = { "张三" , "李四" , "王五" };

Arrays.sort(arr, CHINA_COMPARE);

for (String str : arr) {

System.out.println(str);

}

能够看到输出的结果都是同样的，固然String自己有compare方法，并且其自己也是实现了Comparable接口的，因此你若是不放入CHINA_COMPARE来进行处理的话，将会默认按照String本身的compareTo来作排序，排序的结果天然不是你想要的，固然英文应该是你想要的。架构

实例2（经过外部定义Comparator来完成对象排序）：ide

这里首先要构造一个对象的类，为了简单，咱们就用两属性，定义一个UserDO这样一个类，描述以下：测试

public class UserDO {

protected String name;

protected String email;

public UserDO() {}

public UserDO(String name , String email) {

this .name = name;

this .email = email;

}

public String getName() {

return name;

}

public void setName(String name) {

this .name = name;

}

public String getEmail() {

return email;

}

public void setEmail(String email) {

this .email = email;

}

定义了两个属性为name和email，此时咱们想要按照name了排序，那么咱们定义排序的类以下：网站

import java.text.Collator;

import java.util.Comparator;

public class UserDOComparator implements Comparator<UserDO> {

Collator cmp = Collator.getInstance(java.util.Locale.CHINA);

@Override

public int compare(UserDO userDO1, UserDO userDO2) {

return cmp.compare(userDO1.getName(), userDO2.getName());

}

此时能够看出咱们实现了compare方法，是使用拼音排序的，而后咱们来模拟一些数据验证结果：this

import java.util.Arrays;

import java.util.Collections;

import java.util.List;

import java.util.SortedSet;

import java.util.TreeSet;

public class SortUserListTest {

private final static UserDOComparator USER_COMPARATOR = new UserDOComparator();

public static void main(String []args) {

sortUserDOArray();

sortUserDOList();

sortUserBySortedSet();

}

private static void sortUserBySortedSet() {

SortedSet<UserDO>userSet = new TreeSet<UserDO>(USER_COMPARATOR);

userSet.add( new UserDO( "张三" , "aaazhangsan@ddd.com" ));

userSet.add( new UserDO( "李四" , "ddlisi@dsfds.com" ));

userSet.add( new UserDO( "王五" , "ddwangwu@fsadfads.com" ));

for (UserDO userDO : userSet) {

System.out.println(userDO.getName());

}

private static void sortUserDOList() {

List<UserDO>list = Arrays.asList(

new UserDO( "张三" , "aaazhangsan@ddd.com" ),

new UserDO( "李四" , "ddlisi@dsfds.com" ),

new UserDO( "王五" , "ddwangwu@fsadfads.com" )

);

Collections.sort(list , USER_COMPARATOR);

for (UserDO userDO : list) {

System.out.println(userDO.getName());

}

private static void sortUserDOArray() {

UserDO []userDOArray = new UserDO[] {

new UserDO( "张三" , "aaazhangsan@ddd.com" ),

new UserDO( "李四" , "ddlisi@dsfds.com" ),

new UserDO( "王五" , "ddwangwu@fsadfads.com" )

};

Arrays.sort(userDOArray , USER_COMPARATOR);

for (UserDO userDO : userDOArray) {

System.out.println(userDO.getName());

}

根据这些输入，你能够看到它的输出和实际想要的按照名称的拼音排序是一致的，那么有人会问，若是我按照两个字段排序，先按照一个字段排序，再按照另外一个字段排序该怎么办，其次若是是倒叙应该是如何操做，其实倒叙来说只须要在compare方法中将原有的输出改为相反数就能够了，compare获得的结果为正数、负数、或0，若为正数，表明第一个数据比第二个大，而负数相反，为0的时候表明相等；而多字段排序也是如此，经过第一层排序后获得结果，看是不是0，若是是0，那么就再按照第二个字段排序便可，不然就直接返回第一层返回的结果，二者混合应用以及多层排序天然就实现了。

实例3（将上面的UserDO使用一个叫UserComparableDO在类的基础上进行排序）

首先将UserDO从新编写为UserComparableDO：

import java.text.Collator;

import java.util.Comparator;

public class UserComparableDO extends UserDO implements Comparable<UserDO> {

public UserComparableDO() {}

public UserComparableDO(String name , String email) {

this .name = name;

this .email = email;

}

@SuppressWarnings ( "rawtypes" )

private final static Comparator CHINA_COMPARE = Collator.getInstance(java.util.Locale.CHINA);

@SuppressWarnings ( "unchecked" )

@Override

public int compareTo(UserDO userDO) {

return CHINA_COMPARE.compare( this .getName(), userDO.getName());

}

固然这段代码里面直接在里面定义一个Comparator是不正确的，通常这个东西是被抽象到系统某些公共的Commons组件里面的，其次，若是本来没有UserDO类，相应的属性写一次便可，我这里本来有UserDO全部直接集成，减小不少代码。

此时就不须要本身再去写一个Comparator了，就能够直接排序了，下面是咱们的测试程序：

import java.util.Arrays;

import java.util.Collections;

import java.util.List;

import java.util.SortedSet;

import java.util.TreeSet;

public class SortUserListByComparable {

public static void main(String []args) {

sortUserBySortedSet();

sortUserDOList();

sortUserDOArray();

}

private static void sortUserBySortedSet() {

SortedSet<UserComparableDO>userSet = new TreeSet<UserComparableDO>();

userSet.add( new UserComparableDO( "张三" , "aaazhangsan@ddd.com" ));

userSet.add( new UserComparableDO( "李四" , "ddlisi@dsfds.com" ));

userSet.add( new UserComparableDO( "王五" , "ddwangwu@fsadfads.com" ));

for (UserComparableDO userDO : userSet) {

System.out.println(userDO.getName());

}

private static void sortUserDOList() {

List<UserComparableDO>list = Arrays.asList(

new UserComparableDO( "张三" , "aaazhangsan@ddd.com" ),

new UserComparableDO( "李四" , "ddlisi@dsfds.com" ),

new UserComparableDO( "王五" , "ddwangwu@fsadfads.com" )

);

Collections.sort(list);

for (UserComparableDO userDO : list) {

System.out.println(userDO.getName());

}

private static void sortUserDOArray() {

UserComparableDO []userDOArray = new UserComparableDO[] {

new UserComparableDO( "张三" , "aaazhangsan@ddd.com" ),

new UserComparableDO( "李四" , "ddlisi@dsfds.com" ),

new UserComparableDO( "王五" , "ddwangwu@fsadfads.com" )

};

Arrays.sort(userDOArray);

for (UserComparableDO userDO : userDOArray) {

System.out.println(userDO.getName());

}

能够看到本次排序中没有再使用自定义的Comparator做为参数，另外TreeSet的入口参数也没有再传入这些参数。

结果知道了，咱们简单看看相关的源码来证明这个说法，咱们首先来看Collections.sort方法：

源码片断1：Collections.sort(List<T> list)

public static <T extends Comparable<? super T>> void sort(List<T> list) {

Object[] a = list.toArray();

Arrays.sort(a);

ListIterator<T> i = list.listIterator();

for ( int j= 0 ; j<a.length; j++) {

i.next();

i.set((T)a[j]);

}

此时直接调用了Arrays.sort(a)来排序后，将数组的数据写回到list，另外根据方法的定义，泛型T要求传入的类必须是Comparable类的子类或实现类，因此要调用Collections.sort(list)这个方法，传入的list中包含的每行数据必须是implements Comparable这个接口的，不然编译时就会报错。

再看重载方法，传入自定义的Comparator

源码片断2：Collections.sort(List<T> list, Comparator<? super T> c)

public static <T> void sort(List<T> list, Comparator<? super T> c) {

Object[] a = list.toArray();

Arrays.sort(a, (Comparator)c);

ListIterator i = list.listIterator();

for ( int j= 0 ; j<a.length; j++) {

i.next();

i.set(a[j]);

}

也是和第一个方法相似，就是调用了Arrays.sort相应的重载方法，看来都是在Arrays里面是实现的，那么就进一步向下看：

源码片断3：Arrays.sort(T[]t):

public static void sort(Object[] a) {

Object[] aux = (Object[])a.clone();

mergeSort(aux, a, 0 , a.length, 0 );

}

看来代码片断交给了mergeSort来处理，而对数组作了一次克隆，做为排序的基础数据，而原来的数组做为排序的目标，mergeSort的代码片断应该是核心部分，咱们先放在这里，先看下sort的另外一个重载方法，另外须要注意，这里并无像Collections.sort(List<T>list)那样在编译时检查类型，也就是在使用这个方法的时候，数组里面的每行并无implements Comparable也会不会出错，只是在运行时会报错而已，在下面的源码中会有说明。

源码片断4 : Arrays.sort(T[]t, Comparator<? super T> c)

public static <T> void sort(T[] a, Comparator<? super T> c)

{

T[] aux = (T[])a.clone();

if (c== null )

mergeSort(aux, a, 0 , a.length, 0 );

else

mergeSort(aux, a, 0 , a.length, 0 , c);

}

看来mergeSort也进行了重载，也就是当传入了自定义的Comparator和不传入自定义的Comparator是调用不一样的方法来实现的，而后咱们来看下两个方法的实现。

源码片断5：mergeSort(Object[]src , Object[]dst , int low , int high , int off)

private static void mergeSort(Object[] src,

Object[] dest,

int low,

int high,

int off) {

int length = high - low;

if (length < INSERTIONSORT_THRESHOLD) {

for ( int i=low; i<high; i++)

for ( int j=i; j>low &&

((Comparable) dest[j- 1 ]).compareTo(dest[j])> 0 ; j--)

swap(dest, j, j- 1 );

return ;

}

int destLow = low;

int destHigh = high;

low += off;

high += off;

int mid = (low + high) >>> 1 ;

mergeSort(dest, src, low, mid, -off);

mergeSort(dest, src, mid, high, -off);

if (((Comparable)src[mid- 1 ]).compareTo(src[mid]) <= 0 ) {

System.arraycopy(src, low, dest, destLow, length);

return ;

}

for ( int i = destLow, p = low, q = mid; i < destHigh; i++) {

if (q >= high || p < mid && ((Comparable)src[p]).compareTo(src[q])<= 0 )

dest[i] = src[p++];

else

dest[i] = src[q++];

}

/**

* Swaps x[a] with x[b].

*/

private static void swap(Object[] x, int a, int b) {

Object t = x[a];

x[a] = x[b];

x[b] = t;

}

仔细阅读代码能够发现排序是分段递归回调的方式来排序（注意中间的low和high两个参数的变化），每次若是分段的大小大于INSERTIONSORT_THRESHOLD（定义为7）的时候，则再分段，前一段和后一段，而后分开的两段再调用递推，递推后再回归排序，若发现中间分隔的位置两个数据是有序，则认为两段是彻底有序的，若不是，那么再将两段作一次排序，此时排序就很好排序了，由于两个块是排序排好的，因此不须要两次循环，只须要循环扫描下去，两个数组按照顺序向下走，分别对比出最小值写入数组，较大者暂时不写入数组与另外一个数组的下一个值进行对比，最后一截数据（源码中是经过越界来断定的）写入到尾巴当中：

for ( int i = destLow, p = low, q = mid; i < destHigh; i++)

{

if (q >= high || p < mid && ((Comparable)src[p]).compareTo(src[q])<= 0 )

dest[i] = src[p++];

else

dest[i] = src[q++];

}

这段对两个有序数组的排序是很经典的写法，主要是if语句的浓缩，否则代码会写得很长。

注意：这里的代码排序中使用了强制类型转换为Comparable来调用内部的comareTo方法，因此若是你的类没有implements Comparable那么在Collections.sort(List<T>list)时编译时会报错上面已经说到，在调用Arrays.sort(Object []t)时，编译时并不会报错，可是运行时会报错为：java.lang.ClassCastExceptionXXXDO cannot be cast to java.lang.Comparable

排序部分咱们再看看其重载的mergeSort方法，就是传入了自定义的Comparator的方法

源码片断6： mergeSort(Object[]src,Object[]dst,int low,int high,intoff,Comparator c)

private static void mergeSort(Object[] src,

Object[] dest,

int low, int high, int off,

Comparator c) {

int length = high - low;

if (length < INSERTIONSORT_THRESHOLD) {

for ( int i=low; i<high; i++)

for ( int j=i; j>low && c.compare(dest[j- 1 ], dest[j])> 0 ; j--)

swap(dest, j, j- 1 );

return ;

}

int destLow = low;

int destHigh = high;

low += off;

high += off;

int mid = (low + high) >>> 1 ;

mergeSort(dest, src, low, mid, -off, c);

mergeSort(dest, src, mid, high, -off, c);

if (c.compare(src[mid- 1 ], src[mid]) <= 0 ) {

System.arraycopy(src, low, dest, destLow, length);

return ;

}

for ( int i = destLow, p = low, q = mid; i < destHigh; i++) {

if (q >= high || p < mid && c.compare(src[p], src[q]) <= 0 )

dest[i] = src[p++];

else

dest[i] = src[q++];

}

能够发现算法和上一个方法彻底同样，惟一的区别就是排序时使用的compare变成了传入的comparator了，其他的没有任何区别。

大概清楚了，此时发现java提供的排序仍是比较高效的，大多数状况下你不须要本身去写排序算法，最后咱们再看看TreeSet中的在add的时候如何实现排序的，也是分别传入了comparator和没有传入，咱们跟着源码里面，能够看到传入了comparator将这个属性设置给了TreeSet里面定义的一个TreeeMap，而TreeMap中的一个属性设置了这个Comparator：

源码片断7：TreeSet以及TreeMap设置Comparator的构造方法

public TreeSet(Comparator<? super E> comparator) {

this ( new TreeMap<E,Object>(comparator));

}

TreeSet(NavigableMap<E,Object> m) {

this .m = m;

}

public TreeMap(Comparator<? super K> comparator) {

this .comparator = comparator;

}

固然没有传入这个Comparator的时候天然没有设置到TreeMap中了，那么咱们来看看TreeMap的add方法：

源码片断8：TreeSet#add(E e)

public boolean add(E e) {

return m.put(e,PRESENT)== null ;

}

这个m是什么呢？其实经过源码片断7就能够看出，m是开始实例化的一个TreeMap，那么咱们就须要看TreeMap的put方法

代码片断9：TreeMap#put(K key , V value)

public V put(K key, V value) {

Entry<K,V> t = root;

if (t == null ) {

root = new Entry<K,V>(key, value, null );

size = 1 ;

modCount++;

return null ;

}

int cmp;

Entry<K,V> parent;

// split comparator and comparable paths

Comparator<? super K> cpr = comparator;

if (cpr != null ) {

do {

parent = t;

cmp = cpr.compare(key, t.key);

if (cmp < 0 )

t = t.left;

else if (cmp > 0 )

t = t.right;

else

return t.setValue(value);

} while (t != null );

}

else {

if (key == null )

throw new NullPointerException();

Comparable<? super K> k = (Comparable<? super K>) key;

do {

parent = t;

cmp = k.compareTo(t.key);

if (cmp < 0 )

t = t.left;

else if (cmp > 0 )

t = t.right;

else

return t.setValue(value);

} while (t != null );

}

Entry<K,V> e = new Entry<K,V>(key, value, parent);

if (cmp < 0 )

parent.left = e;

else

parent.right = e;

fixAfterInsertion(e);

size++;

modCount++;

return null ;

}

这里断定了是否存在Comparator进行不一样方式来写入不一样的位置，并无重载方法，因此实现上也不必定有什么绝对非要如何作，只须要保证代码可读性很好就好，一切为它服务，不然那些过多的设计是属于过分设计，固然并非说代码设计不重要，可是这些须要适可而止；另外TreeSet里面对于其余的方法也会作排序处理，咱们这里仅仅是用add方法来作一个例子而已。

相信你对java的排序有了一些了解，也许本文说了一堆废话，由于本文不是在说排序算法，咱们只是告诉你java是如何排序的，你在大部分状况下无需本身写排序算法来完成排序致使一些没必要要的bug，并且效率未必有java自己提供的排序算法高效。

问啊-定制化IT教育平台，牛人一对一服务，有问必答，开发编程社交头条官方网站：www.wenaaa.com

QQ群290551701 汇集不少互联网精英，技术总监，架构师，项目经理！开源技术研究，欢迎业内人士，大牛及新手有志于从事IT行业人员进入！